Vea También
EchoSpeech, desarrollado por investigadores de la Universidad de
Cornell, utiliza altavoces y micrófonos montados en un marco de cristal y
emite ondas sonoras inaudibles hacia la piel. Mediante el análisis de los ecos
de múltiples trayectorias, EchoSpeech capta las sutiles deformaciones de la
piel causadas por las expresiones silenciosas y las utiliza para inferir el
habla muda.
En su forma actual, EchoSpeech podría utilizarse para comunicarse con otras
personas a través del teléfono inteligente en lugares donde el habla es
inconveniente o inapropiada, como un restaurante ruidoso o una biblioteca
silenciosa.
La interfaz de voz silenciosa también puede emparejarse con un lápiz óptico y
utilizarse con programas de diseño como CAD, lo que prácticamente elimina la
necesidad de teclado y ratón.
Equipadas con un par de micrófonos y altavoces más pequeños que una goma de
borrar, las gafas EchoSpeech se convierten en un sistema de sonar portátil con
inteligencia artificial que envía y recibe ondas sonoras a través de la cara y
detecta los movimientos de la boca.
A continuación, un algoritmo de aprendizaje profundo analiza estos perfiles de
eco en tiempo real, con una precisión aproximada del 95%.
"Estamos trasladando el sonar al cuerpo", afirma el Dr. Cheng Zhang, también
de la Universidad de Cornell.
"Estamos muy entusiasmados con este sistema, porque realmente empuja el campo
hacia adelante en el rendimiento y la privacidad".
"Es pequeño, de bajo consumo y sensible a la privacidad, todas ellas
características importantes para desplegar nuevas tecnologías vestibles en el
mundo real".
"La mayoría de las tecnologías de reconocimiento de voz silenciosa se limitan
a un conjunto selecto de órdenes predeterminadas y requieren que el usuario
mire a la cámara o la lleve puesta, lo cual no es práctico ni factible."
"También hay grandes problemas de privacidad relacionados con las cámaras
portátiles, tanto para el usuario como para aquellos con los que interactúa".
La tecnología de detección acústica como EchoSpeech elimina la necesidad de
cámaras de vídeo portátiles.
"Y como los datos de audio son mucho más pequeños que los de imagen o vídeo,
su procesamiento requiere menos ancho de banda y pueden transmitirse a un
smartphone por Bluetooth en tiempo real", explica François Guimbretière,
profesor de la Universidad de Cornell.
"Y como los datos se procesan localmente en tu smartphone en vez de subirse a
la nube, la información sensible desde el punto de vista de la privacidad
nunca sale de tu control".
Fuentes, créditos y referencias:
Créditos a
SciNews