Estas son las gafas que rastrean los movimientos faciales para comunicarse en silencio

Vea También

EchoSpeech requiere solo unos minutos de datos de capacitación del usuario antes de que reconozca los comandos y pueda ejecutarse en un teléfono inteligente. Crédito de la imagen: Universidad de Cornell
EchoSpeech requiere solo unos minutos de datos de capacitación del usuario antes de que reconozca los comandos y pueda ejecutarse en un teléfono inteligente. Crédito de la imagen: Universidad de Cornell

EchoSpeech, desarrollado por investigadores de la Universidad de Cornell, utiliza altavoces y micrófonos montados en un marco de cristal y emite ondas sonoras inaudibles hacia la piel. Mediante el análisis de los ecos de múltiples trayectorias, EchoSpeech capta las sutiles deformaciones de la piel causadas por las expresiones silenciosas y las utiliza para inferir el habla muda.

En su forma actual, EchoSpeech podría utilizarse para comunicarse con otras personas a través del teléfono inteligente en lugares donde el habla es inconveniente o inapropiada, como un restaurante ruidoso o una biblioteca silenciosa.

La interfaz de voz silenciosa también puede emparejarse con un lápiz óptico y utilizarse con programas de diseño como CAD, lo que prácticamente elimina la necesidad de teclado y ratón.

Equipadas con un par de micrófonos y altavoces más pequeños que una goma de borrar, las gafas EchoSpeech se convierten en un sistema de sonar portátil con inteligencia artificial que envía y recibe ondas sonoras a través de la cara y detecta los movimientos de la boca.

A continuación, un algoritmo de aprendizaje profundo analiza estos perfiles de eco en tiempo real, con una precisión aproximada del 95%.


"Estamos trasladando el sonar al cuerpo", afirma el Dr. Cheng Zhang, también de la Universidad de Cornell.

"Estamos muy entusiasmados con este sistema, porque realmente empuja el campo hacia adelante en el rendimiento y la privacidad".

"Es pequeño, de bajo consumo y sensible a la privacidad, todas ellas características importantes para desplegar nuevas tecnologías vestibles en el mundo real".

"La mayoría de las tecnologías de reconocimiento de voz silenciosa se limitan a un conjunto selecto de órdenes predeterminadas y requieren que el usuario mire a la cámara o la lleve puesta, lo cual no es práctico ni factible."

"También hay grandes problemas de privacidad relacionados con las cámaras portátiles, tanto para el usuario como para aquellos con los que interactúa".

La tecnología de detección acústica como EchoSpeech elimina la necesidad de cámaras de vídeo portátiles.

"Y como los datos de audio son mucho más pequeños que los de imagen o vídeo, su procesamiento requiere menos ancho de banda y pueden transmitirse a un smartphone por Bluetooth en tiempo real", explica François Guimbretière, profesor de la Universidad de Cornell.

"Y como los datos se procesan localmente en tu smartphone en vez de subirse a la nube, la información sensible desde el punto de vista de la privacidad nunca sale de tu control".

Fuentes, créditos y referencias:

Universidad de Cornell - Ruidong Zhang et al. 2023. EchoSpeech: Continuous Silent Speech Recognition on Minimally-obtrusive Eyewear Powered by Acoustic Sensing. In Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems (CHI ’23); doi: 10.1145/3544548.3580801

Créditos a SciNews

Artículo Anterior Artículo Siguiente

Anuncio publicitario

Reciba actualizaciones por Telegram