Trabajo de FICH

Diseñan un software que reconoce las señas de las manos

Miércoles 1 de octubre de 2008

Un grupo de estudiantes desarrolló un modelo de identificación automática de gestos manuales a través de una webcam. Es un sistema de bajo costo que puede tener una variedad de usos.

Estudiantes de ingeniería en informática de FICH lograron que una computadora reconozca las señas hechas por una mano frente a una cámara web con una eficiencia superior al 87%.
Se trata de un sistema que utiliza elementos de bajo costo como una webcam de resolución media de las que existen en cualquier hogar y una computadora, prescindiendo de otro tipo de dispositivos más sofisticados. El sistema podría llegar a usarse como control remoto o en otros tipos de interfaces humano-computadora.
“Habíamos visto que existían otros trabajos sobre el tema, pero que tenían muchas restricciones, como la necesidad de que la mano tenga un guante para ser identificada, por ejemplo. Nosotros buscábamos una aplicación adaptada a situaciones cotidianas, darle instrucciones a la computadora en un ambiente natural, con luz común, evitando las condiciones de laboratorio o cámaras de alta resolución”, afirmó Juan Pablo Hernández Vogt, uno de los autores del modelo. Junto a él trabajaron Pablo Novara y Javier Godoy; todos estudiantes de FICH.
En sí, se trata de un desarrollo sencillo, reconocieron los futuros profesionales, pero su importancia radica en las potenciales aplicaciones que se le podría dar. Con algunas modificaciones se podría llegar a realizar un software de reconocimiento de lenguaje de señas para sordos o bien controlar toda una presentación audiovisual a distancia, prescindiendo del teclado y el mouse.
El trabajo ganó el primer premio del Concurso de Trabajos Estudiantiles (EST 2008) realizado en el marco de las de las 37ª Jornadas Argentinas de Informática (JAIIO) y la 34ª Conferencia Latinoamericana de Informática (CLEI) organizadas por la UNL, la UTN y la Sociedad Argentina de Informática.

¿Cómo funciona?
El proceso consta de varias etapas que comienza con la adquisición o captura de la imagen. El paso siguiente es lograr “recortar” la mano del fondo y otros elementos, como el brazo. Una vez extraída la silueta, el modelo la compara con un conjunto de patrones correspondientes a cada seña a reconocer. Esto implica que el usuario debería entrenar al sistema para que aprenda las características de cada una de ellas.
Los gestos reconocidos pueden ser empleados como entrada en el control de equipamiento o ser traducidos a otra forma de información. Esto es posible porque el proceso ocurre en tiempo real.

El trabajo
El principal problema que los estudiantes debieron sortear fue las deficientes características de las imágenes producto de la poca resolución de la webcam. Para ello diferenciaron el “ruido” proveniente de los problemas técnicos y se ocuparon de la silueta de la mano en sí.
“Comenzamos logrando que la computadora interpretara tres señas, para luego reconocer 14. Esa cantidad nos pareció suficiente, aunque podríamos haber inventado muchas más”, destacó Godoy.
Para los ensayos del sistema se conformó una base de 126 imágenes (realizaciones de 14 señas distintas) con una cámara web estándar, bajo condiciones de iluminación natural. “Al capturar las imágenes buscamos que la persona realizara las señas con la mayor naturalidad posible, es decir, sin condicionamientos”, explicaron los estudiantes.
El porcentaje de reconocimiento logrado fue en promedio del 87.00%, y del 100% en el mejor caso. El método propuesto logra, además, una aproximación a la aplicación del sistema en tiempo real suficientemente aceptable como para ser considerada un buen punto de partida para trabajos futuros.

 

Agenda