Actualidad | Noticias | 07 NOV 2005

Nuevos avances en la tecnología de reconocimiento de voz

El reconocimeinto de voz en tiempo real ha sido considerada hasta hace poco como prácticamente inviable. Usos simples de la misma han comenzado a ser empleados en portales de voz; pero requiere gran capacidad de procesamiento, y esto supone un elevado coste. No obstante, estan surgiendo algunos avances destinados a hacer realidad el reconocimiento de voz en tiempo real.
Mariana Fernández

Los programas de reconocimiento de voz demandan cada vez mayor capacidad de procesamiento del que habitualmente son capaces de proporcionar los actuales sistemas de procesamiento de señal digital.
No obstante varios fabricantes están realizando progresos en este campo. Así, la moderna plataforma de reconocimiento de voz de Nortel integra tecnologías dentro de una amplia gama de plataformas MPS (Media Processing Servers). Los sistemas MPS cuando son configurados junto a servidores adicionales de habla, producen una disminución en el tiempo de respuesta del reconocimiento de voz.

Pero la gran inversión que implica esta moderna tecnología no supone el único problema. Las mayores trabas que se encuentran residen en las dificultades de los programas de voz para reconocer sonidos específicos relacionados con ciertas palabras. Además los programas no distinguen entre las distintas entonaciones que se le pueden dar a una frase. Así mismo existen numerosos problemas con lo que se ha venido a denominar “ruido de fondo”.

Para paliar los problemas relacionados con el ruido de fondo, la firma ScanSoft ha lanzado la solución Open Speech Recognizer (OSR), una solución de reconocimiento de voz para aplicaciones de telefonía. La principal característica de dicha aplicación radica en su capacidad para entender un amplio rango de palabras y frases sin requerir el adiestramiento del software en amplios conjuntos de reglas gramaticales complejas.

Investigadores de la Universidad de Sheffield parecen haber dado con la solución al problema a través de la relación señal-ruido, extrayendo el valor de ruido estacionario para eliminar este y crear una señal limpia.


Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios