Si triunfan es porque nos gusta hablar 

El auge de las tecnologías del lenguaje

21/10/2024 - 

VALÈNCIA. Están transformando la forma en que interactuamos con los dispositivos y entre nosotros mismos. Las tecnologías del habla están creciendo en gran medida gracias a los avances de la inteligencia artificial (IA) y a la demanda de interfaces más naturales. Se le atribuyen, además, ventajas que no aportaban otras tecnologías como la accesibilidad para personas con discapacidades visuales o motoras o la versatilidad para integrarse en otros desarrollos tecnológicos como podrían ser el Internet de las Cosas (IoT) o el machine learning.

Pero si las tecnologías del lenguaje encuentran una buena acogida en el mercado es por la sencilla razón de que nos gusta hablar. Al contrario que la escritura, la forma natural que tenemos de comunicarnos es a través del habla. Baste como ejemplo el día que Whatsapp incorporó el micrófono en las opciones del menú para, como dice Blanca Romero, “abrir un melón”.

Blanca Romero es directora en Natural Speech, antes denominada Natural Vox y hoy integrada dentro del grupo tecnológico Cestel. Fundada en 1991 en Vitoria-Gasteiz, Natural Speech fue pionera en nuestro país en el desarrollo de un sistema de síntesis de voz con voz propia y no robótica llegando a implementar en 1992 el primer sistema telefónico de cita previa para la declaración de la renta en Álava. Hoy cuentan ya con clientes en distintas verticales como son la Administración Pública, servicios para la Dirección General de Tráfico, servicios de emergencia y el mundo asistencial, donde diseñan asistentes conversacionales para atender a personas mayores o con enfermedades crónicas que no pueden salir de casa tanto en acompañamiento sanitario como social.

Poco tiene que ver el panorama que hallaron en Natural Speech en sus comienzos con el actual, con una competencia disparada en los servicios de voz gracias a una tecnología como la inteligencia artificial aplicada al lenguaje que facilita y abarata mucho este tipo de desarrollos.

El 'boom' de los asistentes virtuales

Con motivos asistenciales constituyeron María González Manso y Marcos Rubio Rubio en 2018 Tucuvi, catalogada hoy como compañía de tecnología médica líder en inteligencia artificial conversacional con oficinas en Madrid y Nueva York. Suyo es el asistente virtual clínico denominado Lola que concibieron para acompañar a las personas mayores y hacer un seguimiento diario a través de una sencilla llamada telefónica. Otro proyecto de esta startup es Tucuvi Health Manager, una plataforma para los sanitarios de automatización de consultas telefónicas. Su tecnología ya está presente en numerosos hospitales.

Una hermana que le salió a Lola en Japón, aunque habla español, es Celia, otro asistente virtual inteligente conversacional cuyo desarrollo corresponde a la tecnológica Huawei. También éste desempeña funciones de acompañamiento, entretenimiento y monitorización de diferentes aspectos de salud de las personas mayores.

La reclutadora virtual

Fuera ya del área sanitaria, en Viterbit han creado un software de atracción, gestión y selección de personal. Ofrece soluciones integrales para desarrollar procesos de reclutamiento y selección personalizados, eficientes y centrados en garantizar una buena experiencia tanto a los candidatos como a los equipos de selección. Entre sus herramientas se encuentra MIA Recruiter, lanzada el pasado mes de julio, la primera reclutadora virtual que funciona con inteligencia artificial capaz de responder en 20 idiomas y con más de 100 funcionalidades disponibles. 

Constituida en 2021 por tres amigos, Dimitri, Ariel y Marcos, Viterbit aglutina ya un equipo de 33 personas, cuenta con oficinas en España y México y superó el millón de euros facturados en 2023 con previsión de alcanzar una facturación de 2’5 millones de euros al cierre del año actual. Entre sus clientes figuran nombres como el Grupo Sibuya, Grupo Vass o Scalpers, entre otros. 

Otra que va como un tiro es la que lleva Happy Scribe. Fundada en Barcelona en 2017 por Marc Assens y André Bastié, la startup se ha posicionado como una de las principales startups internacionales en el campo de la tecnología de voz a texto. Su plataforma de transcripción de audio utiliza inteligencia artificial y algoritmos de aprendizaje automático para automatizar la transcripción, los subtítulos y la traducción en más de 80 idiomas y dialectos. Con una precisión de entre el 85% y el 99%, Happy Scribe ha transcrito más de cientos de millones de minutos de audio y cuenta con más de millones de usuarios en todo el mundo. En junio de 2023 facturaban ya 5 millones anuales con un equipo de 20 personas. Entre las últimas novedades está la entrada en el mundo de la radiodifusión y la transcripción automática en lenguas romances.  


Con el tiempo, Happy Scrib se ha configurado como una plataforma de lenguaje audiovisual que permite a las marcas de medios, proveedores de servicios lingüísticos tradicionales y corporativos en todo el mundo escalar sus necesidades de lenguaje audiovisual con facilidad. Combinando expertos en lenguaje con IA de última generación, Happy Scribe ayuda a los equipos a gestionar colaboradores de manera segura, optimizar la colaboración y producir transcripciones, subtítulos y subtítulos ocultos de calidad con rapidez.

Identidad digital

También la voz se ha revelado como un elemento más que interesante como huella biométrica para la identificación en entornos digitales. Aquí han encontrado su oportunidad empresas como Biometric Vox, un sistema de reconocimiento de voz basado en IA además de incluir una solución de transcripción de voz a texto y otra de firma vocal la primera que, según ellos, se creó en el mundo.