![]()
Síntesis de voz mediante la innovación basada en la nube

Encontrar la voz


Crear el guion


Acceder a grabaciones en la nube
=

Voz artificial de Crystal potenciada por IA
¿Quién es Crystal?
La compañía de inteligencia aumentada iGenius desarrolló Crystal, una asesora virtual de inteligencia de datos que permite que más empresarios tomen decisiones más inteligentes en menos tiempo gracias a la ayuda de la IA. Crystal cambia la experiencia del usuario de datos y analítica; es una herramienta que conecta varias fuentes de datos y que permite que los usuarios hagan preguntas para las que necesitan respuestas en un lenguaje natural y efectivo, como si estuvieran conversando con una compañera de trabajo.
Crystal disminuye el tiempo que los usuarios pasan explorando datos para que puedan tener más tiempo para actuar basándose en la información más relevante. Esto aumenta la autonomía, enriquece y fortalece la forma en que se toman las decisiones en cada nivel de la organización y afecta la eficiencia operativa y el crecimiento de los ingresos. Con el objetivo de desarrollar y ofrecer una voz artificial única y personalizada para Crystal, iGenius recurrió a DataForce, la división de soluciones de datos de IA, y a MediaNEXT, la división de audio y video, ambas de TransPerfect.
Superar los obstáculos usando la innovación
El proyecto comenzó en plena pandemia; los estudios estaban cerrados, los locutores estaban encerrados en casa y la industria de medios paralizada totalmente. iGenius necesitaba grabar la voz de Crystal, pero las opciones eran limitadas. Acudieron a TransPerfect y a nuestra solución de grabación híbrida basada en la nube: StudioNEXT. En esta plataforma, los locutores pudieron realizar las grabaciones desde la comodidad de sus hogares, y se evitaron tener que trasladarse a un estudio, tocar equipos y entrar en contacto con otras personas. Los equipos pudieron crear la voz artificial de Crystal utilizando únicamente esta tecnología interna basada en la nube, y la personalizaron y generaron para que cumpliera con los requisitos específicos del proyecto de iGenius.
Generación de la voz
Necesitamos entrenar un motor de texto a voz con una serie de grabaciones de locutoras para desarrollar la voz de Crystal. Estas grabaciones alimentaron un modelo de IA, el cual básicamente aprendió un modelo probabilístico de un idioma hablado, tratando cada oración como una secuencia de sonidos. Después, creamos un algoritmo para filtrar un corpus estándar desde una lingüística de corpus para generar la voz de Crystal. Se logró una integración perfecta de la voz real y las tecnologías de IA con un software interno y un entorno remoto.
"
Para nuestro equipo, es verdaderamente importante escuchar al cliente y comprender sus requisitos, hacer investigación propia para conocer el espacio en el cual trabaja el cliente y satisfacer y, de ser posible, superar sus expectativas. Realmente fue una gran experiencia poder trabajar tanto con DataForce como con MediaNEXT, y encontrar una solución que satisficiera al cliente en términos generales.
Fred Bane, científico de datos de TransPerfect
"
• • • • Texto y voz se hacen uno • • • •

PASO 1: LA VOZ
En el caso de una asesora virtual, la voz es el rostro de la marca. Si bien Crystal no tenía rasgos físicos, el sonido de su voz debía bastar para crear una sensación específica, una atmósfera y una primera impresión duradera. Recurrimos a las enormes bases de datos de lingüistas y fonetistas de MediaNEXT y DataForce para crear una voz artificial, e iGenius hizo una selección de locutores y estilos diferentes. iGenius pudo identificar a la persona que querían para Crystal entre las diversas opciones, inflexiones y particularidades disponibles.

PASO 2: EL GUION
DataForce trabajó junto a iGenius para identificar el largo total del guion, la cantidad de oraciones, la duración de cada oración hablada y, lo más importante, un equilibrio particular de fonemas en el corpus que coincidiera con la distribución general de los fonemas en inglés.
![]()
PASO 3: LA GRABACIÓN
En un entorno completamente remoto de StudioNEXT, hicimos que la voz de Crystal cobrara vida por medio del trabajo con Jennifer. Jennifer podía iniciar y cerrar sesión con su kit de grabación en la nube sin tener que recordar dónde había quedado; todo se subía a la nube. Dado que nunca había hecho algo como esto antes y para lidiar con una construcción ruidosa en su edificio, Jennifer trasladó sus equipos a un lugar silencioso y completó el proyecto con tranquilidad.
"
El enfoque central del departamento de investigación de iGenius era crear una voz artificial a medida para nuestro producto principal, Crystal. A través de mi contacto de LinkedIn, Sofía Silva, ejecutiva de cuenta de DataForce by TransPerfect, pudimos hacer realidad esta idea. La colaboración con DataForce y MediaNEXT nos dio la confianza necesaria para crear un gran conjunto de datos de frases fonéticamente equilibradas y sus audios de alta calidad correspondientes para poder entrenar un modelo de Inteligencia artificial de alto rendimiento con funciones texto a voz.
Marco Bocchio, PhD, Aprendizaje Automático y Ciencia de Datos, líder de equipo en iGenius
"
El resultado
iGenius estaba en la búsqueda de una voz para mejorar la exploración de datos, la analítica y la experiencia general de sus clientes. Con Crystal, proporcionaron una voz humana artificial a sus clientes con la que pueden interactuar de una manera natural, como si fuera una compañera de trabajo. El trabajo colaborativo de iGenius, DataForce y MediaNEXT hizo realidad la idea de una voz artificial mediante una solución híbrida personalizada.
DataForce cuenta con una comunidad global de más de 1,000 000 de miembros en todo el mundo y lingüistas expertos en más de 250 idiomas. DataForce cuenta con su propia plataforma, pero también puede utilizar herramientas del cliente o de terceros. De esta forma, sus datos están siempre bajo control.