La inteligencia artificial promete convertirse en una de las tendencias tecnológicas de más relumbrón en 2023. Microsoft lo sabe y por eso está invirtiendo a manos llenas en esta tecnología. Más allá de invertir 10.000 millones de dólares en OpenAI para integrar el chatbot ChatGTP en sus productos, el gigante del software acaba de presentar en sociedad un nuevo modelo de lenguaje: VALL-E.
Enfocado a la síntesis de voz a texto (TTS, «text to speech» en inglés), VALL-E se ufana de imitar cualquier voz humana casi a la perfección escuchando durante apenas tres segundos la voz que trata de remedar.
«Específicamente entrenamos un modelo de lenguaje de códec neuronal utilizando códigos discretos derivados de un modelo de códec de audio neuronal listo para usar, y consideramos TTS como una tarea de modelado de lenguaje condicional en lugar de una regresión de señal continua como en el trabajo anterior», explica Microsoft.
Para leer la nota completa visita el siguiente enlace https://www.marketingdirecto.com/digital-general/digital/vall-e-inteligencia-artificial-microsoft-capaz-imitar-voz
0 Comentarios