Daniel Esgardo Rangel Barón: Ayudarán a generar voz sintética personalizada a las personas con riesgo de perderla
La Universidad de
Northeastern en Boston (Estados Unidos) abrió un
centro en colaboración con el proyecto “VocaliD” para que las personas que
están en riesgo de perder su voz, temporal o permanentemente,
puedan registrarla en un sistema basado en inteligencia artificial, que les generará
una voz personalizada para que en un futuro puedan seguir
comunicándose con su propia voz, aunque en versión sintetizada.
El nuevo centro denominado “Clínica de Preservación de la Voz”, ofrece a las personas con riesgo de perder la voz de manera temporal o permanente por motivos de salud, un lugar al que acudir para registrar sus voces antes de se queden sin ellas.
El nuevo centro denominado “Clínica de Preservación de la Voz”, ofrece a las personas con riesgo de perder la voz de manera temporal o permanente por motivos de salud, un lugar al que acudir para registrar sus voces antes de se queden sin ellas.
El centro nace en
colaboración y a partir del proyecto VocaliD de la investigadora de la
universidad, Rupal Patel. "A veces vienen a nosotros en el último momento.
No tienen tiempo suficiente para almacenar su voz y están
también tan envueltos en su enfermedad y luego en la operación es muy
estresante", aseguró la institución. Hasta ahora, el sistema solo permitía
que los usuarios grabaran sus voces desde sus casas.
Sin embargo, a partir de ahora, los profesionales del centro orientarán y asistirán a los usuarios a la hora de llevar a cabo todo el proceso "para asegurarnos de que tus grabaciones son de buena calidad y utilizables para la generación de voz sintética", afirmó Patel.
Sin embargo, a partir de ahora, los profesionales del centro orientarán y asistirán a los usuarios a la hora de llevar a cabo todo el proceso "para asegurarnos de que tus grabaciones son de buena calidad y utilizables para la generación de voz sintética", afirmó Patel.
El proceso se basa en un
sistema de inteligencia artificial, en el uso de algoritmos de
aprendizaje automático, que se inicia con la grabación por parte del
usuario de su voz en el portal del “Banco de voces humanas de VocaliD”
('VocaliD Human Voicebank'), a través de la lectura de historias cortas o
cualquier otro tipo de contenido de su interés, según señalan en la página
oficial del centro.
El proceso de grabación
requiere de una duración de "al menos 40 minutos", según la
universidad, "para crear una voz de calidad razonable". De todas
formas, apostillan que "por supuesto cuantos más discursos y mejor calidad
de las grabaciones, mejor la calidad y la naturalidad de la voz digital".
Comentarios
Publicar un comentario