2024-03-31 03:32:57
Es ampliamente aceptado que la generación de habla que imita las voces humanas conlleva serios riesgos, especialmente en contextos como el año electoral. Se está colaborando con una amplia gama de socios, tanto nacionales como internacionales, para abordar estas preocupaciones de manera efectiva. Entre estos socios se encuentran representantes del gobierno, medios de comunicación, entretenimiento, educación, sociedad civil y otros sectores relevantes.
Reconociendo los Riesgos de la Tecnología de Voz Sintética
Los socios actualmente involucrados en la prueba del Voice Engine han aceptado las políticas de uso establecidas. Estas políticas están diseñadas para prevenir la suplantación de identidad, exigiendo el consentimiento explícito y legalmente válido de cualquier persona u organización cuya voz se pretenda replicar. Además, se requiere que los socios informen claramente a su audiencia cuando están utilizando voces generadas por inteligencia artificial.
Para garantizar la integridad y seguridad del sistema, se han implementado diversas medidas. Entre estas se incluyen marcas de agua que permiten rastrear el origen de cualquier audio generado por el Voice Engine. Además, se lleva a cabo un monitoreo proactivo para supervisar cómo se utiliza la tecnología y prevenir su uso indebido.
El desarrollo inicial del Voice Engine tuvo lugar a finales de 2022, y desde entonces ha sido utilizado para alimentar las voces predefinidas disponibles en la API de texto a voz, así como en ChatGPT Voice y Read Aloud. Sin embargo, se está adoptando un enfoque cauteloso e informado para un lanzamiento más amplio debido al potencial de mal uso de la voz sintética.
Las aplicaciones tempranas del Voice Engine están ayudando a informar el enfoque de OpenAI, así como las salvaguardias y la consideración sobre cómo esta tecnología podría ser utilizada de manera positiva en diversas industrias. Ejemplos tempranos incluyen:
- Proporcionar asistencia de lectura a no lectores y niños a través de voces emotivas que representan un rango más amplio de hablantes que las voces predefinidas.
- Traducir contenido, como videos y podcasts, para que los creadores y las empresas puedan llegar a más personas en todo el mundo, de manera fluida y con sus propias voces.
- Alcanzar comunidades globales, mejorando la entrega de servicios esenciales en entornos remotos.
- Apoyar a personas no verbales, como aplicaciones terapéuticas para personas con condiciones que afectan el habla y mejoras educativas para aquellos con necesidades de aprendizaje.
Experiencias de Autenticación y Prevención de Abusos
Se considera fundamental que cualquier implementación generalizada de tecnología de voz sintética vaya acompañada de mecanismos de autenticación de voz. Estos mecanismos deben verificar que el hablante original esté conscientemente contribuyendo con su voz al servicio. Además, es crucial contar con una lista exhaustiva de voces prohibidas para detectar y prevenir la creación de voces que sean excesivamente similares a figuras públicas prominentes.
En resumen, se está comprometido a trabajar en estrecha colaboración con los socios para garantizar que la tecnología de voz sintética se utilice de manera ética y responsable, protegiendo al mismo tiempo la integridad y la autenticidad de las voces humanas.