Voces clonadas: La tecnología prohibida de OpenAI que no verás

Por
6 min de lectura

OpenAI Desarrolla Clonación de Voz, pero Retrasa su Lanzamiento Público por Razones de Seguridad

Nueva York (Evox News) – OpenAI, la compañía líder en inteligencia artificial (IA), anunció este lunes que su modelo Voice Engine tiene la capacidad de clonar voces humanas con un sonido natural, «emotivo y realista», a partir de una muestra de tan solo 15 segundos. Sin embargo, la empresa ha decidido no lanzar esta tecnología al público en general por el momento, debido a los riesgos potenciales que implica.

«Somos conscientes de que la generación de un discurso que imita las voces de las personas conlleva riesgos significativos, los cuales son especialmente relevantes en un año electoral», señaló el creador de ChatGPT en un comunicado de prensa.

Voice Engine, el nuevo modelo de IA de OpenAI, puede convertir texto a voz para generar voces sintéticas. Según la compañía, esta tecnología tiene el potencial de permitir a los creadores de contenido traducir sus trabajos a otros idiomas manteniendo sus acentos originales, y también podría ayudar a personas con dificultades de comunicación verbal a utilizar su voz en situaciones como llamadas telefónicas.

En uno de los ejemplos proporcionados por la empresa, se puede apreciar cómo la voz de una persona de habla inglesa se traduce al español, mandarín, alemán, francés y japonés, respetando el acento nativo del hablante.

Actualmente, solo un grupo selecto de empresas tiene acceso a esta tecnología, incluyendo la empresa de tecnología educativa Age of Learning, la plataforma de narración visual HeyGen, el fabricante de software de salud Dimagi, el creador de aplicaciones de comunicación de inteligencia artificial Livox y el sistema de salud Lifespan.

OpenAI Prioriza la Prudencia

«Estamos adoptando un enfoque prudente e informado para un lanzamiento más amplio, debido al potencial de uso indebido de la voz sintética», indicó la empresa en el comunicado. Además, señaló que las compañías que actualmente trabajan con esta tecnología han aceptado sus políticas de uso.

Estas políticas incluyen la prohibición de utilizar la voz de una persona sin su consentimiento explícito y la obligación de informar a los usuarios que están interactuando con voces sintéticas.

«Hemos implementado un conjunto de medidas de seguridad, que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como una supervisión proactiva de su uso», añadió OpenAI.

En el contexto de las elecciones en Estados Unidos este año, ya se han registrado incidentes de llamadas automatizadas con voces clonadas de figuras políticas, como el presidente Joe Biden.

Otro riesgo importante asociado a las voces sintéticas generadas por IA es su potencial uso por parte de estafadores para acceder a cuentas bancarias que utilizan la autenticación de voz como medida de seguridad.

Insights de Evox News: Cómo la Clonación de Voz de OpenAI Puede Impactar tu Negocio

La tecnología de clonación de voz de OpenAI, aunque aún no está disponible públicamente, presenta tanto oportunidades como desafíos significativos para las empresas:

Ventaja Competitiva a través de la Personalización: Las empresas podrían utilizar esta tecnología para personalizar la experiencia del cliente a un nivel sin precedentes. Imagina asistentes virtuales con la voz de una celebridad o la posibilidad de ofrecer atención al cliente en múltiples idiomas con el acento nativo del cliente. Esto podría generar una mayor conexión y lealtad del cliente.

Innovación en Contenido y Comunicación: La capacidad de traducir contenido a diferentes idiomas manteniendo el acento original abre nuevas vías para la creación y distribución de contenido multimedia. Las empresas de medios, entretenimiento y educación podrían expandir su alcance global de manera más efectiva.

Riesgos de Seguridad y Reputación: El potencial uso indebido de esta tecnología para fraudes y suplantación de identidad plantea serias preocupaciones. Las empresas deben estar preparadas para implementar medidas de seguridad robustas y protocolos de verificación para protegerse a sí mismas y a sus clientes. La reputación de una empresa podría verse seriamente dañada si se la asocia con un incidente de este tipo.

Eficiencia Operativa: La automatización de tareas como la generación de locuciones para videos, podcasts o sistemas de respuesta interactiva de voz (IVR) podría generar ahorros significativos de tiempo y costos para las empresas.

* Desafíos Éticos: Las empresas deben ser muy consciente del uso que hacen de esta tecnología, y establecer un uso ético de la misma, ya que puede ser un arma de doble filo.

En resumen, la tecnología de clonación de voz de OpenAI representa un avance tecnológico con un enorme potencial, pero también conlleva riesgos importantes. Las empresas deben evaluar cuidadosamente cómo esta tecnología podría afectar sus operaciones, estrategias y responsabilidades éticas antes de adoptarla o interactuar con ella. La clave estará en encontrar el equilibrio adecuado entre la innovación y la precaución

Compartir este artículo
Exit mobile version