acf domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/planetac/desa.planetachatbot.com/wp-includes/functions.php on line 6170all-in-one-seo-pack domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/planetac/desa.planetachatbot.com/wp-includes/functions.php on line 6170wp-user-avatar domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /home/planetac/desa.planetachatbot.com/wp-includes/functions.php on line 6170The post El motor de clonación de voz de OpenAI: ¿Un triunfo tecnológico o una tragedia moral? first appeared on Planeta Chatbot.
]]>Más concretamente…
«un modelo llamado Voice Engine, que utiliza la entrada de texto y una única muestra de audio de 15 segundos para generar un audio de sonido natural que se asemeja mucho al speaker original».
Nos aseguran que…
«Estamos adoptando un enfoque cauteloso e informado para una liberación más amplia debido al potencial de mal uso de la voz sintética. Esperamos iniciar un diálogo sobre el despliegue responsable de las voces sintéticas y sobre cómo la sociedad puede adaptarse a estas nuevas capacidades.»
Y nos advierten de que tomarán la decisión unilateralmente…
«Basándonos en estas conversaciones y en los resultados de estas pruebas a pequeña escala, tomaremos una decisión más informada sobre si desplegar esta tecnología a escala y cómo hacerlo.»
En este artículo vamos a explorar por qué todos deberíamos estar preocupados.
En su comunicado, OpenAI nos cuenta todas las grandes aplicaciones de esta nueva funcionalidad:
Ten en cuenta que para todos estos casos de uso ya existen alternativas que no tienen los inconvenientes de recrear un clon de voz.
También nos enteramos de que otras organizaciones llevan tiempo probando con éxito esta capacidad. En el blog se da por sentado que debemos confiar implícitamente en el juicio de OpenAI, ya que no hay pruebas que detallen cómo se realizaron esas pruebas, qué problemas se descubrieron y qué medidas de mitigación se adoptaron como consecuencia.

Pero la información más importante está al final del artículo. En él, OpenAI nos advierte de lo que debemos dejar de hacer o empezar a hacer a causa de su «motor de voz»:
En resumen, OpenAI ha decidido desarrollar una tecnología y planea desplegarla, por lo que esperan que el resto del mundo se adapte a ella.
Para los que hemos estado siguiendo a OpenAI, el post que anuncia el desarrollo y uso activo de Voice Engine no es un error, sino una característica.
Las grandes tecnológicas tienen la tradición de establecer sus propias reglas, negar la rendición de cuentas e incluso negarse a cooperar con los gobiernos. A menudo, su defensa ha sido que la sociedad o bien no entiende el «panorama general», o bien no merece una explicación, o bien está ahogando la innovación al promulgar las leyes.
Algunos ejemplos
OpenAI está cortada por el mismo patrón. Al parecer, creen que si desarrollan las aplicaciones, tienen derecho a establecer los parámetros sobre cómo utilizarlas -o no- e incluso a cambiar de opinión según les convenga.
Tomemos su postura en tres cuestiones primordiales que nos muestran la brecha entre sus acciones y sus valores.
A pesar de su nombre -OpenAI- y de haber sido creada inicialmente como una organización sin ánimo de lucro, ha sido famosa por sus inconsistentes prácticas de código abierto. Aun así, cada lanzamiento ha parecido ser una oportunidad para darnos lecciones sobre por qué la sociedad está mucho mejor si dejamos que sean ellos quienes decidan cómo controlar sus aplicaciones.
Por ejemplo, Ilya Sutskever, científico jefe y cofundador de OpenAI, dijo sobre el lanzamiento de GPT-4 –que no es un modelo de IA abierto- hace un año.
«Estos modelos son muy potentes y cada vez lo son más. En algún momento será bastante fácil, si uno quisiera, causar mucho daño con esos modelos. Y a medida que las capacidades aumentan tiene sentido que no se quiera divulgarlas».
«Si crees, como nosotros, que en algún momento la IA – AGI – va a ser extremadamente, increíblemente potente, entonces simplemente no tiene sentido abrir el código fuente. Es una mala idea… Espero que dentro de unos años sea completamente obvio para todos que la IA de código abierto no es una opción».
Sin embargo, los reacios proveedores de contenidos para sus modelos -artistas, escritores, periodistas- no tienen los mismos derechos para decidir sobre el uso del material que crearon. Por ejemplo, recordemos cómo Sam Altman se encogió de hombros ante las denuncias de los periódicos de que OpenAI utilizaba su material protegido por derechos de autor para entrenar a ChatGPT.
El lanzamiento de Voice Engine sigue la misma línea que la decisión unilateral de poner Sora, su modelo de conversión de texto a vídeo, a disposición de los «equipos rojos» y de «una serie de artistas visuales, diseñadores y cineastas».
La entrada del blog también nos da una visión de alto nivel de las medidas de seguridad que se pondrán en marcha:
«Por ejemplo, una vez en un producto de OpenAI, nuestro clasificador de texto comprobará y rechazará las entradas de texto que infrinjan nuestras políticas de uso, como las que soliciten violencia extrema, contenido sexual, imágenes que inciten al odio, imágenes de famosos o la propiedad intelectual de terceros.
También hemos desarrollado potentes clasificadores de imágenes que se utilizan para revisar los fotogramas de cada vídeo generado para ayudar a garantizar que se adhiere a nuestras políticas de uso, antes de que se muestre al usuario».
Recordemos que OpenAI utilizó trabajadores kenianos por menos de 2 dólares la hora para conseguir que ChatGPT fuera menos tóxico. ¿Quién hará que Sora sea menos tóxico esta vez?
Además, ¿quién decidirá dónde está la línea entre la violencia «leve» -aparentemente permitida- y la violencia «extrema»?
Por mucho que afirmen que su «principal deber fiduciario es para con la humanidad«, resulta sorprendente su indiferencia por el impacto medioambiental de sus modelos.
Sam Altman ha estado hablando activamente con inversores, incluido el gobierno de los Emiratos Árabes Unidos, para recaudar fondos para una iniciativa tecnológica que impulsaría la capacidad de fabricación de chips del mundo, ampliaría su capacidad para impulsar la IA y costaría varios billones de dólares.
Una portavoz de OpenAI dijo:
«OpenAI ha mantenido debates productivos sobre el aumento de la infraestructura global y las cadenas de suministro de chips, energía y centros de datos, que son cruciales para la IA y otras industrias que dependen de ellos.»
Pero nada es gratis en el universo. Un estudio realizado por la Dra. Sasha Luccioni, investigadora y responsable de clima en Hugging Face, demostró que el entrenamiento del LLM BLOOM, de 176.000 millones de parámetros, emite al menos 25 toneladas métricas de equivalentes de carbono.
En el artículo, los autores también estimaban que el entrenamiento de GPT-3 -un modelo de 175.000 millones de parámetros- emitía unas 500 toneladas métricas de carbono, lo que equivale aproximadamente a más de un millón de kilómetros recorridos por un coche de gasolina medio. ¿Por qué tanta diferencia? Porque, a diferencia de BLOOM, GPT-3 se entrenó utilizando fuentes de energía intensivas en carbono como el carbón y el gas natural.
Y la cosa no queda ahí. El Dr. Luccion realizó otros estudios sobre las emisiones asociadas a 10 tareas populares de IA Generativa:
Además, descubrieron que las emisiones cotidianas asociadas al uso de la IA superaban con creces las emisiones derivadas del entrenamiento de grandes modelos.
Y no se trata sólo de emisiones. Los centros de datos donde se entrenan y ejecutan esos modelos necesitan agua como refrigerante y, en algunos casos, como fuente de electricidad.
El profesor Shaolei Ren, de la Universidad de California en Riverside, descubrió que el entrenamiento del GPT-3 en los centros de datos de gama alta de Microsoft puede evaporar directamente 700.000 litros (unos 185.000 galones) de agua dulce. En cuanto al uso, Ren y sus colegas calcularon que GPT-3 requiere unos 500 ml de agua por cada 10-50 respuestas.
Es hora de que nuestros políticos afronten el reto de administrar la IA en beneficio de las personas y el planeta. Tengo cuatro preguntas para que se pongan en marcha:
¿Te parece bien que OpenAI decida sobre el uso de la IA Generativa en beneficio de la humanidad?
The post El motor de clonación de voz de OpenAI: ¿Un triunfo tecnológico o una tragedia moral? first appeared on Planeta Chatbot.
]]>