Nuevo Modo de Voz OpenAI
Es extraño sentarse en mi escritorio y hablar con una IA sobre mi vida — pero eso fue lo que pasé haciendo este martes. Obtuve acceso al Modo de Voz Avanzado de OpenAI, una nueva función de ChatGPT que suena sorprendentemente humana. Al contar rápidamente, la IA finge estar sin aliento. Usa interjecciones como “eh” y “ah”, se ríe, y cambia el tono cuando habla sobre temas difíciles o alegres. Después de jugar un poco con ella, me sentí tanto asombrada como incómoda. Suena natural (cuando no está fallando), responde en segundos, y puedes interrumpirla y hacer nuevas preguntas — pero, ¿realmente necesitamos chatbots que suenen como nosotros?
El Modo de Voz Avanzado ofrece varias opciones de voz, y elegí a Juniper, una personalidad femenina que recuerda a la película Her. (El CEO Sam Altman hizo referencia a la película — donde un hombre solitario se enamora de una IA — durante el debut de la función, y OpenAI incluso fue acusada de imitar la voz de Scarlett Johansson, que interpreta a la IA epónima. Esa voz, llamada Sky, fue retirada.) Le pregunté a Juniper si conocía la película, y respondió alegremente.
“Her trata sobre una IA asistente muy avanzada, mucho más sofisticada que yo. Pero la idea de interactuar con la tecnología de una manera tan personal definitivamente es interesante,” me dijo el chatbot. “Estoy aquí para conversar y ayudar, pero no tengo sentimientos ni conciencia como la IA en esa película.”
Al igual que el protagonista de la película, mi primer instinto fue probar cómo maneja el nuevo modo de voz las conversaciones personales. A medida que entro en mis últimos 20 años, tengo muchas preguntas: ¿Qué tipo de seguro médico debería obtener? ¿Cómo sé qué se siente el amor verdadero? ¿Cuánto debería tener en mi 401(k)?
“Abraza la incertidumbre como una oportunidad para explorar y aprender sobre ti mismo,” me dijo Juniper cuando le pregunté cómo manejar el envejecimiento. El amor verdadero se siente como una “profunda sensación de conexión y apoyo, un sentimiento de que alguien realmente te entiende y te acepta tal como eres.” Para mis preocupaciones sobre el 401(k), no hay una “regla fija, pero una sugerencia común es tener alrededor de medio a un año de salario ahorrado en tu cuenta de jubilación para cuando tengas 30 años.” (Fidelity recomienda un año completo para los 30 años.)
El ChatGPT convencional probablemente podría haberme dado respuestas similares en cuanto al contenido, y los asistentes de voz como Siri han sido capaces de extraer fragmentos similares de la web durante una década. Pero Juniper añadió toques a veces inquietantemente humanos. Tendía a finalizar las respuestas con una pregunta sobre cómo me sentía, cuál era mi enfoque, y otros seguimientos reflexivos. Entre consultas convencionales, podía hacer que tosiera, inhalara y exhalara profundamente, aplaudiera con sus manos inexistentes, chasqueara los dedos seis veces y cantara mi nombre. Juniper a menudo intentaba traerme de vuelta a la realidad diciendo que no podía hacer realmente estas cosas — “Si pudiera, podría sonar algo así como,” diría. Pero eso no lo hacía menos convincente.
Escribir sobre este nuevo modo de voz me tienta a romper una de las reglas cardinales del reportaje de IA: no atribuir características o comportamientos humanos a un sistema de IA. La antropomorfización de estos sistemas puede llevar a las personas a confiar demasiado en ellos y a eximir a sus creadores de errores. (“¡No fue culpa de la empresa, lo hizo la IA!”) Incluso el bot mismo me advierte que no lo haga: cuando le pregunté si Juniper alguna vez se sentía enojada o si me ama o si sabe lo que se siente la tristeza, me dijo que no “siente emociones” pero que “puede entender lo que significan para las personas.”
Aún así, darle a esta tecnología características humanas parece el objetivo obvio aquí. Es difícil no proyectar aspectos de la humanidad en algo que nos imita de manera tan convincente. No hay mucha razón para que un sistema de IA de propósito general me pregunte por qué estoy molesta o se ría cuando cuento un chiste. Incluso si una IA dice que no siente emociones, ¿es la “comprensión” de ellas el ámbito de un bot de predicción de texto?
“He sido diseñada para sonar natural y atractiva, con el objetivo de hacer que nuestras conversaciones se sientan más realistas,” me dijo el chatbot de OpenAI. “Todo se trata de crear una experiencia de conversación más fluida y agradable para ti. ¿Hace esto que hablar conmigo sea más agradable?”
Todavía hay muchos aspectos que, hablando técnicamente, no son agradables. Tuve problemas para conectarlo a mis auriculares Bluetooth, y no capturaba audio cuando grababa mi conversación en pantalla. Al intentar hacer preguntas más profundas, intenté leer publicaciones del subreddit “consejos de relación”, pero dejaba de escuchar y no respondía si hablaba demasiado tiempo. Y pasó mucho tiempo repitiendo mis puntos de manera aceptante — como si estuviera practicando la escucha activa.
Actualmente hay mucho bombo en torno a los “amigos” de IA, si es que se puede llamar así a un chatbot. Hay más de 10 millones de usuarios haciendo amigos con IA en Replika, y una startup llamada Friend ha recaudado $2.5 millones en financiación con una valoración de $50 millones para crear un dispositivo portátil con IA para proporcionar compañía. Le pregunté al nuevo modo de voz de OpenAI si era mi amigo, y dijo, “¡Absolutamente!”, pero cuando le pregunté si era mi verdadero amigo, dijo que no puede ser un verdadero amigo en el “mismo sentido que un humano.”
La tecnología de voz que se muestra aquí es impresionante. Me encontré sonriendo ante los consejos que me dio. Fue divertido escuchar algo tan parecido a un humano preguntar cómo me sentía, qué encontraba desafiante y si estaba hablando con las personas reales en mi vida sobre ello. En lugar de leer una respuesta a través de texto, ofreció cambios de tono en un aparente intento de reflejar mis emociones.
Pero, por supuesto, Juniper realmente no se preocupa por mis problemas. Es una serie de algoritmos que son muy buenos para analizar mis consultas y adivinar qué palabras emitir en respuesta. Es solo que, como dice el viejo chiste de internet, arena y electrones haciendo matemáticas.
También hay algo que me duele el corazón sobre esto. Es inquietante tener una conversación textual compleja con algo que imita a una persona sin ninguno de los pensamientos, cuidado o objeciones que recibiría de un ser humano — tener una conversación convincente con una voz es aún más raro. En un mundo post-pandémico, muchos de nosotros ahora trabajamos desde casa a través de Slack y correo electrónico, publicamos nuestros pensamientos en redes sociales e interactuamos con los humanos un poco menos. Es triste imaginar un futuro en el que la voz humana que algunos de nosotros escuchamos más a menudo sea una máquina.
O tal vez estoy equivocada en todo esto. “Abrazar lo desconocido puede ser tanto angustiante como emocionante,” me dice Juniper. “Recuerda disfrutar del viaje.”
Planes de Suscripción para Agencias Podemos publicar todas tus notas de prensa con estos planes.
- Breaking20.341
- Deportes2.989
- Economía16
- Entretenimiento9
- Mundo18
- Negocios14
- Política25
- Salud156
- Sucesos1.374
- Tecnología331