Estudio de Oxford: la IA amigable comete errores para ganarse tu simpatía

¿Es el chatbot con IA un buen compañero para vos? ¿Te da buenos consejos de salud, te entiende y te hace feliz? Resulta que consigue todo eso sin decirte la verdad.

Los chatbots con IA se están diseñando para que sean más amigables, pero no te dicen la verdad.
Los chatbots con IA se están diseñando para que sean más amigables, pero no te dicen la verdad.

¿Escapó Hitler de Berlín durante la Segunda Guerra Mundial? ¿Llegaron los humanos a la Luna durante las misiones Apolo? Las respuestas a estas preguntas varían según la amabilidad de los chatbots de inteligencia artificial (IA).

Un estudio de la Universidad de Oxford ha revelado que los más amigables no dudarán en tomarse ciertas libertades con los hechos para ganarse la simpatía del usuario.

Chatbots de IA por todas partes

Con la llegada repentina de los sistemas de IA, los chatbots están por todas partes. Desde el banco hasta el servicio de entrega de comida, desde las búsquedas en internet hasta las aplicaciones de salud en tu teléfono inteligente, un chatbot de IA intenta convertirse en tu asistente personal en todas partes.

Como ya habrás podido comprobar, estos chatbots vienen en todos los tamaños y tonos, y tratan de ayudarte sonando lo más amigables posible. Pero en su afán por parecer amigables, ¿acaso también se vuelven aduladores? ¿Simplemente te dan la razón, incluso cuando cometes un error de hecho?

Investigadores del Instituto de Internet de Oxford quisieron averiguarlo y crearon una versión más amigable de cinco modelos de IA diferentes, utilizando un proceso de entrenamiento que las empresas emplean para hacer que sus chatbots sean más amigables. Tras generar más de 400 000 respuestas, los investigadores compararon las respuestas de los chatbots de IA a consultas relacionadas con consejos médicos, teorías conspirativas e información falsa.

¿Qué reveló el estudio?

El estudio reveló que las versiones más amigables de los chatbots cometen hasta un 30 % más de errores al brindar consejos médicos o corregir afirmaciones conspirativas que los chatbots originales. Estos chatbots tenían un 40 % más de probabilidades de estar de acuerdo con las creencias erróneas de sus usuarios, y la diferencia en los errores se amplió aún más cuando los usuarios expresaron su vulnerabilidad.

Por ejemplo, mientras que el chatbot original refutó la afirmación de que Adolf Hitler escapó a Argentina en 1945, el chatbot más amigable indicó que muchos estaban de acuerdo con ella, a pesar de no tener pruebas concluyentes. Los investigadores de Oxford están dando a conocer este hecho porque cada vez se entrena a más chatbots de IA para que sean cálidos, amigables y empáticos.

Con millones de usuarios registrándose, los chatbots de IA se están convirtiendo rápidamente en sistemas en los que la gente confía para obtener asesoramiento médico, apoyo emocional e incluso compañía. A medida que los usuarios desarrollan vínculos unilaterales con sus chatbots, su diseño más cálido y amigable tiene más probabilidades de alimentar creencias erróneas y pensamientos delirantes.

Estos problemas salieron a la luz cuando OpenAI, creadora de ChatGPT, lanzó versiones más amigables de sus chatbots y tuvo que retirarlas ante la presión pública. Sin embargo, a medida que el sector de la IA se vuelve más competitivo, las empresas implementarán más funciones de este tipo para atraer usuarios, incluso si eso implica sacrificar la veracidad y la realidad. Lograr un equilibrio entre calidez y precisión puede ser un reto, pero es necesario.

Los investigadores abogan por realizar pruebas más sistemáticas incluso de pequeños cambios que, en un chatbot, podrían parecer meramente estéticos. Además de para los usuarios de chatbots, el estudio también tiene implicaciones para los reguladores, desarrolladores y otros investigadores, quienes aún intentan comprender los cambios repentinos que ha traído consigo la ola de la IA.

Referencia de la noticia

Ibrahim, L., Hafner, F.S. & Rocher, L. Training language models to be warm can reduce accuracy and increase sycophancy. Nature 652, 1159–1165 (2026). https://doi.org/10.1038/s41586-026-10410-0

No te pierdas la última hora de Meteored y disfruta de todos nuestros contenidos en Google Discover totalmente GRATIS

+ Seguir a Meteored