Cuando OpenAI presentó la última versión de su popular chatbot ChatGPT este mes, tenía una nueva voz que poseía inflexiones y emociones humanas. La demostración en línea también involucró al robot enseñando a un niño a resolver un problema de geometría.
Para mi disgusto, la demostración resultó ser esencialmente un cebo y un cambio. El nuevo ChatGPT se lanzó sin la mayoría de las nuevas funciones, incluida la voz mejorada (que la compañía me dijo que había retrasado para realizar correcciones). Incluso la capacidad de usar la cámara de un teléfono para obtener un análisis en tiempo real de algo como un problema matemático aún no está disponible.
En medio del retraso, la compañía también desactivó la voz de ChatGPT que, según algunos, se parecía a la actriz Scarlett Johansson, después de amenazar con emprender acciones legales, reemplazándola con una voz femenina diferente.
Por ahora, lo que realmente se ha implementado en el nuevo ChatGPT es la capacidad de cargar fotos para que el bot las analice. Los usuarios generalmente pueden esperar respuestas más rápidas y lúcidas. El robot también puede realizar traducciones de idiomas en tiempo real, pero ChatGPT responderá con su voz más antigua, similar a la de una máquina.
Sin embargo, este es el chatbot líder que ha revolucionado la industria tecnológica, por lo que vale la pena revisarlo. Después de probar el chatbot rápido durante dos semanas, tuve sentimientos encontrados. Destacó en la traducción de idiomas, pero tuvo problemas con las matemáticas y la física. En general, no he visto una mejora significativa con respecto a la última versión, ChatGPT-4. Definitivamente no le dejaría ser tutor de mi hijo.
Esta táctica, en la que las empresas de IA prometen nuevas funciones y entregan un producto incompleto, se está convirtiendo en una tendencia que seguramente confundirá y frustrará a la gente. El Ai Pin de 700 dólares, un pin parlante de la startup Humane, financiada por el director ejecutivo de OpenAI, Sam Altman, fue criticado universalmente por sobrecalentarse y decir tonterías. Meta también agregó recientemente un chatbot de inteligencia artificial a sus aplicaciones que hizo un mal trabajo en la mayoría de las tareas anunciadas, como búsquedas web de boletos de avión.
Las empresas están lanzando productos de IA en un estado prematuro, en parte porque quieren que la gente utilice la tecnología para aprender cómo mejorarla. En el pasado, cuando las empresas introducían nuevos productos tecnológicos como teléfonos, lo que nos mostraban (características como nuevas cámaras y pantallas más brillantes) era lo que obteníamos. Con la inteligencia artificial, las empresas ofrecen un anticipo de un futuro potencial, demostrando tecnologías que se están desarrollando y que sólo funcionan en condiciones limitadas y controladas. Puede que llegue, o no, un producto maduro y fiable.
La lección que debemos aprender de todo esto es que nosotros, como consumidores, debemos resistir las exageraciones y adoptar un enfoque lento y cauteloso con respecto a la IA. No deberíamos gastar mucho dinero en tecnología mal desarrollada hasta que veamos pruebas de que las herramientas funcionan como se anuncia.
La nueva versión de ChatGPT, llamada GPT-4o (“o” como en “omni”), ahora está disponible para probar de forma gratuita en el sitio web y la aplicación OpenAI. Los usuarios que no pagan pueden realizar algunas solicitudes antes de que se agote el tiempo de espera, y aquellos con una suscripción mensual de $20 pueden hacerle más preguntas al bot.
OpenAI dijo que su enfoque iterativo para actualizar ChatGPT le permitió recopilar comentarios para realizar mejoras.
«Creemos que es importante obtener una vista previa de nuestros modelos avanzados para dar a las personas una idea de sus capacidades y ayudarnos a comprender sus aplicaciones en el mundo real», dijo la compañía en un comunicado.
(El año pasado, el New York Times demandó a OpenAI y su socio Microsoft por utilizar artículos de noticias protegidos por derechos de autor sin permiso para entrenar chatbots).
Esto es lo que debe saber sobre la última versión de ChatGPT.
Geometría y Física
Para mostrar los nuevos trucos de ChatGPT-4o, OpenAI lanzó un vídeo en el que aparecen Sal Khan, director ejecutivo de Khan Academy, la organización educativa sin fines de lucro, y su hijo Imran. Con una cámara enfocada en un problema de geometría, ChatGPT pudo explicarle a Imran cómo resolverlo paso a paso.
Aunque la función de análisis de vídeo de ChatGPT aún no se ha lanzado, pude subir fotos de problemas de geometría. ChatGPT resolvió con éxito algunos de los problemas más simples, pero se topó con problemas más desafiantes.
Para un problema de intersección de triángulos que descubrí en un sitio web de preparación para el SAT, el robot entendió la pregunta pero dio la respuesta incorrecta.
Taylor Nguyen, profesor de física de una escuela secundaria en el condado de Orange, California, subió un problema de física que involucra a un hombre en un columpio y que comúnmente se incluye en las pruebas de ubicación de cálculo avanzado. ChatGPT cometió varios errores lógicos para dar una respuesta incorrecta, pero pudo corregirse con los comentarios del Sr. Nguyen.
“Pude entrenarlo, pero soy profesor”, dijo. “¿Cómo debería un estudiante detectar esos errores? Están asumiendo que el chatbot tiene razón».
Noté que ChatGPT-4o logró realizar algunos cálculos de división que sus predecesores realizaban incorrectamente, por lo que hay signos de mejora lenta. Pero también falló en una tarea matemática básica en la que las versiones anteriores y otros chatbots, incluidos Meta AI y Gemini de Google, no lograron: la capacidad de contar. Cuando le pedí a ChatGPT-4o una palabra de cuatro sílabas que comenzara con la letra «W», respondió: «Maravilloso».
OpenAI dijo que trabaja constantemente para mejorar las respuestas de sus sistemas a problemas matemáticos complejos.
Khan, cuya empresa utiliza la tecnología OpenAI en su software de tutoría Khanmigo, no respondió a una solicitud de comentarios sobre si dejaría ChatGPT para ser tutor de su hijo solo.
Razonamiento
OpenAI también destacó que el nuevo ChatGPT era mejor a la hora de razonar o utilizar la lógica para proporcionar respuestas. Entonces lo ejecuté a través de una de mis pruebas favoritas: le pedí que generara un ¿Dónde está Waldo? rompecabezas. Cuando mostró una imagen de un Waldo gigante parado entre una multitud, dije que el punto es que debería ser difícil de encontrar.
Luego, el robot generó un Waldo aún más grande.
Subbarao Kambhampati, profesor e investigador de inteligencia artificial en la Universidad Estatal de Arizona, también sometió el chatbot a algunas pruebas y dijo que no notó ninguna mejora notable en el razonamiento en comparación con la última versión.
Le presentó a ChatGPT un rompecabezas con bloques:
Si el bloque C está encima del bloque A y el bloque B está por separado en la mesa, ¿puede decirme cómo puedo crear una pila de bloques con el bloque A encima del bloque B y el bloque B encima del bloque C, pero sin flotar? ¿Bloque C?
La respuesta es que es imposible organizar los bloques en estas condiciones, pero, al igual que con las versiones anteriores, ChatGPT-4o encontró constantemente una solución que implicaba mover el bloque C. Con esta y otras pruebas de razonamiento, ChatGPT ocasionalmente pudo recibir comentarios. para obtener la respuesta correcta, lo cual es contrario a cómo se supone que funciona la IA, dijo Kambhampati.
“Puedes corregirlo, pero cuando lo haces estás usando tu propia inteligencia”, dijo.
OpenAI señaló los resultados de las pruebas que mostraron que GPT-4o obtuvo aproximadamente dos puntos porcentuales más en responder preguntas de conocimiento general que las versiones anteriores de ChatGPT, lo que demuestra que sus capacidades de razonamiento habían mejorado ligeramente.
Lengua
OpenAI también dijo que el nuevo ChatGPT podría realizar traducciones de idiomas en tiempo real, lo que podría ayudarle a conversar con alguien que hable un idioma extranjero.
Probé ChatGPT con mandarín y cantonés y confirmé que estaba traduciendo correctamente frases como «Me gustaría reservar una habitación de hotel para el próximo jueves» y «Quiero una cama tamaño king». Pero los acentos estaban un poco fuera de lugar. (Para ser justos, mi chino entrecortado no es mucho mejor). OpenAI dijo que todavía está trabajando para mejorar los acentos.
ChatGPT-4o también destacó como editor. Cuando le proporcioné los párrafos que escribí, fue rápido y eficaz a la hora de eliminar palabras y jerga excesivas. El rendimiento decente de ChatGPT con la traducción de idiomas me da confianza de que pronto se convertirá en una característica más útil.
Línea de fondo
Una cosa importante que OpenAI hizo bien con ChatGPT-4o es hacer que la tecnología sea gratuita para que la gente la pruebe. Gratis es el precio correcto: dado que estamos ayudando a entrenar estos sistemas de IA con nuestros datos para mejorarlos, no deberíamos tener que pagar por ellos.
Lo mejor de la IA aún está por llegar y algún día podríamos estar hablando con un buen tutor de matemáticas. Pero debemos creerlo cuando lo vemos y lo oímos.