ChatGPT se parece más a Claude: ¿espejo o estrategia?

Esp. Willmar Tarazona Faneyth
1 may
3 min de lectura

La batalla es cada vez más brutal entre ambas empresas por el dominio de la IA, mientras Google sigue avanzando. — Imagen generada con ChatGPT

OpenAI lanzó ChatGPT-5.5 exactamente siete días después de que Anthropic presentara Claude Opus 4.7. La carrera ya no se mide en meses. Y el resultado más inesperado no está en los benchmarks: está en la personalidad de cada modelo

Hay una escena en las películas de espías donde dos agentes intercambian identidades y nadie, ni ellos mismos, termina seguro de quién es quién. Algo parecido está ocurriendo en el sector de la inteligencia artificial ahora mismo, y la paradoja es tan inesperada que vale la pena detenerse a leerla con cuidado.

OpenAI lanzó ChatGPT-5.5, su nuevo modelo fundacional, con el nombre en clave “Spud” dentro de la compañía. La cadencia del lanzamiento lo dice todo: Anthropic había presentado Claude Opus 4.7 apenas siete días antes. No hay semana en la industria de la IA que no traiga al menos un movimiento importante. La sorpresa no fue que GPT-5.5 llegara. Fue cómo llegó.

El cruce que nadie vio venir

Los usuarios que probaron ambos modelos en los días siguientes al lanzamiento notaron algo desconcertante. GPT-5.5 responde de forma más concisa, más directa, más eficiente. No rodea la respuesta, no construye un ensayo antes de llegar al punto. Se comporta, en definitiva, como siempre se comportó Claude. Al mismo tiempo, Opus 4.7 empezó a recibir críticas por lo contrario: responde más largo, consume más tokens, pierde ese tono característico y directo que definió a los modelos de Anthropic. Escribe, en pocas palabras, como siempre escribió GPT.

Dan Shipper, CEO de Every, señaló públicamente que Opus 4.7 se siente lento en comparación con GPT-5.5. El newsletter The Neuron describió el fenómeno con precisión: los dos modelos parecen haberse intercambiado las personalidades. Algunos analistas, como Dylan Patel de Semianalysis, apuntan a una explicación técnica: Anthropic estaría limitando deliberadamente el cómputo disponible para Opus 4.7, lo que explicaría tanto la verbosidad como la percepción de lentitud.

GPT-5.5 usa 72% menos tokens de salida que Claude Opus 4.7 en las mismas tareas. Opus 4.7 tiene un tiempo hasta el primer token de ~0,5 segundos frente a ~3 segundos de GPT-5.5. Velocidad de respuesta e identidad comunicativa se han invertido.— MindStudio / LLM Stats

Los benchmarks que los titulares no leen completo

OpenAI publicó una tabla comparativa en la que GPT-5.5 lidera en 14 pruebas frente a 4 de Opus 4.7 y 2 de Gemini 3.1 Pro. El número circuló ampliamente. Lo que circuló menos es que esa tabla incluye benchmarks donde solo OpenAI publicó resultados para los modelos rivales. Cuando se comparan únicamente las diez pruebas en las que ambos laboratorios publicaron sus propios números, el cuadro cambia: Opus 4.7 lidera en seis, GPT-5.5 en cuatro.

La distribución es reveladora. GPT-5.5 domina en Terminal-Bench 2.0 —tareas agénticas en entorno de terminal— con un 82,7% frente al 69,4% de Opus 4.7, en navegación web y en uso de computadora. Opus 4.7 mantiene la delantera en programación de ingeniería real (64,3% vs 58,6%), orquestación de herramientas (79,1% vs 75,3%), razonamiento multidisciplinar y análisis financiero. El veredicto honesto es que ninguno gana de forma absoluta: cada modelo es mejor en su propia categoría de trabajo.

El precio sube. ¿Vale la pena?

GPT-5.5 cuesta 5 dólares por millón de tokens de entrada y 30 dólares por millón de salida, el doble del precio de su predecesor. Existe además una versión Pro a 30 y 180 dólares respectivamente, el precio más alto visto hasta ahora en un modelo de IA de uso general. Opus 4.7 mantiene el mismo precio de su antecesor: 5 dólares de entrada y 25 de salida.

La defensa de OpenAI ante la diferencia de precio descansa en la eficiencia de tokens: si GPT-5.5 completa una tarea con el 72% menos de tokens de salida, el costo real por tarea puede terminar siendo competitivo o incluso inferior. Es una apuesta que tiene lógica matemática, pero que requiere validación en condiciones de producción reales.

La batalla entre OpenAI y Anthropic no tiene un ganador claro. Tiene dos modelos que aprendieron del otro sin querer admitirlo, un mercado que avanza a una velocidad que hace obsoleto cualquier liderato en menos de una semana y una pregunta que ningún benchmark responde todavía: quién tiene suficiente combustible para seguir corriendo a este ritmo.

ChatGPT se parece más a Claude: ¿espejo o estrategia?

El cruce que nadie vio venir

Los benchmarks que los titulares no leen completo

El precio sube. ¿Vale la pena?

Entradas recientes

Comentarios