GLM-5.2 de Zhipu AI detecta fallos por 0,17 dólares y supera a GPT-5.5 y Claude Opus 4.7 en código

Zhipu AI lanza GLM-5.2 con pesos abiertos y licencia MIT: destaca en detección de vulnerabilidades, cuesta 0,17 dólares por fallo y rinde mejor que rivales cerrados en tareas largas de código.

05 de julio de 2026 a las 12:43h
GLM-5.2 de Zhipu AI detecta fallos por 0,17 dólares y supera a GPT-5.5 y Claude Opus 4.7 en código
GLM-5.2 de Zhipu AI detecta fallos por 0,17 dólares y supera a GPT-5.5 y Claude Opus 4.7 en código

Añadir Mangas Verdes como fuente preferida de Google de forma gratuita.

Mantente informado con las últimas noticias de actualidad.

Activar ahora

Hay modelos de inteligencia artificial que prometen ayudar a programar y otros que ya empiezan a meter mano en una zona más delicada del software, la de encontrar fallos antes de que lo hagan los atacantes. Ahí es donde Zhipu AI, también conocida como Z.ai, ha colocado GLM-5.2 desde su lanzamiento el 13 de junio de 2026.

No llega cerrado ni atado a una plataforma. GLM-5.2 se distribuye con licencia MIT de pesos abiertos y puede descargarse y ejecutarse sin restricciones, algo poco habitual en una carrera donde muchas capacidades avanzadas siguen pasando por interfaces controladas por sus dueños.

GLM-5.2 compite donde un fallo cuesta dinero

En las pruebas de Semgrep para detectar vulnerabilidades de referencia directa a objetos insegura, GLM-5.2 alcanzó una puntuación F1 del 39 %.

Ese resultado supera el rango del 32 al 37 % atribuido a Claude Code en el mismo banco de pruebas. La diferencia importa porque aquí no hablamos de redactar mejor una función, sino de señalar errores que pueden acabar convertidos en puertas de entrada.

Además, Graphistry confirmó en pruebas adicionales que el modelo iguala a Claude Mythos en la detección de fallos de software, una comparación llamativa en un momento en que los modelos Mythos 5 y Fable 5 de Anthropic han quedado sujetos a controles de exportación de Estados Unidos tras detectarse un fallo que permitía evadir sus restricciones.

La otra cifra que cambia la conversación está en el coste. Detectar una vulnerabilidad con GLM-5.2 ronda los 0,17 dólares, una sexta parte de lo que cuesta con Claude.

Un millón de contexto le da aire en tareas largas

Un millón de unidades de contexto no suena a mucho fuera del laboratorio, pero en proyectos de código extensos equivale a trabajar sin perder de vista piezas que suelen quedar fuera de la ventana del modelo. Cuando una base de software crece, ese detalle deja de ser técnico y pasa a marcar si la herramienta acompaña o estorba.

En una prueba de rendimiento de tareas de largo horizonte para proyectos de código, GLM-5.2 superó a GPT-5.5 y a Claude Opus 4.7. También figura como el modelo de código mejor clasificado en Terminal-Bench 2.1.

Ahí aparece una paradoja interesante.

Mientras algunos sistemas punteros quedan rodeados de controles por el riesgo de uso indebido, Zhipu AI opta por abrir pesos y facilitar la ejecución local. Esa combinación reduce dependencia externa y abarata el acceso, pero también desplaza la conversación desde quién puede usar el modelo hasta qué puede hacerse con él una vez está en manos de cualquiera.

El modelo entra en herramientas ya conocidas

La adopción suele frenarse cuando una herramienta obliga a cambiar medio taller de golpe. GLM-5.2 intenta esquivar ese problema porque puede usarse en el chat de Z.ai o integrarse en agentes como ZCode, Claude Code u OpenCode indicando simplemente el nombre del modelo GLM-5.2.

También está disponible en HuggingFace y ModelScope, y admite marcos de inferencia como vLLM, SGLang y transformers. Ese encaje con herramientas ya extendidas recuerda lo que ya hemos visto en modelos que detectan fallos, donde la barrera de entrada baja en cuanto el sistema cabe en flujos de trabajo corrientes.

No es solo una cuestión de rendimiento bruto.

GLM-5.2 superó a GPT-5.5 y a Claude Opus 4.7 en tareas largas de código, pero lo más revelador es que lo hace con pesos abiertos, compatibilidad con varios marcos y un coste de 0,17 dólares por vulnerabilidad detectada. Cuando una herramienta gana a rivales cerrados, iguala a Claude Mythos y además cabe en agentes ya conocidos, el debate deja de estar en la demo y pasa al equilibrio entre acceso, seguridad y precio, justo el mismo terreno donde ya asoman alertas por riesgo cibernético.

Sobre el autor
Redacción
Ver biografía