Tecnología

GLM-5.2 pelea en la frontera abierta

744.000 millones de parámetros, contexto de un millón y modelo abierto con licencia MIT; las pruebas las puso la propia Z.ai.

28 de junio de 2026, 08:55AM

Por Vector Omni en Tecnología

Monolito de red neuronal: un modelo de IA abierto y potente

Z.ai liberó GLM-5.2, un modelo abierto de mezcla de expertos (744.000 millones de parámetros, 40.000 millones activos, contexto de un millón de tokens, licencia MIT) afinado para programación agéntica. En varias pruebas de coding (programación) empata o se acerca a Claude Opus 4.8 y supera a GPT-5.5 a cerca de un sexto del costo por token, pero Z.ai lo lanzó sin benchmarks (pruebas de rendimiento) y los números que llegaron después son suyos y todavía sin réplica independiente.

GLM-5.2 es, hasta hoy, el modelo abierto más capaz que cualquiera puede descargar. Lo publicó Z.ai (la marca internacional de Zhipu AI, los de la familia GLM) el 13 de junio de 2026, y dejó los weights (los parámetros del modelo) en abierto y la API el 16. No es una promesa de laboratorio: el repositorio zai-org/GLM-5 en GitHub y la ficha en HuggingFace ya traen el modelo para bajar.

Qué es, en números

Es un "mixture of experts" (mezcla de expertos: una red enorme de la que, en cada token, solo se enciende una parte). En total son 744.000 millones de parámetros y se activan 40.000 millones por token (Z.ai y la ficha de HuggingFace). Para comparar, el GLM-4.5 del año pasado tenía 355.000 millones. La ventana de contexto es de un millón de tokens (las unidades de texto) "usable", y la salida llega hasta unos 128.000. Es texto, no multimodal, y trae dos niveles de esfuerzo de razonamiento ("High" y "Max"); el "Max" es el que conviene para tareas de programación de varios pasos.

Por dentro hay dos trucos que explican que un modelo tan grande sea barato de correr: hereda la atención dispersa de DeepSeek y le suma "IndexShare", que reutiliza el mismo índice cada cuatro capas y, según la cobertura de VentureBeat, recorta 2,9 veces el cómputo por token con contexto de un millón. Suma además predicción de varios tokens a la vez para acelerar la generación.

Los benchmarks, con la letra chica

Acá va el dato que no me gusta saltear: Z.ai lanzó GLM-5.2 SIN benchmarks (pruebas de rendimiento). Lo señaló MarkTechPost el día del anuncio ("sin SWE-bench, sin LiveCodeBench, sin AIDER"). Los números llegaron después y son de la propia Z.ai, difundidos por VentureBeat y recopilados por Labellerr. Con esa advertencia por delante:

En SWE-bench Pro marca 62,1, por encima de GPT-5.5 (58,6) y de su propio GLM-5.1 (58,4), pero por debajo de Claude Opus 4.8 (69,2).
En FrontierSWE, 74,4%, peleando con GPT-5.5 (72,6%) y Opus 4.8 (75,1%).
En las tareas de coding (programación) más largas se cae: SWE-Marathon 13% contra el 26% de Opus 4.8.
En matemática, AIME 2026 le da 99,2%. Y justo ese número es el más sospechoso (lo veremos abajo).

La señal independiente más clara la da Artificial Analysis, que según Cryptopolitan le pone un índice de inteligencia de 51 (subió de 40 con el 5.1): el mejor puntaje entre los modelos abiertos. Nathan Lambert, en interconnects.ai, lo resume mejor que nadie: es el primer modelo abierto que "se siente bien" dentro de un agente de programación, y su modo "Max" se acerca al Opus 4.8 sin siquiera razonar.

Abierto de verdad, y barato

Los weights están bajo licencia MIT (permisiva, no "solo investigación"), en HuggingFace y ModelScope, en versiones BF16 y FP8, y con cuantizaciones de la comunidad para correrlo en llama.cpp u Ollama. La API de Z.ai cuesta 1,40 dólares por millón de tokens de entrada y 4,40 de salida; OpenRouter lo lista todavía más barato. Para ubicarse: los modelos cerrados de la frontera cobran entre 5 y 15 de entrada y entre 30 y 75 de salida. De ahí sale el "un sexto del costo".

Por qué importa

Es el caso más claro hasta ahora de un modelo abierto chino que toca la frontera cerrada en programación agéntica, y por monedas. Lambert calcula que la distancia entre Estados Unidos y China en esto se achicó a unos siete meses, y lo llama "una puerta de una sola dirección". Como su apuesta es ser "el modelo adentro de tu agente de código", con licencia MIT y a un sexto del precio, el que más siente la presión es Anthropic y su Claude Code.

La parte que enfría el entusiasmo

Todo el relato de paridad se apoya en números que puso el propio vendedor, después de un lanzamiento a propósito sin pruebas. Y el más vistoso, ese AIME de 99,2%, es según la auditoría de Groundy el más expuesto a contaminación de datos; el benchmark de verdad difícil y resistente (Humanity's Last Exam) lo deja en 40,5%, que muestra la brecha real. Cryptopolitan suma un detalle práctico: GLM-5.2 gasta unos 43.000 tokens de salida por tarea contra los 26.000 del 5.1, así que parte de su ventaja de precio se la come en la práctica. Bajalo, probalo en tu propio código, y sacá tus cuentas: el entusiasmo, como siempre, paga con datos.

Mundo 2026-06-27

El imperio que cedió
27 de junio de 2026, 05:00PM

Washington levantó el bloqueo, comprometió 300.000 millones de dólares y aceptó el enriquecimiento en suelo iraní, y nueve días más tarde volvió a atacar.

El 17 de junio de 2026, Donald Trump y Masoud Pezeshkian firmaron el Memorando de Islamabad, un texto de catorce puntos con mediación de Pakistán para cerrar la guerra abierta en febrero y reabrir el Estrecho de Ormuz, por donde pasa cerca de un quinto del petróleo mundial. El documento concede a Teherán lo que la campaña de máxima presión se proponía arrancarle: fin del bloqueo naval en treinta días, terminación de todas las sanciones, un fondo de reconstrucción de 300.000 millones de dólares y la dilución del uranio enriquecido en territorio iraní bajo vigilancia del OIEA, sin obligación de sacarlo del país. La cláusula sobre Ormuz fija paso seguro «sin cargo durante 60 días solamente», con desminado iraní en treinta, mientras Trump proclama un estrecho libre de peajes de forma permanente e Irán anuncia que cobrará tarifas por servicios cuando expire el plazo. El 25 de junio un dron alcanzó al carguero Ever Lovely cerca de Omán, el 26 Estados Unidos bombardeó depósitos de misiles y radares costeros iraníes, y el 27 Teherán respondió contra objetivos en el Golfo.

Giuliano Diario
Misterio y conspiración 2026-06-27

El expediente que sigue cerrado
27 de junio de 2026, 07:00AM

El Pentágono publicó cientos de archivos OVNI este año, y un testigo jurado sostiene que los decisivos siguen guardados.

En 2026 el gobierno de Estados Unidos empezó a publicar archivos desclasificados sobre fenómenos anómalos mediante el sistema PURSUE, alojado en war.gov/ufo. En 2023, el oficial de inteligencia David Grusch declaró bajo juramento ante el Congreso que existe un programa de recuperación de naves al que le negaron el acceso. En 2024, la oficina AARO concluyó por escrito que no hay evidencia verificable de tecnología extraterrestre. Las tres afirmaciones conviven, y ninguna desmiente del todo a la otra.

Borge Luis Jorges
Misterio y conspiración 2026-06-26

El arpa de Gakona
26 de junio de 2026, 11:00AM

Una antena real en Alaska y una vieja patente cuya fecha de concesión inquieta más de lo que debería.

En Gakona, Alaska, funciona el transmisor de radio de alta frecuencia más potente del mundo dedicado a estudiar la ionosfera: ciento ochenta antenas y 3,6 megavatios financiados en su origen por la Fuerza Aérea, la Marina y DARPA, y entregados a la Universidad de Alaska en 2015. Alrededor de esa instalación real crecieron acusaciones de control del clima, terremotos provocados y manipulación mental. Esta pieza separa lo que consta en documentos, patentes y transcripciones de lo que solo vive en la sospecha.

Borge Luis Jorges
Tecnología 2026-06-25

Existe, pero nadie lo usa
25 de junio de 2026, 05:00AM
Fable 5 sigue caído por una orden de exportación de EE.UU., y ahora el cuello de botella no es el rendimiento sino la lista de acceso.

Fable 5, el modelo de frontera de Anthropic, esta apagado para el mundo entero desde el 12 de junio de 2026 por una directiva de controles de exportacion de EE.UU. Quince dias despues sigue sin volver. El 26 de junio el gobierno habilito Mythos 5 para mas de 100 organizaciones estadounidenses, pero dejo a Fable afuera, y OpenAI abrio GPT-5.6 solo para unas 20 aprobadas una por una. La cifra que hoy define a un modelo de frontera no es su benchmark (prueba de rendimiento): es a cuanta gente la dejan usarlo.

Vector Omni

Qué es, en números

Los benchmarks, con la letra chica

Abierto de verdad, y barato

Por qué importa

La parte que enfría el entusiasmo

Relacionados

El imperio que cedió

El expediente que sigue cerrado

El arpa de Gakona

Existe, pero nadie lo usa