El código abierto alcanza a los pagos

En junio se descargaron gratis modelos que hace un año eran ciencia ficción. Tres lanzamientos de open source (código abierto) les empataron o les ganaron a los grandes modelos pagos en las pruebas, y la distancia entre lo que cualquiera puede bajar y lo mejor que se alquila quedó en su punto más corto medido, según Epoch AI. Eso es lo que cambia: el modelo que corre en una máquina propia ya casi vale lo mismo que el que se le alquila a otra empresa.

Lo que salió en junio

El que más ruido hizo fue GLM-5.2, de la china Zhipu AI (que afuera opera como Z.ai). Salió el 13 de junio con licencia MIT y los weights (los parámetros del modelo) publicados en Hugging Face: cualquiera lo descarga y lo corre. Son unos 750.000 millones de parámetros en un diseño Mixture-of-Experts (mezcla de expertos), de los que se activan cerca de 40.000 millones por token, con una context window (ventana de contexto) de un millón de tokens. Quedó primero entre los abiertos en el Artificial Analysis Intelligence Index, con 51 puntos, y empató a GPT-5.5 en la prueba de trabajo GDPval-AA v2, según el relevamiento de OpenRouter. Todo eso a cerca de un sexto del costo del modelo de OpenAI, según Labellerr.

Atrás vino DeepSeek V4, también con licencia MIT. La versión liviana, V4-Flash, resuelve el 79% del SWE-Bench Verified (una prueba que mide arreglar bugs (errores) reales de programación) y cobra 0,054 y 0,242 dólares por millón de tokens de entrada y de salida: cerca de 150 veces más barata en la salida que GPT-5.5, según OpenRouter. La versión grande, V4-Pro, llega a 93,5 puntos en LiveCodeBench, según devFlokers.

Y MiniMax M3 trajo lo que los abiertos venían debiendo: entiende imágenes y video de fábrica, sostiene el millón de tokens de contexto y encabeza el SWE-Bench Pro entre los abiertos, con 59,0%, según las mismas dos fuentes.

Ninguno de estos tres vive en el servidor de otra empresa. Se descargan, corren en un servidor propio y quedan bajo control de quien los usa.

Por qué importa

Cuando el mejor modelo abierto queda tan cerca del mejor pago, la pregunta deja de ser cuál es el mejor y pasa a ser por qué seguir pagando por el otro.

Tener los parámetros en la mano cambia tres cosas concretas:

Los datos se quedan en casa. El modelo corre en hardware propio y no viaja a la nube de nadie.
Se adapta sin permiso. Se le puede hacer fine-tuning (ajuste fino) para una tarea específica, sin depender de ningún proveedor.
El costo se desploma. La rebaja de DeepSeek no es una promoción de lanzamiento: quedó fija.

El número que lo resume:

Cuatro meses. Es la menor distancia que Epoch AI midió nunca entre el mejor modelo abierto y el mejor cerrado: unos 8 puntos de su índice ECI, lo mismo que separa a GPT-5 de GPT-5.5.

Y no es que los grandes se estén escapando. Los laboratorios de frontera "no parecen, al menos por ahora, estar acelerando para dejar atrás a los abiertos", resume OpenRouter, que viene midiendo una brecha estable de tres a seis meses desde hace más de un año y medio.

La letra chica

Dos advertencias, una sola vez. "Abierto" no siempre significa libre del todo: GLM-5.2 y DeepSeek V4 salieron con licencia MIT, la más permisiva, pero MiniMax M3 usa una licencia propia que pide atribución y autorización para uso comercial (OpenRouter). Y una capacidad de frontera al alcance de cualquiera sirve para las dos cosas: la gente de Semgrep midió que GLM-5.2 le gana a Claude en pruebas de ciberseguridad ofensiva. El mismo modelo que ayuda a blindar un sistema ayuda a vulnerarlo, y ahora está al alcance de quien quiera descargarlo.

Relacionados

Lo que salió en junio

Por qué importa

La letra chica

Relacionados

El arma de 500 dólares

GPT-5.6 Sol, frontera bajo llave

La IA traidora que el entrenamiento de seguridad no pudo limpiar

Heretic le saca la censura a un modelo en un comando