Kimi, la IA china, lanza una nueva versión que programa sin supervisión humana

A unas semanas de irrumpir en escena y desplazar a ChatGPT y Gemini, Kimi está de regreso. La IA china desarrollada por Moonshot lanzó una nueva versión que supera a los modelos de lenguaje más potentes de OpenAI y Anthropic. Kimi K2.6 iguala o va más allá de GPT-5.4 y Claude Opus 4.6 en múltiples benchmarks, aunque con la ventaja de ser una IA de código abierto más accesible.

De acuerdo con una publicación en su blog, la característica principal de Kimi K2.6 es la ejecución autónoma sostenida. La IA puede mantener procesos largos y complejos sin necesidad de intervención humana.

En una de las demostraciones, Kimi optimizó la inferencia local del modelo Qwen3.5-0.8B en un Mac durante 12 horas seguidas y encadenando más de 4.000 llamadas a herramientas. En otra prueba, la IA refactorizó de forma autónoma un motor financiero de código abierto, durante 13 horas y 12 pases de optimización. La empresa menciona que esta prueba se tradujo en una mejora del 185% en el rendimiento medio y del 133% en el rendimiento pico.

En términos de benchmarks, Kimi K2.6 lidera en SWE-Bench Pro con 58,6 puntos, frente a los 57,7 de GPT-5.4 y los 53,4 de Claude Opus 4.6. En Humanity’s Last Exam con herramientas obtiene 54,0 puntos, por delante de Claude (53,0) y de GPT-5.4 (52,1). Por último, en Toolathlon, un benchmark centrado en el uso agéntico de herramientas, K2.6 puntúa 50,0, superando a Claude (47,2) y a Gemini 3.1 Pro (48,8).

Vea el texto íntegro:

📮Kimi, la IA china, lanza una nueva versión que programa sin supervisión humana