
Китайский стартап Zhipu AI выпустил флагманскую языковую модель GLM-5.2 для длинных агентных задач и программирования. Решение с открытым исходным кодом имеет контекстное окно в 1 млн токенов, лицензию MIT и поддержку локального развертывания.
В карточке на Hugging Face разработка указана как модель для генерации текста на английском и китайском языках. Размер — 753 млрд параметров.
GLM-5.2 поддерживает несколько уровней «интенсивности рассуждений», чтобы выбирать между качеством и задержкой. В архитектуру также встроены IndexShare и обновленный слой MTP для спекулятивной декодировки.
По заявлению разработчиков, IndexShare повторно использует один индексатор на каждые четыре слоя разреженного внимания и снижает число операций на токен в 2,9 раза. Обновление MTP увеличивает длину подтверждения до 20%.
В трех ключевых бенчмарках — FrontierSWE, PostTrainBench и SWE-Marathon — GLM-5.2 обошла другие модели с открытым исходным кодом.

В стандартных тестах производительности программирования GLM-5.2 тоже стала самой мощной open-source моделью.

GLM-5.2 распространяется по открытой лицензии MIT. Для локального развертывания заявлена поддержка SGLang, vLLM, Transformers, KTransformers и Docker Model Runner. Доступны квантизации для llama.cpp, Ollama и LM Studio.
Напомним, в июне IT-компания Рио-де-Жанейро IplanRIO представила Rio 3.5 Open 397B как открытую ИИ-модель, обученную на государственные средства. Однако через день команда Nex заявила, что инструмент выглядит как прямое слияние Nex-N2-Pro и Qwen3.5-397B-A17B.
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER
Источник: forklog.com




















Обсуждение: post