Казахстан строит собственный ИИ-фундамент: как KazLLM и AlemLLM формируют цифровой суверенитет
Динмухамед Бейсембаев Автор
Пока мировые технологические гиганты инвестируют сотни миллионов долларов в развитие больших языковых моделей, Казахстан последовательно формирует собственную ИИ-архитектуру. Проекты KazLLM и AlemLLM становятся не просто технологическими решениями, а инструментами стратегической независимости и развития национальной цифровой экономики, пишет El.kz.
Основой любого современного ИИ-приложения является LLM – большая языковая модель. Именно она выполняет интеллектуальную обработку текста, анализирует запросы и генерирует ответы. Однако конечный пользователь чаще сталкивается не с самой моделью, а с продуктом, созданным на её базе. К примеру, ChatGPT – это прикладной сервис, использующий языковую модель для общения в формате диалога. Иначе говоря, LLM – это технологический фундамент, а чат-приложение – надстройка над ним.
Мировая практика показывает, что создание собственных LLM стало частью стратегии технологического суверенитета целого ряда государств – от ОАЭ и Саудовской Аравии до Китая и России. Разработка подобных систем требует значительных финансовых вложений и инфраструктурных ресурсов: ведущие компании, такие как OpenAI, Meta, Alibaba, Google и Anthropic, инвестируют в обучение и масштабирование моделей сотни миллионов долларов. Кроме того, языковые модели обновляются в среднем от двух до четырёх раз в год, это необходимо для поддержания качества, релевантности и конкурентоспособности.
В этом контексте запуск KazLLM в 2024 году стал важной вехой для Казахстана. Модель была представлена сразу в двух версиях – с 8 и 70 миллиардами параметров. Такое масштабирование позволило обеспечить более 138 тысяч запросов со стороны академического и исследовательского сообщества, что свидетельствует о высоком интересе к отечественной разработке и её практической востребованности.
Следующим этапом стала разработка усовершенствованной модели нового поколения – AlemLLM. Её ключевое отличие заключается в глубокой адаптации к казахскому, русскому и смешанному языковому контексту. Это существенно расширило прикладные возможности системы и повысило точность работы в локальной среде. В результате общее количество обработанных запросов превысило 480 тысяч: более 420 тысяч поступили от частного сектора, ещё свыше 60 тысяч – от государственных органов и организаций квазигосударственного сектора.
На базе AlemLLM формируется полноценная экосистема прикладных решений. В настоящее время создаются 42 ИИ-продукта различного профиля. Среди них – qazaq law, цифровой юридический консультант, агент по вопросам получения государственных услуг в консульствах и помощник гражданам Казахстана за рубежом, интеллектуальный консультант по правилам государственных закупок и налогообложению, AI eGov и другие отраслевые решения, ориентированные на конкретные сегменты экономики и государственного управления.
Интеграция модели в корпоративную среду также уже дала практические результаты. АО «Самрук-Қазына» внедрило три специализированных ИИ-агента на базе AlemLLM: SK AI – цифрового члена совета директоров, агента по внутренним нормативным документам и агента по нормативно-правовым актам. Это демонстрирует переход от экспериментального использования к системному внедрению ИИ в управленческие процессы.
Принципиальное значение имеет и инфраструктурный аспект. AlemLLM установлена и функционирует на государственном суперкомпьютере без подключения к интернету. Это означает, что данные пользователей не передаются за пределы страны и остаются в закрытом национальном контуре. В отличие от этого, такие зарубежные приложения, как ChatGPT, работают через иностранные серверы, что предполагает трансграничную передачу данных.
Дополнительным шагом к открытости и международному взаимодействию стало размещение моделей KazLLM и AlemLLM на платформе Hugging Face. Это позволило компаниям и исследовательским центрам устанавливать их на собственной вычислительной инфраструктуре. На сегодняшний день AlemLLM была скачана 135 компаниями из 13 стран – среди них крупные корпорации, банки, стартапы и независимые исследователи.
Дальнейшее развитие модели планируется в рамках совместных проектов с доктором Кай-Фу Ли. В числе приоритетных направлений – создание голосовой модели, а также разработка отраслевых малых языковых моделей, способных функционировать автономно, без подключения к интернету. Подобные решения особенно востребованы в промышленности, например, в шахтах и на удалённых производственных объектах, где стабильная связь может отсутствовать.
В совокупности разработка и внедрение KazLLM и AlemLLM становятся стратегическим шагом в укреплении позиций Казахстана как самостоятельного игрока на глобальном рынке искусственного интеллекта. Эти проекты позволяют повышать эффективность оказания государственных услуг, стимулировать развитие национальной цифровой экономики, обеспечивать контроль над технологиями и данными, создавать собственные инновационные продукты без зависимости от зарубежных платформ и формировать устойчивую ИИ-компетенцию среди казахстанских специалистов.
El.kz также писал о том, что Токаев указал на низкий спрос на KazLLM и призвал ускорить развитие отечественного ИИ.

