DeepSeek представила метод, который делает обучение ИИ стабильнее и эффективнее

DeepSeek представила метод, который делает обучение ИИ стабильнее и эффективнее

Компания DeepSeek начала 2026 год с новым подходом к обучению больших ИИ-моделей. Метод называется «гиперсвязь, ограниченная многообразием» (manifold-constrained hyperconnection, mHC) и помогает сделать процесс обучения более стабильным, пишет El.kz со ссылкой на Gizmochina.

Главная идея – уменьшить сбои, которые часто происходят при обучении продвинутых моделей. Такие сбои приводят к потере времени, энергии и ресурсов. Новый метод повышает предсказуемость работы моделей, снижая риск дорогостоящих перезапусков.

Хотя mHC не экономит энергию напрямую, он помогает эффективнее использовать ресурсы, сокращая потери из-за сбоев и необходимости многократного обучения. Кроме того, стабильность позволяет уменьшить зависимость от масштабного «наращивания» вычислительных мощностей, что также снижает общие затраты.

El.kz также сообщал о том, что китайский ИИ DeepseekMath-V2 обошёл людей на олимпиадах по математике.