5 Июня, 11:58
Братская любовь: как правители Тюркского каганата Бильге и Культегин делили властьКомпания DeepSeek начала 2026 год с новым подходом к обучению больших ИИ-моделей. Метод называется «гиперсвязь, ограниченная многообразием» (manifold-constrained hyperconnection, mHC) и помогает сделать процесс обучения более стабильным, пишет El.kz со ссылкой на Gizmochina.
Главная идея – уменьшить сбои, которые часто происходят при обучении продвинутых моделей. Такие сбои приводят к потере времени, энергии и ресурсов. Новый метод повышает предсказуемость работы моделей, снижая риск дорогостоящих перезапусков.
Хотя mHC не экономит энергию напрямую, он помогает эффективнее использовать ресурсы, сокращая потери из-за сбоев и необходимости многократного обучения. Кроме того, стабильность позволяет уменьшить зависимость от масштабного «наращивания» вычислительных мощностей, что также снижает общие затраты.
El.kz также сообщал о том, что китайский ИИ DeepseekMath-V2 обошёл людей на олимпиадах по математике.
5 Июня, 11:58
Братская любовь: как правители Тюркского каганата Бильге и Культегин делили власть5 Июня, 09:02
Как одевались модницы Золотой Орды: шёлк, бокка и золото степной аристократии4 Июня, 09:08
В Алатау дроны будут доставлять людям посылки3 Июня, 12:22
Как получить участок под ЛПХ в Казахстане в 2026 году