Некоторые технологии, которые используются в суперкомпьютерах Яндекса для создания нейросетевых моделей:
Распределённая система обучения. skyeng.ru Позволяет оптимизировать затраты на разработку и поддержание высокопроизводительных нейронных сетей. skyeng.ru
Континуальное обучение. skyeng.ru Технология позволяет моделям Яндекса постоянно совершенствоваться на основе новых данных без полного переобучения. skyeng.ru
Расширение парка графических ускорителей. skyeng.ru К 2025 году компания расширила свой парк графических ускорителей до 15 000 единиц, что позволило увеличить скорость обучения крупных моделей более чем в 2,5 раза по сравнению с показателями 2023 года. skyeng.ru
Yandex Neural Inference Platform. skyeng.ru Инфраструктурное решение, позволяющее эффективно развёртывать нейросетевые модели в производственной среде с минимальными задержками. skyeng.ru
Метод быстрого сжатия больших языковых моделей (LLM) HIGGS. yandex.ru Позволяет уменьшить размер модели, сохранив её качество, и запустить на более доступных устройствах. yandex.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.