Российский рынок LLM вырос качественно и количественно. В 2024–2025 году у разработчиков и бизнеса появился реальный выбор: от облачных API крупных корпораций до open-source моделей, которые можно дообучить под свою задачу. Разберём основных игроков.
Облачные решения
Флагманская модель Сбера. Обучена на большом русскоязычном корпусе, поддерживает работу с изображениями. Хорошо понимает бизнес-контекст, умеет работать с документами.
+ Плюсы
Лучший русский язык среди облачных. Поддержка Сбера. Большой контекст (128K). Функции (function calling).
− Минусы
Данные обрабатываются на серверах Сбера. Иногда избыточно осторожен. Цена выше конкурентов.
Экосистемное решение Яндекса. Хорошо интегрируется с Yandex Cloud, быстрый инференс. Отличный выбор если уже используете инфраструктуру Яндекса.
+ Плюсы
Высокая скорость. Глубокая интеграция с Yandex Cloud. Конкурентная цена. Хорошие embeddings.
− Минусы
Привязка к экосистеме Яндекса. Меньше гибкости по тонкой настройке.
Open-Source модели для локального развёртывания
Лучшая open-source русскоязычная модель. Дообучена на LLaMA/Mistral на качественном русском корпусе. Активно развивается, есть версии от 7B до 70B параметров.
+ Плюсы
Полностью локально. Лучший русский среди open-source. Бесплатно. Можно дообучить.
− Минусы
Нужна собственная инфраструктура. Требует GPU для быстрой работы. Меньше возможностей чем проприетарные модели.
Открытые модели от Сбера. Хороший baseline для русского языка, но уступает Saiga в диалоговых задачах. Подходит для специализированных задач с дообучением.
+ Плюсы
Официальная поддержка. Хорошая документация. Локально.
− Минусы
Слабее Saiga в диалоге. Менее активное развитие.
Мой рекомендуемый выбор по задачам
- Чат-бот для клиентов → GigaChat API (качество русского + поддержка)
- Анализ внутренних документов → Saiga-13B локально (данные не уходят)
- Генерация текста для маркетинга → YandexGPT (скорость + цена)
- Специализированная задача → Saiga с LoRA дообучением
- Прототип/MVP → GigaChat API (быстрый старт)
Я специализируюсь на развёртывании Saiga и интеграции с GigaChat/YandexGPT. Свяжитесь, если нужна помощь с выбором и внедрением.