Блог практикующих ML и DS инженеров с уклоном в NLP. От простого до сложного.
Методические рекомендации по созданию ТЗ на разметку данных
Оглавление статьи
Законы масштабирования больших языковых моделей - эмпирические законы оптимальности и вычислительного бюджета
В машинном обучении закон масштабирования нейронных сетей — это эмпирический (выявленный опытным путем) закон масштабирования, который описывает, как изменяется производительность нейронно...
Применение рейтинговой системы ELO для оценки языковых моделей (LLM)
Система ELO, изначально разработанная для шахмат, нашла применение и в области оценки больших языковых моделей (LLM). Этот подход позволяет сравнивать качество и способность нейросетевых архитектур решать пользовательские задачи...
LLM proxy с контролем лимитов по потокам и нагрузке
Написал небольшой минималистичный прокси-сервис обертку для подключения к Gigachat от Сбера https://github.com/mlnavigator/gigachat-proxy. Но в общем-то оно с минимальными усилиями переделывается в прокси с контролем для обращения к любому друг...