Учебник
Удобное оглавление по самым важным материалам блога.
Насколько можем, даем систематическое представление о предмете.
Вводные материалы
Продвинутые материалы
- Что такое рейтинг ELO для LLM и какая модель самая сильная?
 
- Подключаемся к любым LLM из России без VPN через OpenRouter.ai
 
- Делаем прокси балансировщик для подключения к LLM, чтобы клиенты не толкались и не получать отбивку от внешнего АПИ по лимитам
 
- Методические рекомендации по подготовке обучающих и тестовых даных в NLP
 
- BLEU, ROUGE, BERT-score - блеу, руж, берт-скор - метрики качества перевода и перефразировок в NLP
 
- LLM instruction tuning - инструктивное обучение
 
- Stanford Alpaca и Self-instruct - генерация синтетических текстовых инструкций
 
- Medprompt - Могут ли универсальные базовые модели превзойти специализированные только за счет промптинга? На примере медицины
 
- Законы масштабирования нейросетей - LLM и Chinchilla scaling laws
 
- Модели рассуждения. Обзор до выхода DeepSeek-R1
 
- Reinforcement Learning в обучении LLM - PPO, DPO, GRPO - что это?
 
- Что такое LangGraph и как им пользоваться. Видеоурок на 50 минут
 
- Что такое VLM - visual language models (Модели языка и зрения)
 
- Пример работы с VLM qwen2.5-vl-72b-instruct через сервис OpenRouter
 
- Нейронные сети для редактирования изображений: удаление объектов и замена фона
 
- Какие модели поддерживает для запуска VLLM
 
- Что такое Model Context Protocol (MCP) и зачем он нужен? 
 
- Анализ API v1/responses в OpenAI и VLLM - как генрировать ответы, вызывать функции, работать с Responses API
 
- Введение в квантование LLM - базовое квантование в 16 и 8 бит
 
- GPTQ - Generalized Post-Training Quantization
 
- AWQ (Activation-Aware Weight Quantization) и его отличия от GPTQ квантования LLM
 
- llama.cpp и GGUF - как использовать llama.cpp для локального запуска моделей LLaMA
 
- Формат GGUF: структура, использование и виды квантования
 
Профессиональные материалы
Code generation - plp