Трансформеры и LLM: от архитектуры до продакшна
Большие языковые модели давно перестали быть игрушкой для демонстраций. Их подключают к документам, внутренним базам знаний, корпоративным системам и продуктам. Но за удобным окном чата стоит инженерная система: токены, эмбеддинги, внимание, трансформерные блоки, дообучение, RAG, инференс, безопасность и мониторинг. Сергей Левченко объясняет устройство трансформеров и LLM без мистики и рекламного шума. Книга ведет читателя от архитектуры и токенизации до практического внедрения: prompting, SFT, LoRA/QLoRA, RAG на русскоязычных документах, оценка качества, защита от prompt injection, выбор модели, стоимость и production-контур. Это руководство для разработчиков, инженеров, технических руководителей и практиков, которым нужно не просто пользоваться ИИ, а понимать, как принимать решения, где система ломается и как проверять результат.










