Учебник: Проектирование Автономных AI Агентов¶
Версия: 2.0
Автор: Кирилл Шваков
Для курса: AI Agent Course
Целевая аудитория: Программисты, желающие строить промышленные AI-агенты
Переводы¶
- Русский (RU) — Русская версия
- English (EN) — English version
📚 Оглавление¶
Часть I: Основы¶
- 00. Предисловие — Как читать учебник, требования, что такое агент
- 01. Физика LLM — Токены, контекст, температура, детерминизм, вероятностная природа
- 02. Промптинг как Программирование — ICL, Few-Shot, CoT, структурирование задач, SOP
Часть II: Practice-first (собрать агента)¶
- 03. Инструменты и Function Calling — JSON Schema, валидация, обработка ошибок, контракт tool↔runtime
- 04. Автономность и Циклы — ReAct loop, остановка, анти-циклы, наблюдаемость
- 05. Безопасность и Human-in-the-Loop — Confirmation, Clarification, Risk Scoring, Prompt Injection
- 06. RAG и База Знаний — Чанкинг, Retrieval, Grounding, режимы поиска, лимиты
- 07. Multi-Agent Systems — Supervisor/Worker, изоляция контекста, маршрутизация задач
- 08. Evals и Надежность — Evals, регрессии промптов, метрики качества, тестовые датасеты
Часть III: Архитектура и Runtime Core¶
- 09. Анатомия Агента — Memory, Tools, Planning, Runtime
- 10. Planning и Workflow-паттерны — Plan→Execute, Plan-and-Revise, декомпозиция задач, DAG/workflow, условия остановки
- 11. State Management — Идемпотентность инструментов, retries с экспоненциальным backoff, дедлайны, persist state, возобновление задач
- 12. Системы Памяти Агента — Кратковременная/долговременная память, episodic/semantic память, забывание/TTL, верификация памяти, storage/retrieval
- 13. Context Engineering — Слои контекста, политики отбора фактов, саммаризация, бюджеты токенов, сборка контекста из state+memory+retrieval
- 14. Экосистема и Фреймворки — Выбор между собственным runtime и фреймворками, portability, избежание vendor lock-in
Часть IV: Практика (кейсы/практики)¶
- 15. Кейсы из Реальной Практики — Примеры агентов в разных доменах (DevOps, Support, Data, Security, Product)
- 16. Best Practices и Области Применения — Лучшие практики создания и поддержки агентов, области применения
Часть V: Инфраструктура/безопасность платформы¶
- 17. Security и Governance — Threat modeling, risk scoring, защита от prompt injection (канон), sandboxing инструментов, allowlists, policy-as-code, RBAC, dry-run режимы, аудит
- 18. Протоколы Инструментов и Tool Servers — Контракт tool↔runtime на уровне процесса/сервиса, версионирование схем, authn/authz
Часть VI: Прод-готовность¶
- 19. Observability и Tracing — Структурированное логирование, трейсинг agent runs и tool calls, метрики, кореляция логов
- 20. Cost & Latency Engineering — Бюджеты токенов, лимиты итераций, кэширование, fallback-модели, батчинг, таймауты
- 21. Workflow и State Management в продакшене — Очереди и асинхронность, масштабирование, распределённое состояние
- 22. Prompt и Program Management — Версионирование промптов, промпт-регрессии через evals, конфиги и feature flags, A/B тестинг
- 23. Evals в CI/CD — Quality gates в CI/CD, версионирование датасетов, обработка flaky-кейсов, тесты на безопасность
- 24. Data и Privacy — Обнаружение и маскирование PII, защита секретов, redaction логов, хранение и TTL логов
- 25. Индекс Прод-готовности — Руководство по приоритизации (1 день / 1–2 недели) и быстрые ссылки на прод-темы
Приложения¶
- Приложение: Справочники — Глоссарий, чек-листы, шаблоны SOP, таблицы решений, Capability Benchmark
🗺️ Маршрут чтения¶
Для начинающих (рекомендуемый путь — practice-first)¶
- Начните с Предисловия — узнайте, что такое агент и как работать с учебником
- Изучите Физику LLM — фундамент для понимания всего остального
- Освойте Промптинг — это основа работы с агентами
- Соберите работающего агента:
- Инструменты и Function Calling — "руки" агента
- Автономность и Циклы — как агент работает в цикле
- Безопасность и Human-in-the-Loop — защита от опасных действий
- Расширьте возможности:
- RAG и База Знаний — использование документации
- Multi-Agent Systems — команда специализированных агентов
- Evals и Надежность — тестирование агентов
- Углубитесь в архитектуру:
- Анатомия Агента — компоненты и их взаимодействие
- Planning и Workflow-паттерны — планирование сложных задач
- State Management — надёжность выполнения
- Системы Памяти Агента — долговременная память
- Context Engineering — управление контекстом
- Практикуйтесь: Проходите лабораторные работы параллельно с чтением глав
Для опытных программистов¶
Можете пропустить базовые главы и сразу перейти к:
- Инструменты и Function Calling
- Автономность и Циклы
- Кейсы — для понимания реальных применений
Быстрый трек: Основные концепции за 10 минут¶
Если вы опытный разработчик и хотите быстро понять суть:
- Что такое агент?
- Агент = LLM + Tools + Memory + Planning
- LLM — это "мозг", который принимает решения
- Tools — это "руки", которые выполняют действия
- Memory — это история и долговременное хранилище
-
Planning — это способность разбить задачу на шаги
-
Как работает цикл агента?
-
Ключевые моменты:
- LLM не выполняет код. Она генерирует JSON с запросом на выполнение.
- Runtime (ваш код) выполняет реальные функции Go.
- LLM не "помнит" прошлое. Она видит его в
messages[], который собирает Runtime. -
Temperature = 0 для детерминированного поведения агентов.
-
Минимальный пример:
// 1. Определяем инструмент tools := []openai.Tool{{ Function: &openai.FunctionDefinition{ Name: "check_status", Description: "Check server status", }, }} // 2. Запрос к модели resp, _ := client.CreateChatCompletion(ctx, openai.ChatCompletionRequest{ Model: openai.GPT3Dot5Turbo, Messages: []openai.ChatCompletionMessage{ {Role: "system", Content: "Ты DevOps инженер"}, {Role: "user", Content: "Проверь статус сервера"}, }, Tools: tools, }) // 3. Проверяем tool_call if len(resp.Choices[0].Message.ToolCalls) > 0 { // 4. Выполняем инструмент (Runtime) result := checkStatus() // 5. Добавляем результат в историю messages = append(messages, openai.ChatCompletionMessage{ Role: "tool", Content: result, }) // 6. Отправляем обновленную историю обратно в модель } -
Что читать дальше:
- Глава 03: Инструменты — детальный протокол
- Глава 04: Автономность — цикл агента
- Глава 09: Анатомия Агента — архитектура
После завершения основного курса¶
После изучения глав 1-16 переходите к:
- Часть V: Инфраструктура/безопасность платформы — security, governance, протоколы инструментов
- Часть VI: Прод-готовность — практическое руководство по прод-готовности с пошаговыми рецептами внедрения
🔗 Связь с лабораторными работами¶
| Глава учебника | Соответствующие лабораторные работы |
|---|---|
| 01. Физика LLM | Lab 00 (Capability Check) |
| 02. Промптинг | Lab 01 (Basics) |
| 03. Инструменты | Lab 02 (Tools), Lab 03 (Architecture) |
| 04. Автономность | Lab 04 (Autonomy) |
| 05. Безопасность | Lab 05 (Human-in-the-Loop) |
| 02. Промптинг (SOP) | Lab 06 (Incident) |
| 06. RAG | Lab 07 (RAG) |
| 07. Multi-Agent | Lab 08 (Multi-Agent) |
| 09. Анатомия Агента | Lab 01 (Basics), Lab 09 (Context Optimization) |
| 10. Planning и Workflow-паттерны | Lab 10 (Planning & Workflow) |
| 11. State Management | Lab 10 (Planning & Workflow) — частично |
| 12. Системы Памяти Агента, 13. Context Engineering | Lab 11 (Memory & Context Engineering) |
| 18. Протоколы Инструментов и Tool Servers | Lab 12 (Tool Server Protocol) |
| 17. Security и Governance | Lab 13 (Agent Security Hardening) — Опционально |
| 22. Prompt и Program Management | Lab 01 (Basics) — частично |
| 23. Evals в CI/CD | Lab 14 (Evals in CI) — Опционально |
📖 Как пользоваться учебником¶
- Читайте последовательно — каждая глава опирается на предыдущие
- Практикуйтесь параллельно — после каждой главы выполняйте соответствующую лабораторную работу
- Используйте как справочник — возвращайтесь к нужным разделам при работе над проектами
- Изучайте примеры — в каждой главе есть примеры из разных доменов (DevOps, Support, Data, Security, Product)
- Выполняйте упражнения — мини-упражнения в каждой главе помогают закрепить материал
- Проверяйте себя — используйте чек-листы для самопроверки
Удачного обучения! 🚀