Проектирование Автономных AI Агентов¶

Для программистов, желающих строить промышленные AI-агенты

Оглавление¶

Часть I: Основы¶

00. Предисловие — Как читать руководство, требования, что такое агент
01. Физика LLM — Токены, контекст, температура, детерминизм, вероятностная природа
02. Промптинг как Программирование — ICL, Few-Shot, CoT, структурирование задач, SOP

Часть II: Practice-first (собрать агента)¶

03. Инструменты и Function Calling — JSON Schema, валидация, обработка ошибок, контракт tool↔runtime
04. Автономность и Циклы — ReAct loop, остановка, анти-циклы, наблюдаемость
05. Безопасность и Human-in-the-Loop — Confirmation, Clarification, Risk Scoring, Prompt Injection
06. RAG и База Знаний — Чанкинг, Retrieval, Grounding, режимы поиска, лимиты
07. Multi-Agent Systems — Supervisor/Worker, изоляция контекста, маршрутизация задач
08. Evals и Надежность — Evals, регрессии промптов, метрики качества, тестовые датасеты

Часть III: Архитектура и Runtime Core¶

09. Анатомия Агента — Memory, Tools, Planning, Runtime
10. Planning и Workflow-паттерны — Plan→Execute, Plan-and-Revise, декомпозиция задач, DAG/workflow, условия остановки
11. State Management — Идемпотентность инструментов, retries с экспоненциальным backoff, дедлайны, persist state, возобновление задач
12. Системы Памяти Агента — Кратковременная/долговременная память, episodic/semantic память, забывание/TTL, верификация памяти, storage/retrieval
13. Context Engineering — Слои контекста, политики отбора фактов, саммаризация, бюджеты токенов, сборка контекста из state+memory+retrieval
14. Экосистема и Фреймворки — Выбор между собственным runtime и фреймворками, portability, избежание vendor lock-in

Часть IV: Практика (кейсы/практики)¶

15. Кейсы из Реальной Практики — Примеры агентов в разных доменах (DevOps, Support, Data, Security, Product)
16. Best Practices и Области Применения — Лучшие практики создания и поддержки агентов, области применения

Часть V: Инфраструктура/безопасность платформы¶

17. Security и Governance — Threat modeling, risk scoring, защита от prompt injection (канон), sandboxing инструментов, allowlists, policy-as-code, RBAC, dry-run режимы, аудит
18. Протоколы Инструментов и Tool Servers — Контракт tool↔runtime на уровне процесса/сервиса, версионирование схем, authn/authz

Часть VI: Прод-готовность¶

19. Observability и Tracing — Структурированное логирование, трейсинг agent runs и tool calls, метрики, кореляция логов
20. Cost & Latency Engineering — Бюджеты токенов, лимиты итераций, кэширование, fallback-модели, батчинг, таймауты
21. Workflow и State Management в продакшене — Очереди и асинхронность, масштабирование, распределённое состояние
22. Prompt и Program Management — Версионирование промптов, промпт-регрессии через evals, конфиги и feature flags, A/B тестинг
23. Evals в CI/CD — Quality gates в CI/CD, версионирование датасетов, обработка flaky-кейсов, тесты на безопасность
24. Data и Privacy — Обнаружение и маскирование PII, защита секретов, redaction логов, хранение и TTL логов
25. Индекс Прод-готовности — Руководство по приоритизации (1 день / 1–2 недели) и быстрые ссылки на прод-темы

Приложения¶

Приложение: Справочники — Глоссарий, чек-листы, шаблоны SOP, таблицы решений, Capability Benchmark

Маршрут чтения¶

Для начинающих (рекомендуемый путь — practice-first)¶

Начните с Предисловия — узнайте, что такое агент и как работать с руководством
Изучите Физику LLM — фундамент для понимания всего остального
Освойте Промптинг — это основа работы с агентами
Соберите работающего агента:
- Инструменты и Function Calling — "руки" агента
- Автономность и Циклы — как агент работает в цикле
- Безопасность и Human-in-the-Loop — защита от опасных действий
Расширьте возможности:
- RAG и База Знаний — использование документации
- Multi-Agent Systems — команда специализированных агентов
- Evals и Надежность — тестирование агентов
Углубитесь в архитектуру:
- Анатомия Агента — компоненты и их взаимодействие
- Planning и Workflow-паттерны — планирование сложных задач
- State Management — надёжность выполнения
- Системы Памяти Агента — долговременная память
- Context Engineering — управление контекстом
Практикуйтесь: Проходите лабораторные работы параллельно с чтением глав

Для опытных программистов¶

Можете пропустить базовые главы и сразу перейти к:

Инструменты и Function Calling
Автономность и Циклы
Кейсы — для понимания реальных применений

Быстрый трек: Основные концепции за 10 минут¶

Если вы опытный разработчик и хотите быстро понять суть:

Что такое агент?
- Агент = LLM + Tools + Memory + Planning
- LLM — это "мозг", который принимает решения
- Tools — это "руки", которые выполняют действия
- Memory — это история и долговременное хранилище
- Planning — это способность разбить задачу на шаги

Как работает цикл агента?

While (задача не решена):
  1. Отправить историю в LLM
  2. Получить ответ (текст или tool_call)
  3. Если tool_call → выполнить инструмент → добавить результат в историю → повторить
  4. Если текст → показать пользователю и остановиться

Ключевые моменты:
- LLM не выполняет код. Она генерирует JSON с запросом на выполнение.
- Runtime (ваш код) выполняет реальные функции Go.
- LLM не "помнит" прошлое. Она видит его в messages[], который собирает Runtime.
- Temperature = 0 для детерминированного поведения агентов.

Минимальный пример:

// 1. Определяем инструмент
tools := []openai.Tool{{
    Function: &openai.FunctionDefinition{
        Name: "check_status",
        Description: "Check server status",
    },
}}

// 2. Запрос к модели
resp, _ := client.CreateChatCompletion(ctx, openai.ChatCompletionRequest{
    Model: "gpt-4o-mini",
    Messages: []openai.ChatCompletionMessage{
        {Role: "system", Content: "Ты DevOps инженер"},
        {Role: "user", Content: "Проверь статус сервера"},
    },
    Tools: tools,
})

// 3. Проверяем tool_call
if len(resp.Choices[0].Message.ToolCalls) > 0 {
    // 4. Выполняем инструмент (Runtime)
    result := checkStatus()
    // 5. Добавляем результат в историю
    messages = append(messages, openai.ChatCompletionMessage{
        Role: "tool",
        Content: result,
    })
    // 6. Отправляем обновленную историю обратно в модель
}

Что читать дальше:
- Глава 03: Инструменты — детальный протокол
- Глава 04: Автономность — цикл агента
- Глава 09: Анатомия Агента — архитектура

После завершения основного курса¶

После изучения глав 1-16 переходите к:

Часть V: Инфраструктура/безопасность платформы — security, governance, протоколы инструментов
Часть VI: Прод-готовность — практическое руководство по прод-готовности с пошаговыми рецептами внедрения

Связь с лабораторными работами¶

Глава руководства	Соответствующие лабораторные работы
01. Физика LLM	Lab 00 (Capability Check)
02. Промптинг	Lab 01 (Basics)
03. Инструменты	Lab 02 (Tools), Lab 03 (Architecture)
04. Автономность	Lab 04 (Autonomy)
05. Безопасность	Lab 05 (Human-in-the-Loop)
02. Промптинг (SOP)	Lab 06 (Incident)
06. RAG	Lab 07 (RAG)
07. Multi-Agent	Lab 08 (Multi-Agent)
09. Анатомия Агента	Lab 01 (Basics), Lab 09 (Context Optimization)
10. Planning и Workflow-паттерны	Lab 10 (Planning & Workflow)
11. State Management	Lab 10 (Planning & Workflow) — частично
12. Системы Памяти Агента, 13. Context Engineering	Lab 11 (Memory & Context Engineering)
18. Протоколы Инструментов и Tool Servers	Lab 12 (Tool Server Protocol)
17. Security и Governance	Lab 13 (Agent Security Hardening) — Опционально
22. Prompt и Program Management	Lab 01 (Basics) — частично

Как пользоваться руководством¶

Читайте последовательно — каждая глава опирается на предыдущие
Практикуйтесь параллельно — после каждой главы выполняйте соответствующую лабораторную работу
Используйте как справочник — возвращайтесь к нужным разделам при работе над проектами
Изучайте примеры — в каждой главе есть примеры из разных доменов (DevOps, Support, Data, Security, Product)
Выполняйте упражнения — мини-упражнения в каждой главе помогают закрепить материал
Проверяйте себя — используйте чек-листы для самопроверки

Удачного обучения.