Как устроен искусственный интеллект: 7 слоёв стека от розетки до этики
Большинство людей представляют ИИ как магический чертёж: вводишь запрос на английском — получаешь ответ на русском. За этим ощущением «чуда» скрывается один из самых сложных технологических стеков в истории человечества. Каждый его слой зависит от предыдущего, и слабое звено в любом из них — и вся конструкция трещит по швам.
Разбираем 7 слоёв, из которых состоит современный ИИ — от электростанций до философских дилемм.
Слой 1: Энергия — от розетки до электростанции
Прежде чем ИИ начнёт генерировать тексты или рисовать картинки, ему нужно что-то включить. И это «что-то» — электричество, причём в огромных количествах.
Обучение одной большой языковой модели (LLM) потребляет столько энергии, сколько потребляет небольшой город. Например, тренировка GPT-3 обошлась примерно в 1,285 MWh — это как если бы 120 домохозяйств жили в течение целого года.
Дата-центры Google, Microsoft и Amazon уже сейчас потребляют столько же электричества, сколько целые страны. И это только начало — с ростом популярности ИИ спрос на энергию будет только увеличиваться.
Слой 2: Железо — GPU, TPU и специализированные чипы
Электричество — это топливо, но ему нужна машина, которая это топливо превращает в вычисления. Эта машина — графический процессор (GPU).
Первоначально GPU создавались для видеоигр: обрабатывать миллионы пикселей в секунду — сложная задача, требующая параллельных вычислений. Как раз то, что нужно для нейросетей.
| Чип | Производитель | Для чего |
|---|---|---|
| H100 | NVIDIA | Обучение больших моделей |
| A100 | NVIDIA | Тренировка и инференс |
| TPU v5 | Собственные модели Google | |
| Trainium2 | Amazon | AWS-инфраструктура |
NVIDIA доминирует на рынке: 80-90% всех GPU для ИИ — это их продукция. Один сервер с H100 стоит около $35 000, а дата-центр из 10 000 таких серверов — это $350 миллионов инвестиций.
Но NVIDIA не единственная. Google разрабатывает TPU (Tensor Processing Unit) специально для своих нейросетей, Amazon — Trainium для AWS, а стартапы вроде Cerebras и SambaNova делают чипы, которые вообще отказываются от классической архитектуры GPU.
Слой 3: Инфраструктура — дата-центры и сеть
Даже самый мощный чип бесполезен без инфраструктуры, которая его окружает. Дата-центр для ИИ — это не просто комната с серверами.
Это:
- Системы охлаждения, которые потребляют до 40% всей энергии центра
- Высокоскоростные сети (InfiniBand, Ethernet 400Gbps) для связи между тысячами GPU
- Хранилища данных, способные обрабатывать терабайты информации в секунду
- Резервные источники питания — дизель-генераторы и батареи на случай отключения

Google, Amazon и Microsoft строят дата-центры площадью в сотни гектаров. Один такой центр может содержать более 500 000 серверов и потреблять до 1 гигаватта электроэнергии — это как целый город.
Слой 4: Данные — топливо для ИИ
Самые мощные чипы и лучшие алгоритмы бесполезны без данных. Нейросеть обучается на данных — как ребёнок учится говорить, слушая родителей.
Современные LLM обучаются на триллионах токенов — это примерно 10-20 терабайт текстовой информации: книги, статьи, код, обсуждения на форумах, научные публикации.
Качество данных критически важно. «Мусор на входе — мусор на выходе». Поэтому компании тратят миллионы на:
- Сбор данных — веб-скрейпинг, API, партнёрства с издательствами
- Очистку — удаление дублей, спама, некачественного контента
- Разметку — ручная или автоматическая пометка данных для обучения
- Синтетические данные — генерация искусственных данных для обучения специфическим задачам
Одна из главных проблем ИИ-индустрии — исчерпание качественных данных для обучения. К 2026 году большая часть открытого интернета будет использована для обучения моделей. Это заставляет компании искать новые источники: платные базы данных, синтетические данные, специализированные корпоративные корпуса.
Слой 5: Алгоритмы — мозг ИИ
Данные — это топливо, но алгоритмы — это двигатель. Именно алгоритмы превращают сырые числа в интеллект.
За последние 10 лет произошло несколько революций:
- Трансформеры (2017) — архитектура, которая легла в основу GPT, BERT и всех современных LLM. Механизм внимания (attention) позволил моделям «понимать» контекст длинных текстов.
- RLHF (2022) — обучение с подкреплением на основе обратной связи человека. Именно благодаря RLHF ChatGPT стал так хорошо разговаривать — его научили отвечать так, как люди считают правильным.
- Диффузионные модели (2020-2022) — алгоритмы для генерации изображений. Принцип: начать с шума и постепенно «вычищать» его, пока не появится осмысленная картинка.
- Mixture of Experts (MoE) — архитектура, где разные части нейросети специализируются на разных задачах. Это позволяет создавать огромные модели, которые при этом работают быстро.
Каждый новый алгоритм открывает двери для новых применений. Трансформеры породили LLM, диффузионные модели — Midjourney и DALL-E, а RLHF сделал чат-ботов по-настоящему полезными.
«Трансформер — это как изобретение колеса для нейросетей. Всё, что мы видим сейчас — LLM, генерация изображений, агенты — построено на этой одной архитектуре.»
— Андрес Карпати, сооснователь Scale AI
Слой 6: Применение — от чат-бота до автономных агентов
Все предыдущие слои — это фундамент. Слой применения — это то, что мы видим каждый день: чат-боты, генераторы изображений, голосовые помощники, автономные агенты.
Основные направления применения ИИ в 2025-2026 годах:
| Направление | Примеры | Рынок |
|---|---|---|
| Генерация текста | ChatGPT, Claude, Gemini | $30 млрд к 2027 |
| Генерация изображений | Midjourney, DALL-E, Stable Diffusion | $15 млрд к 2027 |
| Голосовые ассистенты | Siri, Alexa, Google Assistant | $40 млрд к 2027 |
| Автономные агенты | Devin, AutoGPT, CrewAI | $50 млрд к 2028 |
| Компьютерное зрение | Медицинская диагностика, автономные авто | $60 млрд к 2027 |
Самое интересное направление — автономные ИИ-агенты. Это программы, которые не просто отвечают на запросы, а самостоятельно планируют и выполняют сложные задачи: от написания кода до управления серверами.
По прогнозам Gartner, к 2026 году 80% компаний будут использовать ИИ-агентов для автоматизации бизнес-процессов. Это не просто чат-боты — это полноценные «сотрудники» в цифровом формате.
Слой 7: Этика — самый сложный вопрос
Последний, но не по важности слой — этика и безопасность. Чем мощнее становится ИИ, тем больше вопросов он порождает.
Ключевые этические проблемы:
- Предвзятость (bias) — модели учатся на данных, созданных людьми, а люди предвзяты. ИИ может воспроизводить и усиливать стереотипы
- Дезинформация — генерация реалистичных фейковых текстов, изображений и видео
- Конфиденциальность — модели могут запоминать и выдавать персональные данные из обучающей выборки
- Занятость — автоматизация заменяет миллионы рабочих мест, от переводчиков до программистов
- Регулирование — как законодательно ограничить ИИ, не убив инновации?
Европейский Союз уже принял AI Act — первый в мире комплексный закон об ИИ. США разрабатывают собственные стандарты. Китай использует ИИ для социального контроля. И ни одна страна ещё не нашла идеальный баланс между безопасностью и свободой развития.
❓ Часто задаваемые вопросы
Сколько стоит запустить свою ИИ-модель?
Обучение большой модели с нуля стоит от $10 до $100 миллионов. Но использовать готовую модель через API — от $0.001 до $0.01 за запрос. Для большинства задач достаточно API-доступа, а не собственного обучения.
Может ли ИИ заменить программистов?
ИИ уже пишет код — GitHub Copilot генерирует до 40% строк в некоторых проектах. Но полная замена маловероятна: ИИ хорош для шаблонных задач, но архитектурные решения и сложные интеграции пока требуют человеческого опыта.
Что такое «инференс» в ИИ?
Инференс — это процесс, когда обученная модель работает с новыми данными. Если обучение — это «учёба», то инференс — это «экзамен». Именно инференс происходит, когда вы отправляете запрос в ChatGPT и получаете ответ.
Какой язык программирования нужен для ИИ?
Python — абсолютный лидер в ИИ-разработке. 90% всех библиотек для машинного обучения написаны на Python. Но для оптимизации и высокопроизводительных вычислений используют C++ и CUDA.
Безопасен ли ИИ?
Как и любая технология, ИИ — инструмент. Он может быть использован как во благо, так и во вред. Ключевой вопрос — не в самом ИИ, а в том, как мы его регулируем и контролируем. Большинство компаний сейчас инвестируют в «безопасный ИИ» (AI safety).
