108+ терминов по искусственному интеллекту и машинному обучению
Коротко о разделе
Глоссарий AI — это словарь терминов по искусственному интеллекту и машинному обучению с понятными определениями на русском языке. Термины сгруппированы по категориям и снабжены навигацией по алфавиту.
Раздел поможет быстро разобраться в незнакомых понятиях — от LLM и токенов до RAG и fine-tuning — студентам, специалистам и всем, кто изучает AI.
108 терминов
Протокол прямой коммуникации между AI-агентами. Позволяет агентам делегировать задачи, обмениваться результатами и совместно решать сложные проблемы.
AI-системы, способные автономно планировать и выполнять многошаговые задачи: используют инструменты, принимают решения, запрашивают информацию.
Гипотетический AI с человеческим уровнем интеллекта во всех областях. OpenAI, Anthropic, DeepMind работают над AGI-безопасностью. Consensus: 5-15 лет.
Инструмент для помощи программистам: автодополнение, генерация кода, code review, объяснение кода. Примеры: GitHub Copilot, Cursor, Codeium, Claude Code.
Процесс расширения доступа к AI-технологиям: снижение цен API, open-source модели, no-code инструменты. Позволяет малому бизнесу конкурировать с корпорациями.
Возврат инвестиций от внедрения AI. Включает прямую экономию (автоматизация), ускорение процессов, новые возможности. Типичный ROI автоматизации: 200-400%.
Область исследований, направленная на создание безопасных и надёжных AI-систем. Включает техническую безопасность, alignment и governance.
Система, где LLM автономно планирует и выполняет многошаговые задачи: вызывает инструменты, использует память, принимает решения. Claude Code, AutoGPT — примеры агентов.
Интерфейс для взаимодействия программ. AI API (OpenAI, Anthropic, Google) позволяют интегрировать LLM в любые продукты через HTTP-запросы.
Bidirectional Encoder Representations from Transformers — модель Google (2018). Первая мощная модель на трансформерах для понимания текста. Предшественник современных LLM.
Техника промптинга: просим модель 'думать вслух', объясняя шаги рассуждения перед ответом. Значительно улучшает качество на сложных задачах.
Флагманский AI-ассистент OpenAI на базе GPT-4o. Самый популярный AI-продукт в мире с более 100 млн еженедельных пользователей.
AI-ассистент от Anthropic. Лидирует в следовании инструкциям, длинном контексте (200k), безопасности и анализе документов. Линейка: Haiku, Sonnet, Opus.
Метод Anthropic для безопасного обучения AI: модель оценивает свои ответы по набору принципов ('конституции') и итеративно улучшает их.
Модель взаимодействия с AI, где система предлагает действия, а человек принимает или отклоняет их. Противоположность fully autonomous agent.
AI-IDE (редактор кода) с нативной интеграцией LLM. Лидирующий инструмент для vibe coding и AI-assisted разработки. Основан на VS Code.
Эффект маховика данных: больше пользователей → больше данных → лучше модель → больше пользователей. Мощное конкурентное преимущество AI-продуктов.
Direct Preference Optimization — более стабильная альтернатива RLHF. Обучает модель напрямую на данных предпочтений без отдельной модели вознаграждения.
Обучение модели выполнять задачу через несколько примеров в промпте (1-10 примеров). Не требует дообучения — модель обобщает паттерн из примеров.
Архитектура из двух сетей: генератор создаёт данные, дискриминатор отличает реальное от фейка. Предшественник диффузионных моделей в генерации изображений.
Мультимодальная LLM от Google DeepMind. Линейка: Flash (быстрый), Pro (баланс), Ultra (мощный). Глубокая интеграция с Google Workspace.
Серия авторегрессионных языковых моделей OpenAI. GPT-1 (2018) → GPT-4o (2024) — эволюция, изменившая индустрию AI. Основа ChatGPT.
Техники обхода защитных ограничений AI-модели с помощью специальных промптов. Серьёзная угроза безопасности AI-продуктов.
Оптимизация инференса: кэширование промежуточных вычислений (Key-Value) для уже обработанных токенов. Значительно ускоряет генерацию и снижает стоимость.
Large Language Model — большая языковая модель, нейросеть обученная на огромных объёмах текста. Основа ChatGPT, Claude, Gemini и других AI-ассистентов.
Low-Rank Adaptation — эффективный метод дообучения LLM. Замораживает большинство весов и добавляет небольшие обучаемые матрицы. Дёшево и быстро, работает на потребительских GPU.
Открытый протокол от Anthropic для подключения AI-моделей к внешним источникам данных и инструментам. Стандартизирует интеграцию агентов с сервисами.
Архитектура, где модель активирует только подмножество 'экспертных' слоёв для каждого токена. Позволяет масштабировать параметры без пропорционального роста вычислений. Используется в GPT-4, Mixtral.
Раздел AI для работы с текстом: понимание, генерация, перевод, классификация. LLM — современный пик NLP, объединяющий все задачи в одну модель.
AI-модели с открытым исходным кодом и весами. Llama 3, Mistral, Qwen, Gemma — лидеры. Позволяют запускать модели локально и дообучать без ограничений.
Дисциплина написания эффективных инструкций для LLM. Включает техники: chain-of-thought, few-shot, ролевые инструкции, структурированный вывод.
Атака на AI-агентов: вредоносные инструкции, встроенные в обрабатываемый контент (сайты, документы), перехватывают управление агентом.
Retrieval-Augmented Generation — дополнение LLM базой знаний: сначала ищем релевантные документы в векторной БД, затем передаём их в контекст модели. Снижает галлюцинации.
Систематическое тестирование AI-систем на уязвимости: попытки обхода защит, поиск вредоносных сценариев, оценка рисков. Обязательная практика перед выпуском модели.
Reinforcement Learning from Human Feedback — обучение с подкреплением на основе человеческих оценок. Ключевой метод выравнивания моделей (ChatGPT, Claude). Люди оценивают пары ответов, модель обучается предпочтениям.
Автоматизация через имитацию действий пользователя в интерфейсах: клики, заполнение форм, копирование данных. AI расширяет RPA интеллектуальными решениями.
Способность LLM вызывать внешние функции и API: поиск, калькулятор, браузер, БД. Ключевая возможность для создания AI-агентов.
Параметр семплирования: модель выбирает из набора токенов, чья суммарная вероятность равна P. Top-P=0.9 означает выбор из 'ядра' вероятности 90%.
Подход к разработке, при котором AI генерирует большую часть кода по описанию на естественном языке. Демократизирует программирование для non-разработчиков.
Выполнение задачи без примеров в промпте — только инструкция. Мощные модели справляются с большинством задач в zero-shot режиме.
Замена ручного труда технологиями для выполнения повторяемых задач. AI-автоматизация выходит за рамки скриптов: системы адаптируются к нестандартным ситуациям.
Процесс наделения AI-систем способностью принимать решения без участия человека. Уровни автономности: от A1 (предложения) до A5 (полная автономия).
AI-система, способная самостоятельно выполнять длительные задачи без пошагового участия человека: планирует, действует, проверяет результат, корректирует.
Автоматизированная цепочка задач, выполняемая AI-агентом: планирование, вызов инструментов, проверка результатов, итерация. Основа автономного бизнеса.
Лёгкий модуль, добавляемый к предобученной модели для специализации. Обучается только адаптер — основная модель заморожена. Схоже с LoRA по концепции.
Набор чётких инструкций для решения задачи. В контексте AI: правила обучения, оптимизации и инференса нейронных сетей. Основа любой ML-системы.
Структурированное хранилище информации, которое AI-системы используют для ответов на вопросы. В RAG-системах — векторная БД с документами компании.
Стандартизированный тест для оценки AI-моделей. MMLU, HumanEval, MATH, GSM8K — популярные бенчмарки. Высокий балл не гарантирует практическую пользу.
Повторяемая последовательность действий, приводящая к бизнес-результату. AI-агенты способны автоматизировать целые бизнес-процессы от запроса до результата.
Механизм уведомления: сервер отправляет HTTP-запрос при наступлении события. Используется для интеграции AI-агентов с внешними системами и автоматизации.
База данных, оптимизированная для хранения и поиска по эмбеддингам. Ключевой компонент RAG-систем. Примеры: Pinecone, Weaviate, Chroma, pgvector.
AI-программа, выполняющая задачи по инструкциям пользователя. Эволюция от Siri/Alexa к LLM-ассистентам (Claude, ChatGPT) с возможностью рассуждения.
Задача создания AI-систем, действия которых соответствуют намерениям и ценностям людей. Одна из ключевых проблем безопасности AI.
Генерация AI уверенных, но ложных утверждений. Модель 'выдумывает' факты, источники или данные, которых не существует. Главный риск LLM.
Стратегия автоматизации всего возможного в организации: RPA + AI + ML + аналитика. Термин Gartner для описания максимальной автоматизации бизнеса.
Подраздел ML, использующий многослойные нейронные сети. Произвёл революцию в распознавании речи, изображений и обработке языка начиная с 2012 года.
Привязка ответов модели к реальным данным и источникам. RAG — основной метод граундинга. Снижает галлюцинации и повышает фактическую точность.
Сеть сущностей и их отношений. Google Knowledge Graph, Wikidata — примеры. Дополняет LLM структурированными фактами для снижения галлюцинаций.
Класс генеративных моделей, обучающихся восстанавливать данные из шума. Основа DALL-E 3, Stable Diffusion, Midjourney. Революционизировали генерацию изображений.
Синоним контекстного окна — максимальное количество токенов, которое модель принимает за раз. Gemini 1.5 установила рекорд 1M+ токенов.
Адаптация предобученной модели на специфическом наборе данных. Позволяет специализировать LLM для конкретных задач или домена. Методы: SFT, RLHF, DPO, LoRA.
Способность понять внутренние механизмы AI: почему модель дала тот или иной ответ. Anthropic Mechanistic Interpretability — лидер исследований.
Процесс применения обученной модели для генерации ответов. Противоположность обучению. Большую часть затрат AI-продуктов составляет именно инференс.
Сжатие модели путём уменьшения точности весов (например, с float32 до int4). Снижает требования к памяти и ускоряет инференс с минимальной потерей качества.
Автоматизация задач, требующих понимания, суждения и обучения — в отличие от простой RPA. AI читает контекст, распознаёт исключения, принимает решения.
Деградация качества моделей, обученных на данных, сгенерированных другими AI. Риск при масштабировании синтетических данных без контроля качества.
Раздел AI для анализа изображений и видео: классификация, детекция объектов, сегментация, OCR. Интегрируется в мультимодальные LLM.
Максимальный объём текста (в токенах), который модель может обработать за один раз. Claude обрабатывает до 200k токенов, GPT-4o — до 128k.
Время до получения первого токена (TTFT — Time to First Token). Ключевая метрика UX для AI-продуктов. Зависит от провайдера, размера модели, нагрузки.
Ключевой компонент трансформеров: позволяет модели фокусироваться на наиболее релевантных частях входного текста при генерации каждого следующего токена.
Архитектура, где несколько AI-агентов взаимодействуют для решения сложных задач: специализированные роли, параллельная работа, оркестрация.
Способность AI-модели работать с несколькими типами данных: текст, изображения, аудио, видео. GPT-4o, Claude 3 и Gemini — мультимодальные модели.
Вычислительная модель, вдохновлённая биологическим мозгом: слои взаимосвязанных узлов (нейронов). Основа современного ML и всех LLM.
Адаптация LLM к новой задаче через примеры в промпте — без изменения весов. Few-shot и zero-shot — варианты ICL. Уникальная способность больших моделей.
Агент учится через взаимодействие со средой: получает награды за правильные действия. RLHF использует RL для выравнивания LLM по предпочтениям людей.
Обучение модели на размеченных данных (вход-выход). Классика ML: классификация спама, распознавание изображений. В LLM — этап fine-tuning на парах вопрос-ответ.
Управление командой AI-агентов: распределение задач, обмен результатами, разрешение конфликтов. Фреймворки: LangGraph, AutoGen, CrewAI.
Настраиваемое числовое значение (вес) нейросети, оптимизируемое в процессе обучения. GPT-4 ~1.8T параметров, Llama 3 70B — 70 млрд параметров.
Модель 'запоминает' обучающие данные вместо обобщения паттернов. Хорошо работает на train, плохо на test. Решается регуляризацией, dropout, больше данных.
Информация о позиции токена в последовательности, добавляемая к эмбеддингу. Трансформеры без него не знают порядок слов. RoPE — популярный современный метод.
Систематические ошибки AI-систем из-за предвзятости обучающих данных. Проявляется в дискриминации по полу, расе, возрасту. Ключевая проблема AI-этики.
Использование ML для предсказания будущих событий на основе исторических данных. Прогнозирование оттока клиентов, спроса, отказов оборудования.
Первый этап создания LLM: обучение на огромном корпусе текста (триллионы токенов) с задачей предсказания следующего токена. Самый дорогой этап.
Запрос или инструкция, которую пользователь передаёт AI-модели. Качество промпта напрямую влияет на качество ответа — отсюда дисциплина Prompt Engineering.
Количество токенов в секунду, которое модель генерирует. Важна для batch-обработки и высоконагруженных систем.
Способность AI логически решать многошаговые задачи. o1, o3, Claude 3.7 Sonnet — модели с расширенным reasoning через 'думание вслух' перед ответом.
Компонент RAG-системы, ищущий релевантные документы в базе знаний. Типы: sparse (BM25), dense (embeddings), hybrid. Качество ретривера определяет качество RAG.
Механизм в трансформере, где каждый токен 'смотрит' на все другие токены для вычисления контекста. Квадратичная сложность по длине последовательности.
Поиск по смыслу, а не ключевым словам. Используется в RAG-системах: запрос преобразуется в эмбеддинг и сравнивается с эмбеддингами документов.
Данные, сгенерированные AI-моделями для обучения других моделей. Позволяет масштабировать обучающие данные без дорогостоящей разметки людьми.
Инструкции для модели, задающие её роль, ограничения и контекст. Передаются до сообщений пользователя и не видны обычному пользователю продукта.
Методы уменьшения выдумывания фактов моделью: RAG, граундинг, temperature=0, верификация через внешние источники, citation enforcement.
Оптимизация инференса: маленькая модель предлагает токены, большая проверяет их параллельно. Ускоряет генерацию в 2-4x без потери качества.
Режим вывода, при котором токены отправляются клиенту по мере генерации (как при печати). Улучшает воспринимаемую задержку для пользователей.
Параметр генерации (0-2): контролирует случайность вывода. Температура 0 = детерминированный/точный ответ, 1+ = творческий/разнообразный.
Минимальная единица текста, которую обрабатывает LLM. Примерно 1 токен = 3/4 слова на английском, ~2 символа на русском. Стоимость API считается в токенах.
Процесс разбиения текста на токены (слова, подслова, символы) перед подачей в модель. BPE, WordPiece — популярные алгоритмы токенизации.
Комплексное изменение бизнеса через внедрение цифровых технологий и AI. Включает автоматизацию процессов, новые бизнес-модели и культурные изменения.
Архитектура нейросети, предложенная Google в 2017 году (статья 'Attention is All You Need'). Основа всех современных LLM. Использует механизм внимания для обработки текста.
Городская среда, использующая IoT, AI и данные для оптимизации инфраструктуры: трафик, энергопотребление, безопасность, муниципальные услуги.
Большая предобученная модель, которую можно адаптировать для множества задач. GPT-4o, Claude Opus, Gemini Ultra — примеры фундаментальных моделей.
Виртуальная копия физического объекта или процесса. AI-агенты управляют цифровыми двойниками заводов, зданий, транспортных сетей в реальном времени.
Программа для автоматизации текстового или голосового общения. Современные LLM-чатботы радикально превосходят скриптовые предшественники по гибкости.
Числовое представление текста (вектор) в многомерном пространстве. Семантически похожие тексты имеют близкие эмбеддинги. Основа векторных БД и RAG.
Неожиданные способности, появляющиеся у больших моделей, которых не было у меньших: рассуждение, аналогии, метапознание. Трудно предсказать заранее.
Текущий период технологического развития, характеризующийся массовым внедрением AI во все сферы. Начало — 2022 год с выходом ChatGPT.
Раздел прикладной этики, изучающий моральные вопросы создания и применения AI: справедливость, прозрачность, приватность, ответственность, безопасность.
Статистическая модель, оценивающая вероятности последовательностей слов. LLM — современные языковые модели с миллиардами параметров.