База AI 20 апреля 2026 г. 12 мин чтения

50 терминов AI, которые стоит знать до первого внедрения

Короткий глоссарий FastAI: от токенов и RAG до агентов, guardrails и AGI. Поймите базовые термины до запуска AI-автоматизации.

Этот материал помогает быстро выровнять терминологию в команде. Если вы обсуждаете AI-агентов, автоматизацию продаж или интеграции, ниже собраны понятия, которые полезно понимать до старта проекта.

Глоссарий

50 базовых понятий, которые полезно понимать до обсуждения архитектуры, бюджета и сценариев внедрения.

Нейросеть Neural Network

Модель, вдохновлённая тем, как нейроны передают сигналы друг другу. Она учится на примерах и лежит в основе большинства современных AI-систем.

LLM Large Language Model

Большая языковая модель, натренированная на огромном массиве текста. Она предсказывает следующее слово настолько хорошо, что может вести диалог, писать тексты и анализировать документы.

Параметр Parameter

Числовой вес внутри модели, в котором зашито её поведение. Чем больше параметров, тем выше потенциальная сложность модели, но тем дороже её запуск.

Токен Token

Минимальная единица текста, с которой работает модель. Стоимость API, лимиты и контекстное окно почти всегда считаются именно в токенах.

Контекстное окно Context Window

Объём информации, который модель может удерживать в одной сессии. Если контекст переполнен, ранние части диалога или документа начинают выпадать.

Промпт Prompt

Инструкция или запрос, который вы отправляете модели. Чем лучше задан контекст, формат и цель, тем стабильнее будет результат.

Системный промпт System Prompt

Базовая инструкция, которая задаёт модели роль и рамки до начала диалога. Именно она определяет тон, ограничения и логику ответа по умолчанию.

Температура Temperature

Параметр, который регулирует степень вариативности ответа. Низкая температура делает ответы более предсказуемыми, высокая добавляет креативность и риск ошибок.

Галлюцинации Hallucinations

Случаи, когда модель уверенно придумывает неверные факты, ссылки или выводы. Поэтому критичные данные всегда требуют проверки внешним источником.

Обучение Training

Процесс, в котором модель проходит по огромному датасету и подстраивает свои параметры. Это самый дорогой и ресурсозатратный этап в создании большой модели.

Дообучение Fine-tuning

Дополнительное обучение уже готовой модели на узкой задаче или домене. Так модель лучше говорит в нужном тоне, понимает ваши категории и меньше ошибается в процессе.

RAG Retrieval-Augmented Generation

Подход, при котором модель сначала ищет нужные материалы во внешней базе знаний, а уже потом отвечает. Это уменьшает галлюцинации и даёт доступ к актуальным данным.

API Application Programming Interface

Способ подключить модель к продукту через код. Через API AI работает внутри CRM, сайта, мессенджера или внутренней панели, а не только в открытом чате.

Инференс Inference

Момент, когда модель применяет знания и генерирует ответ на ваш запрос. Именно за инференс вы обычно платите при использовании облачного API.

Мультимодальность Multimodality

Способность модели работать не только с текстом, но и с изображениями, аудио или видео. Это позволяет строить сценарии, где AI читает скриншоты, слушает голос и отвечает текстом.

Эмбеддинги Embeddings

Числовое представление текста или другого объекта в пространстве смыслов. На эмбеддингах строятся семантический поиск, рекомендации и RAG.

Открытые и закрытые модели Open-source vs Closed-source

Закрытые модели вы используете как сервис, а открытые можно скачать и запускать на своей инфраструктуре. Выбор зависит от требований к качеству, приватности и бюджету.

AI-агенты AI Agents

Системы, которые не только отвечают текстом, но и выполняют шаги: ищут данные, вызывают инструменты, обновляют CRM или передают задачу дальше. Это уже не просто чат, а рабочий исполнитель.

Цепочка рассуждений Chain of Thought

Подход, при котором модель разбивает сложную задачу на промежуточные шаги. Это особенно полезно для логики, расчётов и многоэтапного анализа.

Бенчмарк Benchmark

Стандартизированный тест, на котором сравнивают модели. Он помогает быстро понять общий уровень, но не заменяет проверку на ваших реальных сценариях.

Трансформер Transformer

Архитектура, на которой построены современные языковые модели. Её ключевая идея — механизм внимания, который помогает видеть связи между удалёнными частями текста.

Диффузионная модель Diffusion Model

Тип модели, который чаще всего используют для генерации изображений. Она учится постепенно восстанавливать картинку из шума, поэтому может создавать новые визуалы с нуля.

Предобучение Pre-training

Первый большой этап обучения, когда модель получает общие знания из огромного массива данных. После него модель уже многое знает, но ещё не настроена под конкретный продукт.

RLHF Reinforcement Learning from Human Feedback

Метод, в котором люди оценивают ответы модели, а система учится предпочитать более полезные и безопасные варианты. Он помогает сделать поведение модели ближе к ожиданиям пользователя.

Дистилляция Distillation

Перенос знаний из большой модели в более компактную. Так можно получить дешевле и быстрее работающую модель, сохранив заметную часть качества.

Квантизация Quantization

Сжатие модели за счёт использования менее точных чисел. Это уменьшает размер и ускоряет запуск, а потери качества часто остаются приемлемыми.

Латентное пространство Latent Space

Внутреннее представление данных внутри модели. В нём похожие по смыслу объекты оказываются ближе друг к другу, чем несвязанные.

Zero-shot и few-shot Few-shot / Zero-shot

Способ задать задачу без дополнительного обучения: либо совсем без примеров, либо с несколькими примерами прямо в промпте. Часто этого достаточно, чтобы модель уловила формат ответа.

Промпт-инжиниринг Prompt Engineering

Практика проектирования запросов так, чтобы модель отвечала точнее, короче или в нужной структуре. Это особенно важно, когда вы не хотите каждый раз чинить результат вручную.

Роль Role

Контекст, с которым модель читает сообщение: system, user или assistant. Понимание ролей помогает строить диалоги и продукты, где поведение модели остаётся предсказуемым.

Стоп-последовательность Stop Sequence

Специальный маркер, который говорит модели прекратить генерацию. Его используют, чтобы контролировать длину ответа или завершать вывод в правильной точке.

Стриминг Streaming

Режим, когда ответ приходит по кусочкам, а не целиком в конце. Он улучшает ощущение скорости и позволяет раньше начать обработку результата.

Вызов функций Function Calling / Tool Use

Механизм, который позволяет модели не только писать текст, но и просить систему вызвать конкретный инструмент. Так AI может искать данные, считать, обновлять записи и запускать внешние действия.

Обучение в контексте In-Context Learning

Способность модели улавливать паттерн прямо из текущего промпта без переобучения. Именно поэтому несколько хороших примеров часто меняют качество ответа сильнее, чем кажется.

Переобучение Overfitting

Ситуация, когда модель слишком запомнила обучающие данные и хуже справляется с новыми случаями. Это делает систему хрупкой вне привычного сценария.

Датасет Dataset

Набор данных, на котором модель обучают или проверяют. Качество датасета напрямую влияет на качество будущей системы.

Разметка данных Data Labeling

Ручная или полуавтоматическая маркировка данных, которая говорит модели, что в них важно. Без качественной разметки сложно получить устойчивый результат на прикладной задаче.

Токсичность Toxicity

Оскорбительный, опасный или нежелательный контент в ответах модели. Его стараются снижать через обучение, модерацию и внешние фильтры.

Защитные рамки Guardrails

Набор ограничений и проверок, которые удерживают систему в допустимых границах. Guardrails нужны, чтобы AI не нарушал политику, не уходил в опасные темы и не ломал процесс.

Джейлбрейк Jailbreak

Попытка обойти ограничения модели через хитрый запрос. Для продакшена это важный риск, который нужно учитывать при проектировании защитных слоёв.

Вектор Vector

Числовой массив, который представляет смысл объекта так, чтобы его можно было сравнивать математически. Векторы лежат в основе семантического поиска.

Векторная база данных Vector Database

Хранилище, оптимизированное под поиск похожих векторов. Именно оно помогает быстро находить релевантные куски знаний в RAG-системах.

Чанкинг Chunking

Разбиение длинного текста на небольшие фрагменты для индексации и подачи в модель. От качества чанкинга зависит, насколько полезный контекст получит система.

Пайплайн Pipeline

Цепочка последовательных шагов, через которые проходит задача или данные. В AI-продукте пайплайн связывает поиск, подготовку контекста, вызов модели и постобработку.

Оркестрация Orchestration

Управление несколькими шагами, агентами и инструментами как одной системой. Оркестрация отвечает за порядок действий, переключение контекста и сбор итогового результата.

Локальная модель Local Model

Модель, которую запускают на своей машине или сервере, а не через чужой облачный API. Это полезно для приватности, но требует собственной инфраструктуры и компромиссов по качеству.

GPU Graphics Processing Unit

Видеокарта, которая умеет параллельно выполнять огромное количество вычислений. Именно GPU обычно используют для обучения и быстрого запуска нейросетей.

Облачный AI Cloud AI

Использование модели как удалённого сервиса через интернет. Такой подход снимает с вас заботу об инфраструктуре, но привязывает к внешнему провайдеру и его тарифам.

AI-обёртка AI Wrapper

Продукт, который использует чужую модель через API и добавляет свой интерфейс, логику, данные и процесс. Именно так сегодня устроено множество прикладных AI-сервисов.

AGI Artificial General Intelligence

Гипотетический уровень AI, который смог бы решать широкий спектр интеллектуальных задач на уровне человека или выше. Сегодняшние модели сильны в отдельных классах задач, но до AGI ещё далеко.

FastAI

Хотите внедрить AI-агента без лишней теории?

Покажем, как переложить лидогенерацию, ответы клиентам и рутинные сценарии на AI-агента под ваш процесс.

Оставить заявку