50 терминов AI, которые стоит знать до первого внедрения
Короткий глоссарий FastAI: от токенов и RAG до агентов, guardrails и AGI. Поймите базовые термины до запуска AI-автоматизации.
Этот материал помогает быстро выровнять терминологию в команде. Если вы обсуждаете AI-агентов, автоматизацию продаж или интеграции, ниже собраны понятия, которые полезно понимать до старта проекта.
50 базовых понятий, которые полезно понимать до обсуждения архитектуры, бюджета и сценариев внедрения.
Нейросеть Neural Network
Модель, вдохновлённая тем, как нейроны передают сигналы друг другу. Она учится на примерах и лежит в основе большинства современных AI-систем.
LLM Large Language Model
Большая языковая модель, натренированная на огромном массиве текста. Она предсказывает следующее слово настолько хорошо, что может вести диалог, писать тексты и анализировать документы.
Параметр Parameter
Числовой вес внутри модели, в котором зашито её поведение. Чем больше параметров, тем выше потенциальная сложность модели, но тем дороже её запуск.
Токен Token
Минимальная единица текста, с которой работает модель. Стоимость API, лимиты и контекстное окно почти всегда считаются именно в токенах.
Контекстное окно Context Window
Объём информации, который модель может удерживать в одной сессии. Если контекст переполнен, ранние части диалога или документа начинают выпадать.
Промпт Prompt
Инструкция или запрос, который вы отправляете модели. Чем лучше задан контекст, формат и цель, тем стабильнее будет результат.
Системный промпт System Prompt
Базовая инструкция, которая задаёт модели роль и рамки до начала диалога. Именно она определяет тон, ограничения и логику ответа по умолчанию.
Температура Temperature
Параметр, который регулирует степень вариативности ответа. Низкая температура делает ответы более предсказуемыми, высокая добавляет креативность и риск ошибок.
Галлюцинации Hallucinations
Случаи, когда модель уверенно придумывает неверные факты, ссылки или выводы. Поэтому критичные данные всегда требуют проверки внешним источником.
Обучение Training
Процесс, в котором модель проходит по огромному датасету и подстраивает свои параметры. Это самый дорогой и ресурсозатратный этап в создании большой модели.
Дообучение Fine-tuning
Дополнительное обучение уже готовой модели на узкой задаче или домене. Так модель лучше говорит в нужном тоне, понимает ваши категории и меньше ошибается в процессе.
RAG Retrieval-Augmented Generation
Подход, при котором модель сначала ищет нужные материалы во внешней базе знаний, а уже потом отвечает. Это уменьшает галлюцинации и даёт доступ к актуальным данным.
API Application Programming Interface
Способ подключить модель к продукту через код. Через API AI работает внутри CRM, сайта, мессенджера или внутренней панели, а не только в открытом чате.
Инференс Inference
Момент, когда модель применяет знания и генерирует ответ на ваш запрос. Именно за инференс вы обычно платите при использовании облачного API.
Мультимодальность Multimodality
Способность модели работать не только с текстом, но и с изображениями, аудио или видео. Это позволяет строить сценарии, где AI читает скриншоты, слушает голос и отвечает текстом.
Эмбеддинги Embeddings
Числовое представление текста или другого объекта в пространстве смыслов. На эмбеддингах строятся семантический поиск, рекомендации и RAG.
Открытые и закрытые модели Open-source vs Closed-source
Закрытые модели вы используете как сервис, а открытые можно скачать и запускать на своей инфраструктуре. Выбор зависит от требований к качеству, приватности и бюджету.
AI-агенты AI Agents
Системы, которые не только отвечают текстом, но и выполняют шаги: ищут данные, вызывают инструменты, обновляют CRM или передают задачу дальше. Это уже не просто чат, а рабочий исполнитель.
Цепочка рассуждений Chain of Thought
Подход, при котором модель разбивает сложную задачу на промежуточные шаги. Это особенно полезно для логики, расчётов и многоэтапного анализа.
Бенчмарк Benchmark
Стандартизированный тест, на котором сравнивают модели. Он помогает быстро понять общий уровень, но не заменяет проверку на ваших реальных сценариях.
Трансформер Transformer
Архитектура, на которой построены современные языковые модели. Её ключевая идея — механизм внимания, который помогает видеть связи между удалёнными частями текста.
Диффузионная модель Diffusion Model
Тип модели, который чаще всего используют для генерации изображений. Она учится постепенно восстанавливать картинку из шума, поэтому может создавать новые визуалы с нуля.
Предобучение Pre-training
Первый большой этап обучения, когда модель получает общие знания из огромного массива данных. После него модель уже многое знает, но ещё не настроена под конкретный продукт.
RLHF Reinforcement Learning from Human Feedback
Метод, в котором люди оценивают ответы модели, а система учится предпочитать более полезные и безопасные варианты. Он помогает сделать поведение модели ближе к ожиданиям пользователя.
Дистилляция Distillation
Перенос знаний из большой модели в более компактную. Так можно получить дешевле и быстрее работающую модель, сохранив заметную часть качества.
Квантизация Quantization
Сжатие модели за счёт использования менее точных чисел. Это уменьшает размер и ускоряет запуск, а потери качества часто остаются приемлемыми.
Латентное пространство Latent Space
Внутреннее представление данных внутри модели. В нём похожие по смыслу объекты оказываются ближе друг к другу, чем несвязанные.
Zero-shot и few-shot Few-shot / Zero-shot
Способ задать задачу без дополнительного обучения: либо совсем без примеров, либо с несколькими примерами прямо в промпте. Часто этого достаточно, чтобы модель уловила формат ответа.
Промпт-инжиниринг Prompt Engineering
Практика проектирования запросов так, чтобы модель отвечала точнее, короче или в нужной структуре. Это особенно важно, когда вы не хотите каждый раз чинить результат вручную.
Роль Role
Контекст, с которым модель читает сообщение: system, user или assistant. Понимание ролей помогает строить диалоги и продукты, где поведение модели остаётся предсказуемым.
Стоп-последовательность Stop Sequence
Специальный маркер, который говорит модели прекратить генерацию. Его используют, чтобы контролировать длину ответа или завершать вывод в правильной точке.
Стриминг Streaming
Режим, когда ответ приходит по кусочкам, а не целиком в конце. Он улучшает ощущение скорости и позволяет раньше начать обработку результата.
Вызов функций Function Calling / Tool Use
Механизм, который позволяет модели не только писать текст, но и просить систему вызвать конкретный инструмент. Так AI может искать данные, считать, обновлять записи и запускать внешние действия.
Обучение в контексте In-Context Learning
Способность модели улавливать паттерн прямо из текущего промпта без переобучения. Именно поэтому несколько хороших примеров часто меняют качество ответа сильнее, чем кажется.
Переобучение Overfitting
Ситуация, когда модель слишком запомнила обучающие данные и хуже справляется с новыми случаями. Это делает систему хрупкой вне привычного сценария.
Датасет Dataset
Набор данных, на котором модель обучают или проверяют. Качество датасета напрямую влияет на качество будущей системы.
Разметка данных Data Labeling
Ручная или полуавтоматическая маркировка данных, которая говорит модели, что в них важно. Без качественной разметки сложно получить устойчивый результат на прикладной задаче.
Токсичность Toxicity
Оскорбительный, опасный или нежелательный контент в ответах модели. Его стараются снижать через обучение, модерацию и внешние фильтры.
Защитные рамки Guardrails
Набор ограничений и проверок, которые удерживают систему в допустимых границах. Guardrails нужны, чтобы AI не нарушал политику, не уходил в опасные темы и не ломал процесс.
Джейлбрейк Jailbreak
Попытка обойти ограничения модели через хитрый запрос. Для продакшена это важный риск, который нужно учитывать при проектировании защитных слоёв.
Вектор Vector
Числовой массив, который представляет смысл объекта так, чтобы его можно было сравнивать математически. Векторы лежат в основе семантического поиска.
Векторная база данных Vector Database
Хранилище, оптимизированное под поиск похожих векторов. Именно оно помогает быстро находить релевантные куски знаний в RAG-системах.
Чанкинг Chunking
Разбиение длинного текста на небольшие фрагменты для индексации и подачи в модель. От качества чанкинга зависит, насколько полезный контекст получит система.
Пайплайн Pipeline
Цепочка последовательных шагов, через которые проходит задача или данные. В AI-продукте пайплайн связывает поиск, подготовку контекста, вызов модели и постобработку.
Оркестрация Orchestration
Управление несколькими шагами, агентами и инструментами как одной системой. Оркестрация отвечает за порядок действий, переключение контекста и сбор итогового результата.
Локальная модель Local Model
Модель, которую запускают на своей машине или сервере, а не через чужой облачный API. Это полезно для приватности, но требует собственной инфраструктуры и компромиссов по качеству.
GPU Graphics Processing Unit
Видеокарта, которая умеет параллельно выполнять огромное количество вычислений. Именно GPU обычно используют для обучения и быстрого запуска нейросетей.
Облачный AI Cloud AI
Использование модели как удалённого сервиса через интернет. Такой подход снимает с вас заботу об инфраструктуре, но привязывает к внешнему провайдеру и его тарифам.
AI-обёртка AI Wrapper
Продукт, который использует чужую модель через API и добавляет свой интерфейс, логику, данные и процесс. Именно так сегодня устроено множество прикладных AI-сервисов.
AGI Artificial General Intelligence
Гипотетический уровень AI, который смог бы решать широкий спектр интеллектуальных задач на уровне человека или выше. Сегодняшние модели сильны в отдельных классах задач, но до AGI ещё далеко.
Хотите внедрить AI-агента без лишней теории?
Покажем, как переложить лидогенерацию, ответы клиентам и рутинные сценарии на AI-агента под ваш процесс.
Оставить заявку