50 термінів AI, які варто знати до першого впровадження
Практичний глосарій FastAI: від токенів і RAG до агентів, guardrails та AGI перед першим запуском AI-автоматизації.
Цей матеріал допомагає швидко вирівняти термінологію в команді. Якщо ви обговорюєте AI-агентів, автоматизацію продажів чи інтеграції, нижче зібрані поняття, які варто розуміти ще до старту проєкту.
50 базових понять, які варто розуміти ще до обговорення архітектури, бюджету та сценаріїв впровадження.
Нейромережа Neural Network
Модель, натхненна тим, як нейрони передають сигнали одне одному. Вона навчається на прикладах і лежить в основі більшості сучасних AI-систем.
LLM Large Language Model
Велика мовна модель, натренована на величезному масиві тексту. Вона настільки добре передбачає наступний токен, що може вести діалог, писати тексти й аналізувати документи.
Параметр Parameter
Числова вага всередині моделі, у якій зашита її поведінка. Більше параметрів може означати більше можливостей, але й дорожчий запуск.
Токен Token
Мінімальна одиниця тексту, з якою працює модель. Вартість API, ліміти та контекстне вікно майже завжди рахуються саме в токенах.
Контекстне вікно Context Window
Обсяг інформації, який модель може утримувати в одній сесії. Коли вікно переповнюється, ранні частини діалогу або документа починають випадати.
Промпт Prompt
Інструкція або запит, який ви надсилаєте моделі. Чим чіткіше задані контекст, формат і ціль, тим стабільніший результат.
Системний промпт System Prompt
Базова інструкція, яка задає моделі роль і рамки ще до початку діалогу. Саме вона формує тон, обмеження та поведінку за замовчуванням.
Температура Temperature
Параметр, який регулює ступінь варіативності відповіді. Низька температура робить відповіді передбачуванішими, висока додає креативу й ризику помилок.
Галюцинації Hallucinations
Випадки, коли модель упевнено вигадує неправильні факти, посилання або висновки. Тому критичну інформацію завжди потрібно перевіряти зовнішнім джерелом.
Навчання Training
Процес, у якому модель проходить по великому датасету та підлаштовує свої параметри. Це зазвичай найдорожчий і найресурсомісткіший етап створення великої моделі.
Донавчання Fine-tuning
Додаткове навчання вже готової моделі на вузькій задачі або домені. Так модель краще тримає потрібний тон, категорії та робочий процес.
RAG Retrieval-Augmented Generation
Підхід, за якого модель спочатку шукає релевантні матеріали у зовнішній базі знань, а вже потім відповідає. Це зменшує галюцинації й дає доступ до актуальних даних.
API Application Programming Interface
Спосіб підключити модель до продукту через код. Через API AI працює всередині CRM, сайту, месенджера чи внутрішньої панелі, а не лише в окремому чаті.
Інференс Inference
Момент, коли модель застосовує свої знання та генерує відповідь на ваш запит. У хмарних API саме за інференс зазвичай і сплачують.
Мультимодальність Multimodality
Здатність моделі працювати не лише з текстом, а й із зображеннями, аудіо чи відео. Це дає змогу будувати сценарії, де AI читає скріншоти, слухає голос і відповідає текстом.
Ембедінги Embeddings
Числове представлення тексту або іншого об'єкта в просторі змістів. На ембедінгах будуються семантичний пошук, рекомендації та RAG-пайплайни.
Відкриті та закриті моделі Open-source vs Closed-source
Закриті моделі ви використовуєте як сервіс, а відкриті можна завантажити й запускати на власній інфраструктурі. Вибір залежить від вимог до якості, приватності та бюджету.
AI-агенти AI Agents
Системи, які не лише відповідають текстом, а й виконують кроки: шукають дані, викликають інструменти, оновлюють CRM або передають задачу далі. Це вже не просто чат, а робочий виконавець.
Ланцюжок міркувань Chain of Thought
Підхід, за якого модель розбиває складну задачу на проміжні кроки. Це особливо корисно для логіки, розрахунків і багатокрокового аналізу.
Бенчмарк Benchmark
Стандартизований тест, на якому порівнюють моделі. Він допомагає оцінити загальний рівень, але не замінює перевірку на ваших реальних сценаріях.
Трансформер Transformer
Архітектура, на якій побудовані сучасні мовні моделі. Її ключова ідея — механізм уваги, що допомагає бачити зв'язки між віддаленими частинами тексту.
Дифузійна модель Diffusion Model
Тип моделі, який найчастіше використовують для генерації зображень. Вона вчиться крок за кроком відновлювати картинку з шуму, тому може створювати нові візуали з нуля.
Попереднє навчання Pre-training
Перший великий етап навчання, коли модель отримує загальні знання з величезного масиву даних. Після нього модель уже багато знає, але ще не налаштована під конкретний продукт.
RLHF Reinforcement Learning from Human Feedback
Метод, у якому люди оцінюють відповіді моделі, а система вчиться віддавати перевагу кориснішим і безпечнішим варіантам. Він наближає поведінку моделі до очікувань користувача.
Дистиляція Distillation
Перенесення знань із великої моделі в компактнішу. Так можна отримати дешевшу й швидшу модель, зберігши помітну частину якості.
Квантизація Quantization
Стиснення моделі за рахунок використання чисел із нижчою точністю. Це зменшує розмір і прискорює запуск, а втрата якості часто залишається прийнятною.
Латентний простір Latent Space
Внутрішній простір представлення даних усередині моделі. У ньому об'єкти зі схожим змістом розташовуються ближче один до одного, ніж несуміжні.
Zero-shot і few-shot Few-shot / Zero-shot
Спосіб задати задачу без додаткового навчання: або взагалі без прикладів, або з кількома прикладами прямо в промпті. Часто цього достатньо, щоб модель вловила потрібний формат.
Промпт-інжиніринг Prompt Engineering
Практика проєктування запитів так, щоб модель відповідала точніше, коротше або в потрібній структурі. Це особливо важливо, коли ви не хочете щоразу вручну виправляти результат.
Роль Role
Контекст, у якому модель читає повідомлення: system, user або assistant. Розуміння ролей допомагає будувати діалоги та продукти з передбачуванішою поведінкою.
Стоп-послідовність Stop Sequence
Спеціальний маркер, який каже моделі припинити генерацію. Його використовують, щоб контролювати довжину відповіді або завершувати вивід у правильній точці.
Стрімінг Streaming
Режим, коли відповідь приходить частинами, а не цілком наприкінці. Він покращує відчуття швидкості та дає змогу раніше почати працювати з результатом.
Виклик функцій Function Calling / Tool Use
Механізм, який дає моделі змогу не лише писати текст, а й просити систему викликати конкретний інструмент. Саме так AI шукає дані, рахує, оновлює записи та запускає зовнішні дії.
Навчання в контексті In-Context Learning
Здатність моделі вловлювати патерн прямо з поточного промпта без перенавчання. Саме тому кілька сильних прикладів часто помітно підвищують якість відповіді.
Перенавчання Overfitting
Ситуація, коли модель надто добре запам'ятала навчальні дані й гірше працює на нових прикладах. Через це система стає крихкою поза звичним сценарієм.
Датасет Dataset
Набір даних, на якому модель навчають або перевіряють. Якість датасета безпосередньо впливає на якість майбутньої системи.
Розмітка даних Data Labeling
Ручна або напівавтоматична розмітка даних, яка підказує моделі, що саме в них важливо. Без якісної розмітки складно отримати стабільний результат на прикладній задачі.
Токсичність Toxicity
Образливий, небезпечний або небажаний контент у відповідях моделі. Його намагаються зменшувати через навчання, модерацію та зовнішні фільтри.
Захисні рамки Guardrails
Набір обмежень і перевірок, які втримують систему в допустимих межах. Guardrails потрібні, щоб AI не порушував політики, не йшов у небезпечні теми й не ламав процес.
Джейлбрейк Jailbreak
Спроба обійти обмеження моделі за допомогою хитрого запиту. У production-системах це важливий ризик, який треба враховувати під час проєктування захисту.
Вектор Vector
Числовий масив, який представляє зміст об'єкта так, щоб його можна було порівнювати математично. Вектори лежать в основі семантичного пошуку.
Векторна база даних Vector Database
Сховище, оптимізоване під пошук схожих векторів. Саме воно допомагає RAG-системам швидко знаходити найрелевантніші фрагменти знань.
Чанкінг Chunking
Розбиття довгого тексту на невеликі фрагменти для індексації та подачі в модель. Від якості чанкінгу залежить, наскільки корисний контекст отримає система.
Пайплайн Pipeline
Ланцюжок послідовних кроків, через які проходять дані або задача. В AI-продукті пайплайн поєднує пошук, підготовку контексту, виклик моделі та постобробку.
Оркестрація Orchestration
Координація кількох кроків, агентів та інструментів як єдиної системи. Оркестрація відповідає за порядок дій, передачу контексту та збір фінального результату.
Локальна модель Local Model
Модель, яку запускають на власній машині чи сервері, а не через чужий хмарний API. Це корисно для приватності, але вимагає своєї інфраструктури й часто означає компроміси щодо якості.
GPU Graphics Processing Unit
Відеокарта, яка вміє паралельно виконувати величезну кількість обчислень. Саме GPU зазвичай використовують для навчання та швидкого запуску нейромереж.
Хмарний AI Cloud AI
Використання моделі як віддаленого сервісу через інтернет. Такий підхід знімає з вас турботу про інфраструктуру, але прив'язує до зовнішнього провайдера та його тарифів.
AI-обгортка AI Wrapper
Продукт, який використовує чужу модель через API та додає власний інтерфейс, логіку, дані й процес. Саме так сьогодні побудовано багато прикладних AI-сервісів.
AGI Artificial General Intelligence
Гіпотетичний рівень AI, на якому система могла б вирішувати широкий спектр інтелектуальних задач на рівні людини або вище. Сучасні моделі сильні в окремих класах задач, але до AGI ще далеко.
Хочете запустити AI-агента без зайвої теорії?
Покажемо, як перенести лідогенерацію, відповіді клієнтам і рутинні сценарії в production AI-агента під ваш процес.
Залишити заявку