← Усі статті

50 термінів AI, які варто знати до першого впровадження

Практичний глосарій FastAI: від токенів і RAG до агентів, guardrails та AGI перед першим запуском AI-автоматизації.

Цей матеріал допомагає швидко вирівняти термінологію в команді. Якщо ви обговорюєте AI-агентів, автоматизацію продажів чи інтеграції, нижче зібрані поняття, які варто розуміти ще до старту проєкту.

Глосарій

50 базових понять, які варто розуміти ще до обговорення архітектури, бюджету та сценаріїв впровадження.

01

Нейромережа Neural Network

Модель, натхненна тим, як нейрони передають сигнали одне одному. Вона навчається на прикладах і лежить в основі більшості сучасних AI-систем.

02

LLM Large Language Model

Велика мовна модель, натренована на величезному масиві тексту. Вона настільки добре передбачає наступний токен, що може вести діалог, писати тексти й аналізувати документи.

03

Параметр Parameter

Числова вага всередині моделі, у якій зашита її поведінка. Більше параметрів може означати більше можливостей, але й дорожчий запуск.

04

Токен Token

Мінімальна одиниця тексту, з якою працює модель. Вартість API, ліміти та контекстне вікно майже завжди рахуються саме в токенах.

05

Контекстне вікно Context Window

Обсяг інформації, який модель може утримувати в одній сесії. Коли вікно переповнюється, ранні частини діалогу або документа починають випадати.

06

Промпт Prompt

Інструкція або запит, який ви надсилаєте моделі. Чим чіткіше задані контекст, формат і ціль, тим стабільніший результат.

07

Системний промпт System Prompt

Базова інструкція, яка задає моделі роль і рамки ще до початку діалогу. Саме вона формує тон, обмеження та поведінку за замовчуванням.

08

Температура Temperature

Параметр, який регулює ступінь варіативності відповіді. Низька температура робить відповіді передбачуванішими, висока додає креативу й ризику помилок.

09

Галюцинації Hallucinations

Випадки, коли модель упевнено вигадує неправильні факти, посилання або висновки. Тому критичну інформацію завжди потрібно перевіряти зовнішнім джерелом.

10

Навчання Training

Процес, у якому модель проходить по великому датасету та підлаштовує свої параметри. Це зазвичай найдорожчий і найресурсомісткіший етап створення великої моделі.

11

Донавчання Fine-tuning

Додаткове навчання вже готової моделі на вузькій задачі або домені. Так модель краще тримає потрібний тон, категорії та робочий процес.

12

RAG Retrieval-Augmented Generation

Підхід, за якого модель спочатку шукає релевантні матеріали у зовнішній базі знань, а вже потім відповідає. Це зменшує галюцинації й дає доступ до актуальних даних.

13

API Application Programming Interface

Спосіб підключити модель до продукту через код. Через API AI працює всередині CRM, сайту, месенджера чи внутрішньої панелі, а не лише в окремому чаті.

14

Інференс Inference

Момент, коли модель застосовує свої знання та генерує відповідь на ваш запит. У хмарних API саме за інференс зазвичай і сплачують.

15

Мультимодальність Multimodality

Здатність моделі працювати не лише з текстом, а й із зображеннями, аудіо чи відео. Це дає змогу будувати сценарії, де AI читає скріншоти, слухає голос і відповідає текстом.

16

Ембедінги Embeddings

Числове представлення тексту або іншого об'єкта в просторі змістів. На ембедінгах будуються семантичний пошук, рекомендації та RAG-пайплайни.

17

Відкриті та закриті моделі Open-source vs Closed-source

Закриті моделі ви використовуєте як сервіс, а відкриті можна завантажити й запускати на власній інфраструктурі. Вибір залежить від вимог до якості, приватності та бюджету.

18

AI-агенти AI Agents

Системи, які не лише відповідають текстом, а й виконують кроки: шукають дані, викликають інструменти, оновлюють CRM або передають задачу далі. Це вже не просто чат, а робочий виконавець.

19

Ланцюжок міркувань Chain of Thought

Підхід, за якого модель розбиває складну задачу на проміжні кроки. Це особливо корисно для логіки, розрахунків і багатокрокового аналізу.

20

Бенчмарк Benchmark

Стандартизований тест, на якому порівнюють моделі. Він допомагає оцінити загальний рівень, але не замінює перевірку на ваших реальних сценаріях.

21

Трансформер Transformer

Архітектура, на якій побудовані сучасні мовні моделі. Її ключова ідея — механізм уваги, що допомагає бачити зв'язки між віддаленими частинами тексту.

22

Дифузійна модель Diffusion Model

Тип моделі, який найчастіше використовують для генерації зображень. Вона вчиться крок за кроком відновлювати картинку з шуму, тому може створювати нові візуали з нуля.

23

Попереднє навчання Pre-training

Перший великий етап навчання, коли модель отримує загальні знання з величезного масиву даних. Після нього модель уже багато знає, але ще не налаштована під конкретний продукт.

24

RLHF Reinforcement Learning from Human Feedback

Метод, у якому люди оцінюють відповіді моделі, а система вчиться віддавати перевагу кориснішим і безпечнішим варіантам. Він наближає поведінку моделі до очікувань користувача.

25

Дистиляція Distillation

Перенесення знань із великої моделі в компактнішу. Так можна отримати дешевшу й швидшу модель, зберігши помітну частину якості.

26

Квантизація Quantization

Стиснення моделі за рахунок використання чисел із нижчою точністю. Це зменшує розмір і прискорює запуск, а втрата якості часто залишається прийнятною.

27

Латентний простір Latent Space

Внутрішній простір представлення даних усередині моделі. У ньому об'єкти зі схожим змістом розташовуються ближче один до одного, ніж несуміжні.

28

Zero-shot і few-shot Few-shot / Zero-shot

Спосіб задати задачу без додаткового навчання: або взагалі без прикладів, або з кількома прикладами прямо в промпті. Часто цього достатньо, щоб модель вловила потрібний формат.

29

Промпт-інжиніринг Prompt Engineering

Практика проєктування запитів так, щоб модель відповідала точніше, коротше або в потрібній структурі. Це особливо важливо, коли ви не хочете щоразу вручну виправляти результат.

30

Роль Role

Контекст, у якому модель читає повідомлення: system, user або assistant. Розуміння ролей допомагає будувати діалоги та продукти з передбачуванішою поведінкою.

31

Стоп-послідовність Stop Sequence

Спеціальний маркер, який каже моделі припинити генерацію. Його використовують, щоб контролювати довжину відповіді або завершувати вивід у правильній точці.

32

Стрімінг Streaming

Режим, коли відповідь приходить частинами, а не цілком наприкінці. Він покращує відчуття швидкості та дає змогу раніше почати працювати з результатом.

33

Виклик функцій Function Calling / Tool Use

Механізм, який дає моделі змогу не лише писати текст, а й просити систему викликати конкретний інструмент. Саме так AI шукає дані, рахує, оновлює записи та запускає зовнішні дії.

34

Навчання в контексті In-Context Learning

Здатність моделі вловлювати патерн прямо з поточного промпта без перенавчання. Саме тому кілька сильних прикладів часто помітно підвищують якість відповіді.

35

Перенавчання Overfitting

Ситуація, коли модель надто добре запам'ятала навчальні дані й гірше працює на нових прикладах. Через це система стає крихкою поза звичним сценарієм.

36

Датасет Dataset

Набір даних, на якому модель навчають або перевіряють. Якість датасета безпосередньо впливає на якість майбутньої системи.

37

Розмітка даних Data Labeling

Ручна або напівавтоматична розмітка даних, яка підказує моделі, що саме в них важливо. Без якісної розмітки складно отримати стабільний результат на прикладній задачі.

38

Токсичність Toxicity

Образливий, небезпечний або небажаний контент у відповідях моделі. Його намагаються зменшувати через навчання, модерацію та зовнішні фільтри.

39

Захисні рамки Guardrails

Набір обмежень і перевірок, які втримують систему в допустимих межах. Guardrails потрібні, щоб AI не порушував політики, не йшов у небезпечні теми й не ламав процес.

40

Джейлбрейк Jailbreak

Спроба обійти обмеження моделі за допомогою хитрого запиту. У production-системах це важливий ризик, який треба враховувати під час проєктування захисту.

41

Вектор Vector

Числовий масив, який представляє зміст об'єкта так, щоб його можна було порівнювати математично. Вектори лежать в основі семантичного пошуку.

42

Векторна база даних Vector Database

Сховище, оптимізоване під пошук схожих векторів. Саме воно допомагає RAG-системам швидко знаходити найрелевантніші фрагменти знань.

43

Чанкінг Chunking

Розбиття довгого тексту на невеликі фрагменти для індексації та подачі в модель. Від якості чанкінгу залежить, наскільки корисний контекст отримає система.

44

Пайплайн Pipeline

Ланцюжок послідовних кроків, через які проходять дані або задача. В AI-продукті пайплайн поєднує пошук, підготовку контексту, виклик моделі та постобробку.

45

Оркестрація Orchestration

Координація кількох кроків, агентів та інструментів як єдиної системи. Оркестрація відповідає за порядок дій, передачу контексту та збір фінального результату.

46

Локальна модель Local Model

Модель, яку запускають на власній машині чи сервері, а не через чужий хмарний API. Це корисно для приватності, але вимагає своєї інфраструктури й часто означає компроміси щодо якості.

47

GPU Graphics Processing Unit

Відеокарта, яка вміє паралельно виконувати величезну кількість обчислень. Саме GPU зазвичай використовують для навчання та швидкого запуску нейромереж.

48

Хмарний AI Cloud AI

Використання моделі як віддаленого сервісу через інтернет. Такий підхід знімає з вас турботу про інфраструктуру, але прив'язує до зовнішнього провайдера та його тарифів.

49

AI-обгортка AI Wrapper

Продукт, який використовує чужу модель через API та додає власний інтерфейс, логіку, дані й процес. Саме так сьогодні побудовано багато прикладних AI-сервісів.

50

AGI Artificial General Intelligence

Гіпотетичний рівень AI, на якому система могла б вирішувати широкий спектр інтелектуальних задач на рівні людини або вище. Сучасні моделі сильні в окремих класах задач, але до AGI ще далеко.

FastAI

Хочете запустити AI-агента без зайвої теорії?

Покажемо, як перенести лідогенерацію, відповіді клієнтам і рутинні сценарії в production AI-агента під ваш процес.

Залишити заявку