Мы все недооцениваем семантику!

Мы все недооцениваем семантику

Наука о смысле формализована десятилетия назад. AI-индустрия просто не удосужилась в неё заглянуть.

Сергей Киричко


Я ждал этого момента два года. Смотрел, как AI-индустрия борется со смыслом — и проигрывает, — пока наука о смысле лежит рядом: формализованная, проверенная в боях и проигнорированная.

В прошлом году Андрей Карпатый подарил нам «context engineering» — и миллионы практиков подхватили термин за одну ночь. Карпатый — фигура исключительной важности, его вклад в AI огромен. Но вот в чём дело: когда он сказал, что «инженерия контекста — это тонкое искусство и наука наполнения контекстного окна ровно той информацией, которая нужна для следующего шага», он описал один маленький операционный срез того, что лингвистика изучает уже больше шестидесяти лет.

Контекст — это не просто «нужная информация для следующего шага». Контекст — это ВСЁ. Контекст определяет смысл. Контекст определяет намерение. Контекст определяет даже истинность — одна и та же информация в другом контексте может превратиться из истины в ложь. Просто посидите с этой мыслью минуту и переоцените важность контекста.

Карпатый продвинул разговор вперёд. Но он назвал это «одним маленьким кусочком». А я здесь, чтобы сказать: это не маленький кусочек — это вся игра целиком. И учебник по ней уже написан. Он называется семантической прагматикой.

Недавно Паоло Перроне в Data Science Collective доказывал, что корпоративный AI проваливается, потому что не понимает, что означают данные. Он показал симптом. Эта статья объясняет первопричину.

К контексту мы будем возвращаться — снова и снова. А пока охватим взглядом ландшафт.

1. РЕЧЕВЫЕ АКТЫ — действие важнее содержания

В 1962 году философ Дж. Л. Остин сбросил бомбу, взрыва которой большинство AI-инженеров до сих пор не услышали: слова не просто описывают вещи — они их ДЕЛАЮТ.

Есть популярное заблуждение с многовековой инерцией: морализаторское «пока одни говорят, другие делают». Но само это утверждение фундаментально ошибочно. Слова и есть действия. Да, поступки часто весят больше слов — но не стоит жить в иллюзии, что слова и действия — ортогональные понятия. Это не так.

Остин, а позже Джон Сёрль, формализовали это в теорию речевых актов. Каждое высказывание работает на трёх уровнях одновременно:

  • Локуция — буквальное содержание. Что было сказано.
  • Иллокуция — задуманное действие. Что имелось в виду.
  • Перлокуция — фактический эффект. Что произошло со слушателем.

«Можешь передать соль?» Локуция — вопрос о способности. Иллокуция — просьба. Перлокуция — кто-то передаёт вам соль. Или игнорирует.

А теперь посмотрите на свой LLM-пайплайн. Каждый промпт — речевой акт. Каждый ответ — тоже. И при этом вся область «классификации интентов» — это грубое, обеднённое переизобретение того, что Сёрль описал в 1969 году. Только хуже: все три уровня схлопнуты в одну плоскую метку.

Действие, встроенное в высказывание, — компонент, который все преступно игнорируют. А ведь в классификации интентов именно он часто оказывается определяющим сигналом. Не что пользователь сказал — а что он пытается сделать. И отдельно — какой эффект его слова реально производят.

Когда ваш агент трактует «мне нужно, чтобы это починили к понедельнику» как информационное сообщение, а не как директиву с дедлайном — это провал на уровне речевого акта. Локуция распознана. Иллокуция упущена. Перлокуция — сорванный дедлайн.


2. КОМПОЗИЦИОНАЛЬНОСТЬ — рёбра важнее узлов

Вот принцип настолько фундаментальный, что большинство его просто не замечает: смысл не в словах. Он в связях между ними.

Это принцип композициональности Фреге: значение целого — функция значений частей и способа их соединения. Соединение — структура, отношения — и тащит основной груз.

Узел без ребра — шум. Сущность без отношения — пустая справка. «Клиент», «выручка», «Q4» — это просто токены, пока вы их не свяжете. Чья выручка? Какого клиента? Q4 какого года и как посчитанный?

Вспомните, как вы учите совершенно новое слово. Читаете определение — и что происходит? Вы связываете его со знанием, которое у вас уже есть. Создаёте новое ребро в своём ментальном графе. Да, появляется новый узел — но смысл этого слова целиком живёт в его связях с тем, что вы уже знаете. Без этих связей слово — просто звук. Никакое понятие не может нести смысл в изоляции.

«Но позвольте, — скажете вы, — фундаментальные знания ведь важнее связей?» Нет. Потому что именно связи внутри фундамента придают смысл самому фундаменту. Там рёбра до самого дна. Людям инстинктивно хочется найти в графе самый важный узел — ключевое понятие, центральную сущность. Но это неправильный вопрос. Самое важное в любой структуре знаний — не узел. Это сама структура.

Конкретный пример. Возьмите слово «выручка» — одинокий узел. Теперь соедините его с «клиентом» отношением «генерируется кем». Внезапно появился смысл: выручку генерируют клиенты. Добавьте ещё ребро: «выручка» → «признана в» → «Q4». Теперь о ней можно рассуждать во времени. Без этих связей даже простейшее свойство узла — выручка большая? — не имеет ответа. Большая по сравнению с чем? За какой период? По какому сегменту? Истинность любого свойства целиком зависит от рёбер. Даже ответ на самый базовый вопрос — «а нужен ли вообще этот узел?» — определяется его связями.

Abstract Meaning Representation (AMR) формализует ровно это. Думайте об AMR как о швейцарском ноже формализованных семантических элементов — наборе инструментов, который можно напрямую применять к инженерии контекста или к моделированию структуры смысла. В графе AMR рёбра — отношения вроде ARG0 (кто делает), ARG1 (на что направлено), :purpose, :condition — несут основную семантическую нагрузку. Узлы — это понятия. Но структура графа и есть смысл.

Это прямое попадание в менталитет «мешка слов», который до сих пор доминирует в промпт-инжиниринге. Люди кидают в LLM ключевые слова и надеются на лучшее. Пишут промпты как словесный суп вместо того, чтобы строить реляционные структуры. Семантический сигнал не в ваших ключевых словах — он в том, как вы их соединяете.


3. КОНТЕКСТ И ПЕРСПЕКТИВА — двойная линза

А вот здесь начинается самое интересное.

Контекст говорящего и контекст слушающего — не одно и то же. И разрыв между ними — не баг, а закон.

Опыт, знания и ситуация говорящего определяют, что сказано. Опыт, знания и ситуация слушающего определяют, что услышано. Это фундаментально разные операции, и их пересечение никогда не бывает полным. Потери при коммуникации гарантированы. Вопрос лишь в том, моделируете вы их или делаете вид, что их нет.

Один и тот же текст может породить не просто радикально разные смыслы, но и радикально разные действия — в зависимости от того, кто его получает и в каком контексте.

И дальше — больше: одно и то же утверждение может быть истинным с перспективы говорящего и ложным с перспективы слушающего. Посмотрите прямо сейчас на системный промпт вашего агента. Что он означает с вашей перспективы — и что он означает с перспективы вашего агента? Видите вы эту разницу или нет — она огромна. Сам объём того, что модель знает о каждом понятии в этом промпте, создаёт драматический разрыв в смыслах по сравнению с вашим знанием тех же слов. Модель читает «You are a helpful assistant» и активирует гигантскую сеть ассоциаций, паттернов обучения и поведенческих приоров. Вы читаете это и думаете, что это простая инструкция. И наоборот: в вашем промпте есть фрагменты, смысл которых доступен только вам — отсылки к вашему домену, вашим пользователям, вашим краевым случаям. И при этом мы делаем вид, что этот общий кусок текста означает одно и то же для всех сторон. Нет. Даже близко нет.

Конкретный пример из корпоративного мира: когда CFO спрашивает про «выручку», правильный ответ — выручка по GAAP. Когда продуктовая команда спрашивает про «выручку», это MRR. Одно слово. Разные правильные ответы. Разные действия по этим ответам. У семантической прагматики есть имя для этого с 1970-х — перспективно-зависимое значение, формализованное в работах Грайса, Сталнакера и Льюиса об общем знании (common ground) и контекстных множествах.

Для LLM-практиков это переосмысляет важные вещи. Системный промпт — это не просто «инструкции», это инженерия перспективы. Few-shot-примеры — не просто «демонстрации», это калибровка общего контекста. RAG — не просто «поиск», это выравнивание состояний знаний между системой и пользователем.

Это не модные синонимы. Это более точные описания того, что происходит на самом деле, — а точность нашего мышления об этих механизмах напрямую влияет на то, насколько хорошо мы их строим.


4. ИМПЛИКАТУРА — скрытый сигнал, скрытая энтропия

Инсайт Пола Грайса обманчиво прост: сказанное и подразумеваемое — систематически разные вещи. И разрыв между ними подчиняется предсказуемым правилам.

Когда кто-то говорит «у меня двое детей», он имплицирует «у меня ровно двое детей» — хотя буквально это утверждение совместимо и с пятью. Когда пользователь говорит вашему агенту «у меня тут какие-то проблемы с платежами», он не подаёт баг-репорт. Он просит помощи. Буквальное содержание и задуманное сообщение расходятся — предсказуемо и измеримо.

И вот что делает это взрывоопасным для AI: импликатуры несут и сигнал, и энтропию.

Сигнал — это задуманный смысл, то, что кооперативный принцип Грайса помогает реконструировать. Энтропия — это неопределённость: пространство возможных задуманных смыслов при данном буквальном высказывании. И измерение этой энтропии — само по себе критически важное свойство.

Высокая энтропия импликатуры = высокий риск недопонимания = нужен цикл уточнения.

Низкая энтропия импликатуры = можно действовать = неявный смысл восстановим.

LLM галлюцинируют ровно там, где импликатуры неоднозначны. Это не случайность — это предсказуемая точка отказа, которую семантическая прагматика идентифицировала десятилетия назад. Когда разрыв между «что сказано» и «что имелось в виду» широк, модель заполняет его правдоподобно звучащим шумом. Это не баг модели. Это несмоделированная импликатура.


5. АБСТРАКЦИЯ — вычислительная мощь, которой никто не пользуется

А вот от этого каждый ML-инженер должен подскочить на стуле: абстракция — это не потеря информации. Абстракция — это сжатие с вычислительными свойствами.

Возьмём три предложения:

  • «Мальчик хочет пойти».
  • «Пойти — вот чего хочет мальчик».
  • «Желание мальчика — пойти».

Синтаксически это три разные структуры. Семантически — один смысл. AMR это схватывает: все три отображаются в один и тот же граф. Одно каноническое представление.

И это даёт вам — бесплатно:

  • Канонические формы — нормализуйте перед сравнением.
  • Дедупликацию — обнаруживайте семантическую эквивалентность при разной поверхностной форме.
  • Структурное сравнение — измеряйте близость смыслов на уровне графа, а не строки.

Никто в мире LLM не использует формальные абстракции для семантической нормализации. Все работают на уровне сырого текста: сравнивают эмбеддинги поверхностных форм и удивляются, почему «мальчик хочет пойти» и «пойти — вот чего хочет мальчик» получают разные оценки близости.

Машинерия абстракции существует. Она формализована. Она в открытом доступе. А AI-индустрия тратит миллиарды на построение приблизительных версий того, что формальная семантика даёт точно.

Практическое упражнение: попросите свою LLM представить фразу «You are a helpful assistant» сначала в AMR, потом в UMR. Попробуйте другие тексты из своих промптов. Вы увидите формальную декомпозицию смысла на составные части — предикатную структуру, роли, аспект, модальность. Это те компоненты формальной семантики, которые мы должны принимать всерьёз в повседневной AI-инженерии. Наши модели сидят рядом, способные рассуждать об этих структурах, и ждут, когда мы дадим им контекст в терминах, которые они умеют формально разбирать, — а мы даже не знаем, из каких частей состоят наши контексты.


6. «А я ведь ещё даже не начал…»

Всё, что выше? Это закуска.

Я не коснулся темпоральной семантики — как упорядочиваются события, как аспект формирует смысл, почему в вашем агентном пайплайне нет понятий «до» и «после», хотя любой бизнес-процесс фундаментально темпорален.

Я не коснулся модальной силы — разницы между «возможно», «наверняка» и «вероятно». Эпистемического слоя, который определяет уверенность, обязательство и эвиденциальность. Того, на чём должна строиться ваша детекция галлюцинаций — но не строится.

Я не коснулся реификации — механизма превращения отношений в объекты, о которых можно рассуждать. Это, между прочим, формальная подоплёка того, почему работает chain-of-thought: вы заставляете модель реифицировать промежуточные шаги рассуждения в явные объекты.

Я не коснулся области действия кванторов — почему «каждый студент прочитал книгу» имеет два разных смысла, а ваша LLM выбирает один наугад.

Каждая из этих тем заслуживает отдельного разбора. И каждая уже формализована — так, как AI-индустрия пока не открыла.

Золотые артефакты

Два документа, которые я считаю обязательным чтением для всех, кто строит AI-системы, работающие со смыслом:

  • AMR Guidelines — Abstract Meaning Representation. Формальная нотация для представления «кто что кому делает» в предложении — в виде графа. Фундамент.

  • UMR Guidelines — Uniform Meaning Representation. Эволюция AMR: добавлены темпоральный, модальный и документный уровни, которых AMR не хватало. Аннотация аспекта. Эпистемическая сила. Кореференция между предложениями. Темпоральный и модальный хребет, который отчаянно нужен 90% агентных архитектур — но которого у них нет.

Линия преемственности от темпоральной логики через хранилища данных (паттерны SCD Type 2) к архитектурам агентной памяти — не метафора. Это один и тот же формальный паттерн, независимо переоткрытый в каждой области. Глубокий разбор — во второй части.

А за пределами формальных слоёв? Семантическая оркестрация — дисциплина применения этих структур для проектирования агентных систем, которые реально рассуждают о смысле, а не просто обрабатывают токены. Как паттерны темпоральной аннотации становятся архитектурами памяти. Как классификация речевых актов становится маршрутизацией действий. Как энтропия импликатуры становится сигналом уверенности в проде. Это третья часть.


Манифест

Семантика — не роскошь. Не академический курьёз. Не «приятное дополнение» для версии 2.0.

Это операционная система смысла.

Каждый промпт, который вы пишете, — акт прикладной семантики. Каждая агентная архитектура — (обычно неявная, обычно сломанная) теория смысла. Каждая галлюцинация — несмоделированный семантический разрыв. Каждый непонятый интент пользователя — провал речевого акта.

Формальные инструменты существуют. Наука зрелая. Фреймворки в открытом доступе. Разрыв не в знаниях — в внимании.

Если вы строите системы, обрабатывающие смысл, не понимая, как смысл устроен, — вы строите на песке.

И прилив уже идёт.


Сергей Киричко — Agentic AI Engineer с 15+ годами в разработке ПО, 6 годами в ML и data science и бэкграундом в компьютерной лингвистике и семантической прагматике. Строит агентные AI-системы на основе формальной семантики. Живёт в Аликанте, Испания.

Что дальше

Часть 2 — об AMR, UMR, темпоральной семантике и формальной архитектуре смысла.

Часть 3 — семантическая оркестрация: конкретные паттерны агентных архитектур на формальном фундаменте из частей 1 и 2.


Источники и дополнительное чтение:

  • Austin, J.L. (1962). How to Do Things with Words
  • Searle, J.R. (1969). Speech Acts
  • Grice, H.P. (1975). Logic and Conversation
  • Kroeger, P.R. (2022). Analyzing Meaning: An Introduction to Semantics and Pragmatics, 3rd ed. Language Science Press. — Полное и доступное введение, покрывающее все ключевые концепции этой статьи: речевые акты, композициональность, импликатуру, модальность, время и аспект. Свободно доступна на langsci-press.org. Если прочитать одну книгу по семантике — пусть это будет она.
  • Banarescu et al. (2013). Abstract Meaning Representation for Sembanking
  • Jens E. L. Van Gysel et al. (2021). Designing a Uniform Meaning Representation
  • Perrone, P. (2026). Enterprise AI Has a Production Problem Nobody Wants to Talk About — Data Science Collective
  • Karpathy, A. (2025). Твит про context engineering

Medium version of this post: We All Underestimate Semantics!

English Version: Мы все недооцениваем семантику!