Стоит ли добавлять разметку FAQPage в 2026 году?

Только как честную семантическую нормализацию, а не как рычаг роста. Документация Google по FAQ сообщает, что FAQ rich results перестали показываться в Поиске 7 мая 2026 года, а поддержка FAQ в Rich Results Test удаляется в июне 2026 года. Валидный FAQPage всё ещё может машиночитаемо описывать реальные, видимые вопросы и ответы, что помогает ИИ-системам их извлекать. Но контент FAQ должен быть виден пользователю на странице, а если ответы могут добавлять пользователи — используйте QAPage.

Заменяют ли структурированные данные семантический HTML для ИИ-агентов?

Нет. Руководство Google на web.dev говорит, что агенты воспринимают сайт тремя способами — скриншоты, сырой HTML и accessibility tree, — а OpenAI пишет, что агент ChatGPT лучше понимает сайт, когда тот следует практикам доступности и использует роли и метки ARIA. JSON-LD описывает факты о сущностях; семантический HTML и доступность описывают структуру, действия и навигацию. Нужны оба. Schema — это слой ясности поверх страницы, которая уже доступна для обхода и читается без запуска JavaScript.

БЛОГ

Структурированные данные для ИИ-агентов: schema.org, который читают ассистенты

Q: Помогает ли schema.org ChatGPT или Google AI?

Косвенно и только как один слой. Собственная документация Google говорит, что нет дополнительных требований и не нужна специальная разметка, чтобы попасть в AI Overviews или AI Mode, а чрезмерный фокус на структурированных данных называет мифом. Но там же сказано, что явные подсказки помогают Поиску понять страницу, а предоставленные издателем структурированные данные могут иметь приоритет над автоматически извлечёнными. OpenAI не публикует чеклист вида «добавьте тип X, чтобы расти в ChatGPT»; компания пишет, что ранжирование зависит от множества факторов и что нельзя блокировать OAI-SearchBot, чтобы вас показывали и цитировали. Так что schema снижает неоднозначность о ваших фактах — но не включает «переключатель цитирования».

Q: Какие типы schema.org добавить в первую очередь?

Начните с сущностей, которые ассистент должен распознать без догадок, а не с самого длинного списка типов. Почти для любого сайта это Organization + WebSite (кто издатель, официальный URL, логотип, подтверждённые профили). Добавьте SoftwareApplication для SaaS и приложений, Product + Offer для коммерции (Google требует name, image, offers, а также действующую цену и валюту внутри Offer) и FAQPage — только там, где есть реальный, видимый пользователю Q&A. Google советует использовать наиболее специфичный применимый тип и связывать сущности общим @id.

Schema.org и JSON-LD не заставят ИИ вас цитировать, но дают ChatGPT, Perplexity и Google AI машиночитаемые факты. Типы, ошибки, бесплатный скан 0–100.

Автор: IMozzОбновлено 2026-06-06

Structured data for AI agents — aiSiteReady

Schema.org и JSON-LD — это не секретный буст для ChatGPT или Google AI. Это нечто более долговечное: явный машиночитаемый слой, который сообщает поисковым и ИИ-системам, кто вы, что предлагаете и как связаны между собой факты на странице. Google прямо пишет, что использует найденные в вебе структурированные данные, чтобы понимать содержание страницы и собирать сведения о мире, а schema.org описывает себя как общий словарь для структурированных данных, используемый поисковиками и другими приложениями (Google). Это и есть честное обещание — не больше и не меньше.

Удобно представлять структурированные данные как верхний слой стека, а не отдельный трюк. Бот должен сначала дойти до страницы, затем прочитать её без запуска вашего JavaScript, и только потом ваш JSON-LD добавляет точности сверху. Пропустите нижний слой — и разметка перестаёт работать: идеальная schema на странице, которую ассистент не может загрузить или не может разобрать без браузера, не даёт ничего. Schema обостряет уже доступную страницу; она не спасает недоступную.

Ключевые выводы
Schema.org/JSON-LD не заставят ИИ вас цитировать. Они снижают неоднозначность, чтобы система извлекла ваши канонические факты, а не собрала менее точную версию из текста (Google).
Google говорит, что никаких дополнительных требований и специальной разметки для появления в AI Overviews или AI Mode нет, а чрезмерный фокус на структурированных данных называет мифом (Google).
Но явная структура может выигрывать: Google пишет, что предоставленные издателем структурированные данные могут иметь приоритет над автоматически извлечёнными (Google).
Сначала добавьте сущности, которые ассистенты обязаны распознать: Organization + WebSite, затем SoftwareApplication, Product + Offer и FAQPage — только там, где есть реальный видимый Q&A.
Разметка — лишь один канал. Агенты читают ещё сырой HTML и accessibility tree, поэтому schema не заменяет семантический HTML (web.dev). aiSiteReady проверяет всё это и оценивает сайт от 0 до 100.

Помогает ли schema.org ChatGPT и Google AI?

Проверенный фактами ответ: да, но косвенно и никогда как волшебный переключатель. Здесь важна точность, потому что тема притягивает преувеличения.

Для ИИ-функций Google документация прямолинейна. Google заявляет, что нет дополнительных требований для появления в AI Overviews и AI Mode, что специальные «оптимизации» не нужны, а обычные практики SEO по-прежнему применимы. Утверждения «нужны специальные файлы разметки» и «нужна отдельная ИИ-оптимизация» компания прямо относит к мифам и называет чрезмерный фокус на структурированных данных ненужным (Google). Поэтому честно продавать schema как обходной путь в ИИ-сводки нельзя.

При этом недооценивать её тоже неверно. Google также пишет, что явные подсказки о смысле страницы помогают Поиску её понять, а в примере с pros and cons показывает: когда издатель предоставляет структурированные данные, Google предпочитает их тем, что извлёк бы автоматически (Google). Вот реальный механизм: schema не заставляет ИИ вас цитировать — она повышает шансы, что система прочитает ваши канонические факты, а не соберёт менее точную версию из свободного текста.

Для ChatGPT формулируйте аккуратно. OpenAI не публикует чеклист «добавьте тип X и свойство Y, чтобы расти в ChatGPT Search». Компания пишет, что ранжирование зависит от множества факторов, топ-позиции гарантировать нельзя, а практическое требование, чтобы вас показывали, — не блокировать OAI-SearchBot (OpenAI). Поскольку ChatGPT Search переписывает запросы в подзапросы и может опираться на сторонних поисковых провайдеров, schema, скорее всего, помогает ему через системы извлечения, на которые он опирается, — это вывод из архитектуры, а не заявленный OpenAI фактор ранжирования.

Почему JSON-LD помогает ИИ, но не является магией

Рассматривайте JSON-LD как самый удобный транспортный слой для смысла, а не как SEO-хитрость. Google рекомендует JSON-LD именно потому, что его проще внедрять и поддерживать в масштабе, а W3C определяет его как JSON-совместимую сериализацию linked data, спроектированную так, чтобы встраиваться в системы, уже использующие JSON (W3C). Это стандартный способ сделать факты машиночитаемыми, а не трюк, нацеленный на языковые модели.

Картина извлечения объясняет, почему это важно. Собственное руководство Google по генеративным ИИ-функциям описывает их как RAG плюс query fan-out поверх обычного поискового индекса: система извлекает релевантные страницы, затем использует конкретные фрагменты этих страниц, чтобы сгенерировать ответ с заметными ссылками на источники (Google). Чем меньше неоднозначности в ваших сущностях и фактах, тем надёжнее система достанет нужный фрагмент и заземлит на нём ответ.

Сравнение двух путей. Размеченная карточка JSON-LD по сплошной стрелке попадает в ИИ-узел и даёт точные факты: имя, цену и тип напрямую. Ниже неструктурированный абзац по блёклой пунктирной стрелке попадает в ИИ-узел и даёт лишь догадку из текста, которая может быть неверной.

Есть жёсткое ограничение, которое стоит проговорить прямо: структурированные данные — лишь один из нескольких каналов. Руководство Google на web.dev говорит, что агенты воспринимают сайт тремя способами — скриншоты, сырой HTML и accessibility tree, — а OpenAI добавляет, что доступность и метки ARIA помогают агенту ChatGPT понять структуру сайта и интерактивные элементы (web.dev). Вывод для разработчиков: schema описывает факты о сущностях; семантический HTML и доступность описывают структуру и действия. JSON-LD не заменяет ни то, ни другое.

Какие типы schema.org добавить в первую очередь?

Не начинайте с «максимального числа типов». Начните с сущностей, которые ассистент должен распознать и процитировать без двусмысленности. Совет Google — использовать наиболее специфичные применимые типы и имена свойств, а когда на странице несколько связанных сущностей — связывать их общим @id (Google).

Тип	Когда использовать	Ключевые свойства, которые извлекает ИИ
Organization + WebSite	Почти любой сайт — слой идентичности	`name`, `url`, `logo`, `legalName`, `sameAs`, `contactPoint`
SoftwareApplication	SaaS, веб/десктоп-приложения, страницы инструментов	`name`, `applicationCategory`, `operatingSystem`, `offers`, `aggregateRating`
Product + Offer	Страницы коммерции и каталога	`name`, `image`, `brand`, `offers.price`, `offers.priceCurrency`, `availability`
FAQPage	Страница с реальным, видимым пользователю Q&A	`mainEntity` → `Question.name`, `acceptedAnswer.text`

Organization + WebSite — базовый слой идентичности: ассистент понимает, кто издаёт сайт, какой у него официальный URL, какой логотип использовать и какие внешние профили подтверждают эту идентичность. Различайте url (официальный URL самой сущности) и sameAs (внешние страницы, которые её однозначно подтверждают). Используйте один канонический @id на сущность и переиспользуйте его.

{
  "@context": "https://schema.org",
  "@graph": [
    {
      "@type": "Organization",
      "@id": "https://example.com/#org",
      "url": "https://example.com/",
      "name": "Acme AI",
      "legalName": "Acme AI LLC",
      "logo": "https://example.com/static/logo.png",
      "sameAs": [
        "https://www.linkedin.com/company/acme-ai/",
        "https://github.com/acme-ai"
      ],
      "contactPoint": [
        { "@type": "ContactPoint", "contactType": "sales", "email": "sales@example.com" }
      ]
    },
    {
      "@type": "WebSite",
      "@id": "https://example.com/#website",
      "url": "https://example.com/",
      "name": "Acme AI",
      "inLanguage": "ru-RU",
      "publisher": { "@id": "https://example.com/#org" }
    }
  ]
}

Именно общий @id позволяет потребителю считать Organization и WebSite одной связанной идентичностью, а не двумя несвязанными блоками. Та же дисциплина окупается между страницами: связывайте Product, его Organization и WebSite через устойчивые идентификаторы.

Три сущности schema.org — Organization, WebSite и Product — каждая со своим каноническим @id, соединены связями в один цельный граф; для сравнения три карточки без общего @id выглядят как несвязанные объекты.

SoftwareApplication уместен на страницах SaaS и приложений, потому что ассистентам часто задают очень фактические вопросы: есть ли бесплатный тариф, это веб или мобайл, сколько стоит, кто выпускает. Полезные свойства — name, description, applicationCategory, operatingSystem, offers и aggregateRating. Универсального «обязательного» списка на уровне словаря нет — соберите минимальный набор фактов, который агент сможет извлечь, не читая маркетинговый текст.

{
  "@context": "https://schema.org",
  "@type": "SoftwareApplication",
  "@id": "https://example.com/app/#software",
  "name": "Acme Copilot",
  "url": "https://example.com/app/",
  "applicationCategory": "BusinessApplication",
  "operatingSystem": "Web",
  "offers": { "@type": "Offer", "price": "29", "priceCurrency": "USD" },
  "aggregateRating": { "@type": "AggregateRating", "ratingValue": "4.8", "ratingCount": "127" }
}

Product + Offer — самый измеримый тип для коммерции. Для merchant listings Google требует у Product как минимум name, image и offers, а внутри Offer — действующую цену (price или priceSpecification.price) и валюту. availability относится к рекомендуемым, а description, brand и GTIN Google настоятельно советует добавлять, потому что они улучшают качество и проверяемость данных (Google).

{
  "@context": "https://schema.org",
  "@type": "Product",
  "@id": "https://example.com/products/widget-pro#product",
  "name": "Widget Pro",
  "image": ["https://example.com/images/widget-pro.jpg"],
  "brand": { "@type": "Brand", "name": "Acme" },
  "sku": "WIDGET-PRO-1",
  "offers": {
    "@type": "Offer",
    "url": "https://example.com/products/widget-pro",
    "price": "199.00",
    "priceCurrency": "USD",
    "availability": "https://schema.org/InStock"
  }
}

Для шопинга page-level schema — лишь часть истории. OpenAI публично продвигает структурированные product feeds: документация Agentic Commerce описывает, как мерчанты передают feed, который ChatGPT индексирует, чтобы понимать атрибуты товара и показывать актуальные цену и наличие, и называет эти поля «канонической записью», используемой для показа и ссылки на товар (OpenAI). Так что для каталога schema.org на странице — хорошая база, но product feed — ещё более прямой канал в ChatGPT shopping.

FAQPage всё ещё работает как строго структурированный формат Q&A, но в 2026 году требует оговорки. Валидный FAQPage строится вокруг mainEntity, где у каждого Question есть name и acceptedAnswer, а у каждого Answer — text. Однако текущая документация Google сообщает, что FAQ rich results перестали показываться в Google Поиске 7 мая 2026 года, а поддержка FAQ в Rich Results Test удаляется в июне 2026 года (Google). Используйте его как честную семантическую нормализацию FAQ, которые пользователи реально видят, — а не как новый рычаг роста для ИИ. И только там, где у каждого вопроса один официальный ответ; если ответы могут добавлять пользователи, Google рекомендует QAPage.

{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "Is there a free plan?",
      "acceptedAnswer": { "@type": "Answer", "text": "Yes. There is a free tier with core features." }
    }
  ]
}

Какие ошибки ломают пользу от JSON-LD?

«Мы добавили schema, и ничего не произошло» почти всегда сводится к одному из этого.

Сломанный JSON. W3C прямо указывает, что документ JSON-LD всегда должен быть валидным JSON; если базовый JSON синтаксически неверен, ни один потребитель не сможет надёжно прочитать его как linked data (W3C).
Разорванный граф. Когда одна и та же сущность размечена разными @id — или вовсе без него, — потребитель не понимает, что это один объект. Google советует использовать @id, чтобы связать элементы и Поиск понял, например, что видео относится к конкретному рецепту (Google). Один канонический id на сущность, переиспользуемый везде.
Разметка, не совпадающая со страницей. Google предупреждает, что структурированные данные должны представлять основной контент страницы, не должны описывать скрытый от пользователя контент и не должны вводить в заблуждение; для FAQ — что контент должен быть виден на странице (Google). Валидная, но невидимая разметка подрывает доверие ко всей вашей разметке.
Неполные consumer-specific поля. Словарь гибок, но конкретные потребители определяют свои обязательные поля. Без name, image, offers и действующей цены с валютой Product просто не получает eligibility как merchant listing (Google).
Неверный тип страницы. Размечать пользовательский support-тред как FAQPage — плохая модель; Google рекомендует QAPage, когда ответы могут добавлять пользователи. Давайте странице основной тип, соответствующий её реальной теме.
Блокировки, устаревание или данные только через JS. Google просит не блокировать страницы со структурированными данными через robots.txt или noindex и поддерживать актуальность time-sensitive данных. OpenAI пишет, что OAI-SearchBot нужно разрешить, иначе сайт не появится в поиске ChatGPT (OpenAI). А если критические факты существуют только после запуска клиентского JavaScript, многие ИИ-краулеры, которые не рендерят JavaScript, их не увидят. Размещайте семантическое ядро и JSON-LD в первом HTML.

Как структурированные данные связаны с ИИ-ответами и измерением?

Для ИИ-функций Google продавайте schema как часть чистой технической структуры и eligibility для rich results, а не как ярлык в сводки — документация ясно говорит, что специальных требований нет (Google). Выигрыш — снижение неоднозначности, а не гарантированное цитирование.

Для ChatGPT связь идёт через доступ к обходу и citability. FAQ OpenAI для издателей говорит, что любой публичный сайт может появляться в поиске ChatGPT, а чтобы вас обнаружили, показали и явно процитировали, нельзя блокировать OAI-SearchBot — это отдельная настройка от обучающего краулера GPTBot (OpenAI). Если не уверены, каких ботов вы разрешаете, наш гайд по управлению ИИ-краулерами в robots.txt распутывает эту матрицу. Для агентного браузинга OpenAI пишет, что агент ChatGPT лучше понимает сайты, которые следуют практикам доступности и используют роли и метки ARIA, — так что семантика интерфейса нередко важна не меньше, чем JSON-LD в <head>.

Измерять результат тоже стало проще. 3 июня 2026 года Google запустил отчёты Search Console для генеративных ИИ-функций, включая видимость в AI Overviews, AI Mode и генеративном ИИ в Discover (Google). OpenAI сообщает, что издатели, разрешившие OAI-SearchBot, могут отслеживать реферальный трафик из ChatGPT по utm_source=chatgpt.com. Ни то, ни другое не докажет, что конкретный рост вызван schema, но вместе они позволяют связать улучшения технической структуры с изменениями ИИ-видимости и реферального трафика.

Как проверять разметку?

Проверяйте в три слоя, потому что «валидно по schema.org» и «поддерживается конкретной платформой» — не одно и то же.

Schema Markup Validator — для базового синтаксиса и корректности на уровне словаря (schema.org).
Google Rich Results Test — чтобы увидеть, какие rich results Google может сгенерировать (consumer-specific eligibility).
URL Inspection / Search Console — чтобы увидеть страницу так, как её видит Google, и проверить индексацию, доступность и отсутствие препятствий для краулера.

Случай с FAQ показывает, почему различие важно: идеально валидный FAQPage больше нельзя подавать как актуальный рычаг роста в Google теперь, когда FAQ rich results исчезли, а поддержка FAQ уходит из Rich Results Test. После этого опирайтесь на schema-валидатор и проверки «контент совпадает со страницей», а не на превью rich result.

Как проверить весь сайт сразу?

Проверить один шаблон вручную реально; проверять каждый шаблон на каждом релизе, по структурированным данным и по слоям под ними, — нет. Эту работу делает aiSiteReady. Он загружает ваш сайт так, как это сделал бы агент, и сообщает по Meta & structured data (JSON-LD, Open Graph), HTML без JavaScript, robots.txt, sitemap.xml, правилам для ИИ-краулеров и обнаружению протоколов вроде MCP и OAuth — в виде оценки от 0 до 100 с блокерами и приоритизированными исправлениями.

Это относится к проверкам обнаружимости и протоколов в оценке, рядом со шлюзом доступности контента, который решает, может ли агент вообще прочитать вашу страницу. Точные проверки и веса описаны на странице методологии, а этот гайд — подробный разбор структурированных данных за материалом о том, что значит готовность к ИИ-агентам. Когда страницы станут читаемыми, можно также дать ассистентам курируемую карту чтения через llms.txt.

Запустите бесплатное сканирование, чтобы увидеть, действительно ли ChatGPT, Claude, Perplexity и Google AI читают ваш JSON-LD, переживает ли контент отсутствие JavaScript, не мешают ли robots.txt и sitemap.xml и какие исправления дадут наибольший эффект первыми — на английском, украинском или русском.

Если коротко: schema.org не заставит ассистентов вас цитировать, но делает ваш сайт гораздо легче для правильного чтения, сопоставления и извлечения фактов — а именно на этом строится качественный ИИ-retrieval.

У IMozz 20 лет в разработке ПО, а последний год он строит продукты с помощью LLM. Он развивает aiSiteReady, сканер только для чтения, который проверяет, может ли ИИ-агент прочитать сайт. Сканер серверно рендерит собственный контент как рабочий пример.