Перейти к основному содержимому
БЛОГ

Что такое llms.txt и как его добавить?

llms.txt — это карта ваших ключевых страниц для ИИ-моделей, но он есть лишь у ~10% из 300k доменов. Разбираем формат, куда его класть и чем он отличается от robots.txt.

Автор: IMozzОбновлено 2026-06-03
Что такое llms.txt — aiSiteReady

llms.txt — это файл в обычном Markdown по адресу /llms.txt, который даёт ИИ-моделям и агентам короткую курируемую карту ваших самых важных страниц. Jeremy Howard предложил его 3 сентября 2024 года (llmstxt.org). Логика проста. Целый сайт редко помещается в контекстное окно модели, а сырой HTML, полный навигации и шума вёрстки, плохо читается машиной. Поэтому вместо того, чтобы заставлять ассистента обходить сайт и гадать, вы вручаете ему чистый короткий список того, что прочитать первым.

Это не официальный стандарт уровня robots.txt. Это открытая конвенция, и это различие важно для того, как им стоит пользоваться.

Ключевые выводы

  • llms.txt — это предложенная конвенция, а не утверждённый стандарт. Jeremy Howard опубликовал её в сентябре 2024 года (llmstxt.org).
  • Формат — Markdown: название в H1, summary в одну строку, затем разделы H2 с курируемыми ссылками. Строго обязателен только H1.
  • Его уже отдают реальные платформы, включая OpenAI, Stripe, Cloudflare и Mintlify, который автоматически генерирует llms.txt и llms-full.txt для документации (Mintlify).
  • Это не приём для ранжирования. Google говорит, что специальные ИИ-файлы вообще не нужны (Google Search Central), а исследование ~300 000 доменов не нашло явной связи с цитированием в ИИ (Search Engine Journal).
  • Относитесь к нему как к недорогому слою обнаружимости, особенно для документации, API, тарифов и политик. aiSiteReady отдаёт собственный /llms.txt и проверяет ваш в сканировании.

Какую проблему на самом деле решает llms.txt?

llms.txt отвечает на узкую проблему, которую спецификация формулирует прямо. Модели всё чаще опираются на веб-контент, но их контекстные окна ограничены, а превращение сложной HTML-страницы в чистый и надёжный текст остаётся шумным и неточным (llmstxt.org). Файл не призван зеркалить весь сайт. Он призван дать модели короткую курируемую точку входа к вашим самым ценным материалам.

Именно поэтому формат — Markdown, а не XML. Markdown читаем и людьми, и моделями, но при этом достаточно предсказуем для обычного парсинга. Другая ключевая идея — момент. llms.txt задуман для того мгновения, когда пользователь о чём-то спрашивает и ассистенту нужно решить, какие страницы взять в контекст. Это не отдельный протокол для обучения моделей.

Сценарии применения шире, чем одни лишь API-доки. Сама спецификация перечисляет документацию библиотек, сайты компаний и личные страницы, интернет-магазины с товарами и политиками, образовательные ресурсы. Полезная рамка: llms.txt — это не столько «SEO-файл для ИИ», сколько курируемая карта самых ценных знаний вашего сайта.

Как выглядит хороший llms.txt?

Корректный файл идёт в фиксированном порядке. Он открывается H1 с названием сайта или проекта, необязательным blockquote с summary, затем необязательными абзацами или списками. После этого идут разделы H2, где каждая строка — markdown-ссылка с необязательным описанием после двоеточия (llmstxt.org). Строго говоря, обязателен только H1, но полезный файл почти всегда включает summary и курируемые разделы. Особый раздел ## Optional помечает ссылки, которые агент может пропустить ради более короткого контекста.

Вот сокращённый фрагмент нашего файла — того, что aiSiteReady отдаёт по адресу /llms.txt (он на английском: таков конвенциональный формат):

# aiSiteReady

> aiSiteReady scans a public website and returns an Agent Readiness
> Score (0–100) that shows whether AI agents and AI search engines can
> discover, read, govern, and transact with the site.

## What it checks

- **Discoverability** — robots.txt, sitemap, Link headers, structured data.
- **Content accessibility** — Markdown negotiation, /llms.txt, server-rendered content.
- **Bot governance** — AI-bot access rules, content-usage directives, rate-limit hints.

## Pages

- [Home / scanner](https://example.com/): Start a free scan
- [Privacy policy](https://example.com/privacy): What we store, and for how long

## More

- [llms-full.txt](https://example.com/llms-full.txt): A fuller machine-readable summary

Прочтите его сверху вниз — и роли становятся ясны. H1 — это идентичность. Blockquote — сжатый контекст, который ассистент читает первым. Каждый ## — логический кластер знаний, а каждая строка - [Заголовок](url): описание — конкретная точка входа. Описание делает работу, объясняя модели, почему ссылку стоит открыть.

Многие команды документации теперь отдают и спутник llms-full.txt, который встраивает само содержимое страниц для агентов, желающих получить всё одним запросом. Держите описания короткими и честными. Как только файл превращается в неранжированную свалку, он перестаёт быть картой и снова становится шумом.

Куда его класть и как им пользуются ассистенты?

Безопасный ответ — /llms.txt в корне сайта. Это путь, описанный в спецификации, и тот, что ищет аудит Lighthouse в Chrome (Chrome for Developers). Рекомендации Vercel по «читаемости для агентов» также допускают /.well-known/llms.txt или /docs/llms.txt. Они советуют отдавать файл как text/plain, а перечисленные URL делать с расширением .md или .mdx, а не .html (Vercel).

Это уже не мысленный эксперимент. Stripe публикует /llms.txt, который подсказывает агентам, как получить Markdown-версию любой страницы документации (Stripe). Mintlify автоматически генерирует и llms.txt, и llms-full.txt для каждого проекта документации, который он хостит (Mintlify). OpenAI и Cloudflare отдают собственные.

Ассистенты используют файл в момент запроса. Когда пользователь спрашивает о вашем продукте, агент может взять /llms.txt, увидеть, какие страницы важны, и взять их в контекст вместо слепого обхода. Lighthouse теперь встроил это в аудит готовности к агентам, помечая ошибки сервера при чтении файла и ставя N/A, когда файла просто нет.

Три файла — три задачи: robots.txt управляет обходом, sitemap.xml перечисляет все URL, а llms.txt курирует страницы, которые ИИ-моделям стоит прочитать первыми

Чем llms.txt отличается от robots.txt и sitemap.xml?

Они живут в трёх разных слоях, поэтому ни один не заменяет другой. robots.txt — это контроль обхода: он сообщает краулерам, какие URL им можно запрашивать. Это неподходящий инструмент, чтобы скрыть страницу: Google отмечает, что robots.txt ненадёжно убирает URL из результатов. sitemap.xml — это плоский инвентарь ваших канонических страниц без описаний. llms.txt — ни то, ни другое. Это короткий семантический гид, который говорит, какие страницы важнее всего и в каком порядке их читать.

ФайлЧем управляетДля чегоНе для этого
robots.txtКаким краулерам можно запрашивать какие URLПолитика обхода для ботовСкрыть страницу (нужен noindex)
sitemap.xmlПлоский инвентарь канонических URLПомочь поисковикам найти ваши URLСказать, что важнее всего
llms.txtКакие страницы важны и в каком порядкеИИ-дружелюбная карта чтенияБлокировка или ранжирование

Так что правило простое, но его стоит повторить. Для политики обхода — robots.txt. Чтобы убрать страницу из поиска — noindex. Для обнаружения URL — sitemap. Для ИИ-дружелюбной карты чтения — llms.txt. Путаница между ними — самая частая ошибка в материалах про GEO, и из-за неё от файла ждут блокировки или ранжирования, хотя он не делает ни того, ни другого.

Какие ошибки с llms.txt встречаются чаще всего?

Самая частая — называть его «robots.txt для ИИ». Удобно с точки зрения маркетинга и технически неверно: llms.txt не задаёт правил обхода и не заменяет ни noindex, ни bot-specific директивы.

Вторая — обещать, что один лишь файл повысит ваши Google AI Overviews или цитируемость в ИИ. Тут позиция Google прямая: «Вам не нужно создавать новые машиночитаемые файлы, ИИ-текстовые файлы или разметку, чтобы появляться в этих функциях» (Google Search Central). Независимые замеры подтверждают осторожность. Анализ почти 300 000 доменов нашёл llms.txt примерно у 10% из них и без явного влияния на то, как часто ИИ-системы цитируют сайт (Search Engine Journal).

Остальные ошибки — практические. Не ссылайтесь на HTML-only страницы, битые URL, приватные документы или пустые секции. Не сваливайте сотни неприоритизированных ссылок, воссоздавая sitemap без его формальной пользы. И если вы действительно хотите, чтобы ассистенты читали ваш контент, помните: опубликовать файл недостаточно. OpenAI рекомендует не блокировать его поисковый краулер в robots.txt, а ИИ-функции Google по-прежнему зависят от обычной обходимости. Файл показывает дорогу; пройти по ней разрешают уже ваши правила для ботов.

Как проверить, что ваш llms.txt работает?

Проверяйте в три слоя. Первый — сам файл: он должен открываться по своему URL и отдавать чистый ответ, в идеале 200 с text/plain или text/markdown. Второй — путь агента к вашему контенту: убедитесь, что нужные боты не заблокированы, что есть sitemap и что основной контент читается без запуска JavaScript. Третий — вся картина целиком, в виде оценки, чтобы знать, с чего начать.

Этот последний слой и делает aiSiteReady. Он проверяет ваш сайт так, как это сделал бы ассистент. llms.txt — лишь одна из примерно 15–20 проверок по обнаружимости, доступности контента, управлению ботами, протоколам и коммерции. Вы получаете оценку Agent Readiness Score от 0 до 100, блокеры, которые стоят вам больше всего баллов, и конкретные исправления. Точные проверки и веса описаны на странице методологии, а llms.txt относится к обнаружимости — рядом с robots.txt и вашим sitemap.

Запустите бесплатное сканирование, чтобы увидеть, могут ли ChatGPT, Perplexity, Claude и ИИ-поверхности Google найти ваш llms.txt, прочитать контент и соблюсти ваши правила для ботов. А затем начните с самых влиятельных пробелов.

IMozz создаёт aiSiteReady — сканер только для чтения, который проверяет, могут ли ИИ-агенты прочитать сайт. Он отдаёт собственные /llms.txt и /llms-full.txt как рабочие примеры.

Частые вопросы

llms.txt — это официальный стандарт?
Нет. Это открытое предложение, которое Jeremy Howard опубликовал 3 сентября 2024 года на llmstxt.org, а не утверждённый стандарт вроде robots.txt, определённого в RFC 9309. Ни один крупный поисковик не подтвердил использование его как сигнала ранжирования, и Google говорит, что он не нужен для появления в ИИ-функциях.
Улучшит ли llms.txt мои позиции в Google или цитируемость в ИИ?
Доказанного прироста нет. Google прямо пишет, что не нужно создавать специальные ИИ-файлы или разметку, чтобы попадать в его ИИ-функции. Исследование почти 300 000 доменов нашло llms.txt лишь примерно у 10% из них и без явной связи с частотой цитирования в ИИ. Относитесь к нему как к недорогому слою обнаружимости, а не к приёму для ранжирования.
Куда класть файл llms.txt?
В корень сайта, как /llms.txt. Это путь, описанный в спецификации, и тот, что проверяет аудит Lighthouse в Chrome. Рекомендации Vercel также допускают /.well-known/llms.txt или /docs/llms.txt. Отдавайте файл как text/plain или text/markdown и ссылайтесь на Markdown-версии страниц (.md), а не на .html.
llms.txt — это то же самое, что robots.txt?
Нет. robots.txt управляет тем, каким краулерам можно запрашивать какие URL; llms.txt курирует, какие страницы важнее всего и в каком порядке их читать. llms.txt ничего не блокирует и ничего не разрешает. Для контроля доступа используйте robots.txt и noindex; для ИИ-дружелюбной карты контента — llms.txt. Они работают в разных слоях.