llms.txt — це офіційний стандарт?

Ні. Це відкрита пропозиція, яку Jeremy Howard опублікував 3 вересня 2024 року на llmstxt.org, а не затверджений стандарт на кшталт robots.txt, визначеного в RFC 9309. Жоден великий пошуковик не підтвердив використання його як сигналу ранжування, і Google каже, що він не потрібен для появи у ШІ-функціях.

Чи покращить llms.txt мої позиції в Google або цитованість у ШІ?

Доведеного приросту немає. Google прямо пише, що не потрібно створювати спеціальні ШІ-файли чи розмітку, щоб потрапляти до його ШІ-функцій. Дослідження майже 300 000 доменів знайшло llms.txt лише приблизно у 10% з них і без явного зв'язку з частотою цитування у ШІ. Ставтеся до нього як до недорогого шару виявлюваності, а не до прийому для ранжування.

Куди класти файл llms.txt?

У корінь сайту, як /llms.txt. Це шлях, описаний у специфікації, і той, що перевіряє аудит Lighthouse у Chrome. Рекомендації Vercel також допускають /.well-known/llms.txt або /docs/llms.txt. Віддавайте файл як text/plain або text/markdown і посилайтеся на Markdown-версії сторінок (.md), а не на .html.

llms.txt — це те саме, що robots.txt?

Ні. robots.txt керує тим, яким краулерам можна запитувати які URL; llms.txt курує, які сторінки найважливіші та в якому порядку їх читати. llms.txt нічого не блокує й нічого не дозволяє. Для контролю доступу використовуйте robots.txt і noindex; для ШІ-дружньої карти контенту — llms.txt. Вони працюють у різних шарах.

БЛОГ

Що таке llms.txt і як його додати?

llms.txt — це карта ваших ключових сторінок для ШІ-моделей, але він є лише у ~10% із 300k доменів. Розбираємо формат, куди його класти й чим він відрізняється від robots.txt.

Автор: IMozzОновлено 2026-06-03

llms.txt — це файл у звичайному Markdown за адресою /llms.txt, який дає ШІ-моделям та агентам коротку куровану карту ваших найважливіших сторінок. Jeremy Howard запропонував його 3 вересня 2024 року (llmstxt.org). Логіка проста. Цілий сайт рідко вміщується в контекстне вікно моделі, а сирий HTML, повний навігації та шуму верстки, погано читається машиною. Тому замість того, щоб змушувати асистента обходити сайт і вгадувати, ви вручаєте йому чистий короткий список того, що прочитати першим.

Це не офіційний стандарт рівня robots.txt. Це відкрита конвенція, і ця відмінність важлива для того, як ним варто користуватися.

Ключові висновки
llms.txt — це запропонована конвенція, а не затверджений стандарт. Jeremy Howard опублікував її у вересні 2024 року (llmstxt.org).
Формат — Markdown: назва в H1, summary в один рядок, потім розділи H2 з курованими посиланнями. Строго обов'язковий лише H1.
Його вже віддають реальні платформи, зокрема OpenAI, Stripe, Cloudflare і Mintlify, який автоматично генерує llms.txt та llms-full.txt для документації (Mintlify).
Це не прийом для ранжування. Google каже, що спеціальні ШІ-файли взагалі не потрібні (Google Search Central), а дослідження ~300 000 доменів не знайшло явного зв'язку з цитуванням у ШІ (Search Engine Journal).
Ставтеся до нього як до недорогого шару виявлюваності, особливо для документації, API, тарифів і політик. aiSiteReady віддає власний /llms.txt і перевіряє ваш у скануванні.

Яку проблему насправді розв'язує llms.txt?

llms.txt відповідає на вузьку проблему, яку специфікація формулює прямо. Моделі дедалі частіше спираються на веб-контент, але їхні контекстні вікна обмежені, а перетворення складної HTML-сторінки на чистий і надійний текст лишається шумним і неточним (llmstxt.org). Файл не покликаний дзеркалити весь сайт. Він покликаний дати моделі коротку куровану точку входу до ваших найцінніших матеріалів.

Саме тому формат — Markdown, а не XML. Markdown читаний і людьми, і моделями, але водночас достатньо передбачуваний для звичайного парсингу. Інша ключова ідея — момент. llms.txt задуманий для тієї миті, коли користувач про щось запитує й асистенту потрібно вирішити, які сторінки взяти в контекст. Це не окремий протокол для навчання моделей.

Сценарії застосування ширші, ніж самі лише API-доки. Сама специфікація перелічує документацію бібліотек, сайти компаній і особисті сторінки, інтернет-магазини з товарами та політиками, освітні ресурси. Корисна рамка: llms.txt — це не стільки «SEO-файл для ШІ», скільки курована карта найцінніших знань вашого сайту.

Який вигляд має хороший llms.txt?

Коректний файл іде у фіксованому порядку. Він відкривається H1 з назвою сайту чи проєкту, необов'язковим blockquote із summary, потім необов'язковими абзацами або списками. Після цього йдуть розділи H2, де кожен рядок — markdown-посилання з необов'язковим описом після двокрапки (llmstxt.org). Строго кажучи, обов'язковий лише H1, але корисний файл майже завжди включає summary та куровані розділи. Особливий розділ ## Optional позначає посилання, які агент може пропустити заради коротшого контексту.

Ось скорочений фрагмент нашого файлу — того, що aiSiteReady віддає за адресою /llms.txt (він англійською: такий конвенційний формат):

# aiSiteReady

> aiSiteReady scans a public website and returns an Agent Readiness
> Score (0–100) that shows whether AI agents and AI search engines can
> discover, read, govern, and transact with the site.

## What it checks

- **Discoverability** — robots.txt, sitemap, Link headers, structured data.
- **Content accessibility** — Markdown negotiation, /llms.txt, server-rendered content.
- **Bot governance** — AI-bot access rules, content-usage directives, rate-limit hints.

## Pages

- [Home / scanner](https://example.com/): Start a free scan
- [Privacy policy](https://example.com/privacy): What we store, and for how long

## More

- [llms-full.txt](https://example.com/llms-full.txt): A fuller machine-readable summary

Прочитайте його згори вниз — і ролі стають зрозумілі. H1 — це ідентичність. Blockquote — стиснутий контекст, який асистент читає першим. Кожен ## — логічний кластер знань, а кожен рядок - [Заголовок](url): опис — конкретна точка входу. Опис робить роботу, пояснюючи моделі, чому посилання варто відкрити.

Багато команд документації тепер віддають і супутник llms-full.txt, який вбудовує сам вміст сторінок для агентів, що хочуть отримати все одним запитом. Тримайте описи короткими й чесними. Щойно файл перетворюється на неранжований звалище, він перестає бути картою й знову стає шумом.

Куди його класти і як ним користуються асистенти?

Безпечна відповідь — /llms.txt у корені сайту. Це шлях, описаний у специфікації, і той, що шукає аудит Lighthouse у Chrome (Chrome for Developers). Рекомендації Vercel щодо «читаності для агентів» також допускають /.well-known/llms.txt або /docs/llms.txt. Вони радять віддавати файл як text/plain, а перелічені URL робити з розширенням .md або .mdx, а не .html (Vercel).

Це вже не уявний експеримент. Stripe публікує /llms.txt, який підказує агентам, як отримати Markdown-версію будь-якої сторінки документації (Stripe). Mintlify автоматично генерує і llms.txt, і llms-full.txt для кожного проєкту документації, який він хостить (Mintlify). OpenAI і Cloudflare віддають власні.

Асистенти використовують файл у момент запиту. Коли користувач запитує про ваш продукт, агент може взяти /llms.txt, побачити, які сторінки важливі, і взяти їх у контекст замість сліпого обходу. Lighthouse тепер вбудував це в аудит готовності до агентів, позначаючи помилки сервера під час читання файлу та ставлячи N/A, коли файлу просто немає.

Три файли — три завдання: robots.txt керує обходом, sitemap.xml перелічує всі URL, а llms.txt курує сторінки, які ШІ-моделям варто прочитати першими

Чим llms.txt відрізняється від robots.txt і sitemap.xml?

Вони живуть у трьох різних шарах, тому жоден не замінює інший. robots.txt — це контроль обходу: він повідомляє краулерам, які URL їм можна запитувати. Це невідповідний інструмент, щоб сховати сторінку: Google зазначає, що robots.txt ненадійно прибирає URL із результатів. sitemap.xml — це плоский інвентар ваших канонічних сторінок без описів. llms.txt — ні те, ні інше. Це короткий семантичний гід, який каже, які сторінки найважливіші та в якому порядку їх читати.

Файл	Чим керує	Для чого	Не для цього
`robots.txt`	Яким краулерам можна запитувати які URL	Політика обходу для ботів	Сховати сторінку (потрібен `noindex`)
`sitemap.xml`	Плоский інвентар канонічних URL	Допомогти пошуковикам знайти ваші URL	Сказати, що найважливіше
`llms.txt`	Які сторінки важливі та в якому порядку	ШІ-дружня карта читання	Блокування чи ранжування

Тож правило просте, але його варто повторити. Для політики обходу — robots.txt. Щоб прибрати сторінку з пошуку — noindex. Для виявлення URL — sitemap. Для ШІ-дружньої карти читання — llms.txt. Плутанина між ними — найчастіша помилка в матеріалах про GEO, і через неї від файлу чекають блокування чи ранжування, хоча він не робить ні того, ні іншого.

Які помилки з llms.txt трапляються найчастіше?

Найчастіша — називати його «robots.txt для ШІ». Зручно з погляду маркетингу й технічно неправильно: llms.txt не задає правил обходу й не замінює ні noindex, ні bot-specific директиви.

Друга — обіцяти, що сам лише файл підвищить ваші Google AI Overviews чи цитованість у ШІ. Тут позиція Google пряма: «Вам не потрібно створювати нові машиночитані файли, ШІ-текстові файли чи розмітку, щоб з'являтися в цих функціях» (Google Search Central). Незалежні заміри підтверджують обережність. Аналіз майже 300 000 доменів знайшов llms.txt приблизно у 10% з них і без явного впливу на те, як часто ШІ-системи цитують сайт (Search Engine Journal).

Решта помилок — практичні. Не посилайтеся на HTML-only сторінки, биті URL, приватні документи чи порожні секції. Не звалюйте сотні неприоритизованих посилань, відтворюючи sitemap без його формальної користі. І якщо ви справді хочете, щоб асистенти читали ваш контент, пам'ятайте: опублікувати файл недостатньо. OpenAI рекомендує не блокувати його пошуковий краулер у robots.txt, а ШІ-функції Google досі залежать від звичайної обхідності. Файл показує дорогу; пройти нею дозволяють уже ваші правила для ботів.

Як перевірити, що ваш llms.txt працює?

Перевіряйте у три шари. Перший — сам файл: він має відкриватися за своїм URL і віддавати чисту відповідь, в ідеалі 200 з text/plain або text/markdown. Другий — шлях агента до вашого контенту: переконайтеся, що потрібні боти не заблоковані, що є sitemap і що основний контент читається без запуску JavaScript. Третій — уся картина цілком, у вигляді оцінки, щоб знати, з чого почати.

Цей останній шар і робить aiSiteReady. Він перевіряє ваш сайт так, як це зробив би асистент. llms.txt — лише одна з приблизно 15–20 перевірок із виявлюваності, доступності контенту, керування ботами, протоколів і комерції. Ви отримуєте оцінку Agent Readiness Score від 0 до 100, блокери, які коштують вам найбільше балів, і конкретні виправлення. Точні перевірки та ваги описані на сторінці методології, а llms.txt належить до виявлюваності — поруч із robots.txt і вашим sitemap.

Запустіть безкоштовне сканування, щоб побачити, чи можуть ChatGPT, Perplexity, Claude та ШІ-поверхні Google знайти ваш llms.txt, прочитати контент і дотриматися ваших правил для ботів. А потім почніть із найвпливовіших прогалин.

IMozz створює aiSiteReady — сканер лише для читання, який перевіряє, чи можуть ШІ-агенти прочитати сайт. Він віддає власні /llms.txt і /llms-full.txt як робочі приклади.