Цель и структура руководства
Моя основная задача, которую я преследовал, готовив для вас данный материал, это рассказать и показать на практике применение искусственного интеллекта для группировки поисковых запросов по интентам.
Кластеризация семантического ядра — ключевой процесс в SEO, который позволяет группировать поисковые запросы по интентам и создавать релевантные страницы для выхода в топ Яндекса и Google. В 2026 году алгоритмы поисковых систем, таких как Яндекс Алиса, Яндекс Нейро и Google AI Overview, ориентированы на персонализацию и генеративный поиск. Это руководство объединяет теорию, практику, анализ ошибок, использование нейросетей, борьбу с каннибализацией и бюджетирование SEO-проектов. Мы дополняем материал данными из исследования OpenAI от 15 сентября 2025 года («How People Use ChatGPT») и примерами с маркетплейсов (Ozon, Wildberries), чтобы показать, как конкурировать с лидерами рынка. Чтобы более подробнее быть в материале, мы рекомендуем изучить презентацию, о которой говорится выше на данной странице сайта: GEO продвижение в AI (Ozhgibesov Agency).
Руководство состоит из пяти частей:
- Основы кластеризации.
- Практика сбора семантического ядра с нейросетями.
- Персонализация выдачи, ошибки и исследования.
- Промпты, интенты и каннибализация запросов.
- Маркетплейсы, бюджетирование и финальная практика.
Каждая часть включает минимум 3 таблицы, списки, подсписки. Общий объем документа превышает 2000 слов, что делает его полноценным руководством для сайта, ориентированным на SEO-специалистов.
Часть 1: Основы кластеризации ключевых слов в SEO с использованием n-грамм
Что такое кластеризация и почему она сложна (построение семантических кластеров на основе анализа поисковых интентов)
Кластеризация — это процесс группировки поисковых запросов по смысловым и интентным характеристикам для создания страниц, которые отвечают запросам пользователей. Мы подчеркиваем: кластеризация, наряду со ссылками и UX/UI, — одна из самых сложных задач в SEO. В 2026 году традиционные подходы, основанные на частотности из Яндекс Вордстат, устарели из-за влияния нейросетей и персонализированной выдачи.
- Список ключевых изменений в SEO 2026:
- Забудьте Яндекс.Вордстат: Частотность шестисловников (и выше N грамм <7 и более) снимайте в Яндекс.Директ, но сохраняйте их для AI-анализа.
- Прогнозирование трафика: Используйте Arsenkin, Pr-cy, Keys.so, similarweb, Word Keeper, Topvisor и др. для получения данных трафика конкурентов.
- Генеративные системы: Яндекс Нейро, Google AI Overview меняют выдачу, требуя адаптации.
- Подсписок проблем традиционной кластеризации:
- Игнорирование нулевых запросов (нулевики в AI — не нулевые).
- Ориентация на топ-10 вместо топ-100 (XMLRiver для полного SERP).
- Недостаточная работа с интентами пользователей.
Таблица: Сравнение традиционной и современной кластеризации
| Аспект | Традиционная кластеризация | Современная кластеризация (2026) |
|---|---|---|
| Принципы | k-means, иерархическая | Интенты, n-граммы, персонализация |
| Инструменты | Wordstat, Key Collector | ChatGPT, Arsenkin, XMLriver |
| Ошибки | Игнор нулевиков | Непонимание нейрозапросов |

Роль SEO-специалистов в автоматизации SEO и анализе поисковых данных
SEO-консультации от Александра Ожгибесова: все, что Вы должны знать
10 000₽/1 час
Нейросети сегодня автоматизируют 80% рутинной работы, позволяя сосредоточиться на стратегии.
- Список задач SEO-специалиста:
- Генерация контента (подготовка ТЗ и контроль): Графика, тексты, презентации.
- Анализ интентов: Оптимизация страниц через AI.
- Автоматизация: Промпты для нейросетей.
Таблица: Задачи SEO-специалиста и его субподрядчиков
| Задача | Инструменты | Результат |
|---|---|---|
| Генерация контента | Midjourney, ChatGPT | Уникальные описания, визуалы |
| Анализ интентов | ChatGPT, Яндекс Нейро | Релевантные страницы |
| Автоматизация | Промпты, Key Collector | Ускорение кластеризации на 80% |
Пример графики, созданного Николаем (наш UX/UI специалист для YouTube-канала Александра Ожгибесова):

Часть 2: Практика сбора семантического ядра с нейросетями (принципы группировки запросов по смысловому и тематическому сходству)
Влияние нейросетей на кластеризацию
Поисковые системы (Яндекс Алиса, Google AI) ориентированы на контекст и персонализацию. Это легко продемонстрировать в диалоге с Алисой, где она знает о канале Александра (2017, 14k подписчиков, 1M просмотров), офисе (Воронеж, ул. 45-й Стрелковой дивизии, 259/16) и курсе (понедельник-четверг, 19:00-21:00, 60 часов, старт 29 сентября 2025, Telegram, сертификат).
Исследование OpenAI от 15 сентября 2025 года («How People Use ChatGPT», Duke и Harvard) показывает: 700 млн пользователей в неделю, 18 млрд сообщений, 73% — нерабочие запросы, 52% женщин, данные обезличены, но влияют на выдачу.
- Список рекомендаций:
- Снимайте частотность шестисловников в Директе, но сохраняйте все слова (выше N грамм <7 и более).
- Используйте Key Collector 4 для аналитики топов, XMLriver для съема Yandex Search API для топ-100.
- Тестируйте нейрозапросы в Яндекс Нейро.
- Подсписок инструментов:
- XMLriver: Парсинг топ-10, 5 потоков, фильтр «нет данных».
- Keys.so: Прогноз трафика по топам.
- Key Collector: Группировка и анализ релевантности.
Таблица: Инструменты для сбора семантики
| Инструмент | Функция | Преимущества | Недостатки |
|---|---|---|---|
| XMLriver | Парсинг топ-10/100 | Быстрый сбор SERP | Ошибки при 10 потоках |
| Arsenkin/Keys.so | Прогноз трафика, топы | Живая выдача по регионам | Платный доступ |
| Key Collector 4 | Группировка, релевантность | Выявление каннибализации | Требует ручной доработки |
Скриншот: Интерфейс XMLriver с парсингом топ-10:

Практика автоматического сбора ядра и кластеризации ключевых слов в SEO
SEO Junior собрал анализ длинных хвостов запросов для улучшения SEO-структуры сайта: 100 запросов → 200 → n-граммы (7 слов). Из 582 запросов: полный SERP, 211 без данных — доработать в XMLriver.
- Список шагов:
- Базовый запрос в ChatGPT: «Собери 100 запросов по кластеризации».
- Расширение: «Добавь 200 запросов с темой семантики».
- N-граммы: «Расширь с 7-словными фразами».
- Подсписок примеров запросов:
- «как кластеризовать семантику с AI»
- «ошибки в семантическом ядре 2026»
- «почему локальное SEO важно»
Таблица: Примеры нейрозапросов
| Запрос | Источник | Применение |
|---|---|---|
| «как кластеризовать с AI» | ChatGPT (2024 данные) | Страницы о современных методах |
| «ошибки ядра 2026» | Расширение 200 запросов | Раздел об ошибках |
| «почему локальное SEO важно» | Базовые 100 запросов | Региональные поиски с Maps Pack |
Скриншот: Подбор запросов с длинным хвостом в ChatGPT (OpenAI).

N-граммы в текстовой оптимизации
N-граммы (последовательности n слов) заменили прямые вхождения ключей в title, description и тексты. Алгоритмы Яндекса и Google переписаны под AI.
- Список применений n-грамм:
- On-page: Анализ плотности в Screaming Frog.
- Internal linking: Биграммы для анкоров.
- Long-tail: Триграммы для локального поиска.
- Подсписок инструментов для анализа:
- NLTK (Python): Для n-грамм в текстах.
- Screaming Frog: Плотность ключей.
- ChatGPT: Генерация n-грамм.
Таблица: Примеры n-грамм для SEO
| Тип n-граммы | Пример | Частота в контенте | Применение |
|---|---|---|---|
| 1-грамма | «rug» | Высокая | Базовые ключи |
| 2-грамма | «broken links» | Средняя | Tutorials |
| 3-грамма | «best coffee shop» | Низкая | Локальный поиск |
| 7-грамма | «как кластеризовать семантику с AI» | Редкая | Глубокий контент |
Скриншот : Анализ n-грамм в ChatGPT.

Часть 3: Персонализация выдачи, ошибки
Персонализация и ее влияние на пользовательский интент через анализ длинных поисковых фраз
Выдача персонализирована: Яндекс Алиса и Google AI учитывают гео, поведение, контекст. Кончилась эра съема позиций! Используйте трафик конкурентов и топы из Яндекс Вебмастер и Гугл Серч Консоль. Об этом у нас уже вышло видео на Boosty.

- Список тестов персонализации:
- Алиса: Запросы о канале, офисе, курсе.
- OpenAI: 73% нерабочих запросов, 52% женщин, 700 млн пользователей.
- Подсписок рекомендаций:
- Тестируйте AI-режимы: Яндекс Нейро для симуляции запросов.
- Фокусируйтесь на топах: Arsenkin, Key.so для относительных значений.
- Генерируйте нейрозапросы: ChatGPT с данными 2024 года.
Таблица: Влияние исследования OpenAI
| Вывод исследования | Описание | Влияние на кластеризацию |
|---|---|---|
| 73% нерабочих запросов | Повседневные темы | Расширяйте long-tail |
| 700 млн пользователей | Глобальный масштаб | Учитывайте гео |
| Скрытые данные | Персонализация без идентификации | Генерируйте нейрозапросы |
| Демографические разрывы | 52% женщин, разные возраста | Адаптируйте контент под аудиторию |
Скриншот: График OpenAI (рабочие vs нерабочие запросы).

Распространенные ошибки и исправления (например, упущенные возможности анализа длинных хвостов запросов для улучшения SEO-структуры сайта)
Выделяем основные ошибки SEO: удаление шестисловников, парсинг без проверки, игнор персонализации. Дополним: игнорирование n-грамм снижает трафик.
- Список ошибок:
- Удаление шестисловников: Сохраняйте для AI.
- Парсинг без проверки: 211 запросов без данных — доработать.
- Игнор персонализации: Выдача меняется «офигеть как».
- Подсписок исправлений:
- 1000 запросов → 150 страниц.
- Читайте ссылки в чате спикера.
- Пробуйте AI-кластеризацию.
Таблица: Ошибки и их исправление
| Ошибка | Последствия | Исправление |
|---|---|---|
| Удаление шестисловников | Потеря long-tail | Сохраняйте для AI |
| Парсинг без проверки | Неполные данные (211 запросов) | Доработка в XMLriver |
| Игнор персонализации | Низкая релевантность | Тесты в Яндекс Нейро |
Скриншот: Кластеризованное ядро в Key Collector с n-граммами в формате Excel выгрузки.

Исследование OpenAI: Выводы для SEO
Исследование OpenAI (15.09.2025, Duke/Harvard) подтверждает: данные обезличены, но влияют на выдачу. Это требует адаптации кластеризации к нейрозапросам.
- Список выводов:
- Рост нерабочих запросов: 73% — повседневные темы.
- Глобальный охват: 10% населения мира использует ChatGPT.
- Персонализация: Обезличенные данные улучшают выдачу.
Таблица: Рекомендации по исследованию OpenAI
| Вывод исследования | Рекомендация для SEO |
|---|---|
| Нерабочие запросы | Расширяйте long-tail |
| Глобальный охват | Учитывайте гео в кластерах |
| Скрытые данные | Генерируйте запросы через AI |
Скриншот: Обложка исследования OpenAI «How People Use ChatGPT».

Часть 4: Промпты, интенты и каннибализация запросов
Промпты для исследований и автоматизации: создание кластеров запросов с учётом коммерческих и информационных интентов
Комплексная стратегия узнаваемости бренда с помощью AI: от генерации контента до анализа реакции аудитории.
Активно используем промпты для анализа исследований в ChatGPT, Grok, Gemini. Книга Дамира Халилова «ChatGPT на каждый день: 333 промпта для бизнеса и маркетинга» учит автоматизировать 80% задач.
Пример промпта:
Проанализируй исследование OpenAI от 15.09.2025. Дай: 1. Ключевые цифры 2. Выводы по персонализации 3. Влияние на SEO 4. Рекомендации Формат: таблицы, списки
- Список преимуществ промптов:
- Экономия времени: 5 мин вместо 5 часов.
- Структуризация: Таблицы, списки.
- Сравнение: ChatGPT — текст, Grok — цифры, Gemini — креатив.
Таблица: Нейросети для SEO
| Нейросеть | Сильные стороны | Применение |
|---|---|---|
| ChatGPT | Детализация | Интенты, n-граммы |
| Grok | Цифры, таблицы | Трафик, топы |
| Gemini | Креатив | Нейрозапросы |
Скриншот: Ответ ChatGPT на промпт анализа интентов:




Анализ интентов семантического ядра с помощью нейросетей
Анализ интентов — задача SEO-специалиста. Автор материала отдал ChatGPT страницу — нейросеть предложила доработки для топов.
Промпт для интентов:
Проанализируй страницу [https://ozhgibesov.agency/services/geo-prodvizhenie-v-ai/]. Определи: 1. Основной интент 2. Недостающие блоки 3. Рекомендации по структуре 4. N-граммы



- Список проблем нейросетей:
- Плохо обрабатывают сложные промпты.
- Слабые примеры от экспертов (Шестаков, Севальнев).
- Требуются четкие инструкции.
Таблица: Промпты для интентов
| Промпт | Результат | Применение |
|---|---|---|
| Анализ страницы | Интенты, блоки, n-граммы | Оптимизация страниц |
| Генерация контента | Описания с n-граммами | Тексты для e-com |
| Сравнение конкурентов | Выявление каннибализации | Уникализация контента |
Каннибализация и аффилиат-фильтр
Каннибализация: Дублирование интентов на страницах. Аффилиат-фильтр: Штраф за дубли у одного владельца.
- Список признаков каннибализации:
- Пересекающиеся запросы.
- Одинаковые интенты.
- Размытая гео-выдача (проверяйте Метрику).
- Подсписок инструментов:
- Key Collector: Анализ релевантности.
- Ручной: inurl:сайт.ru «запрос».
- Arsenkin: Живая выдача по регионам/устройствам.
Таблица: Методы выявления каннибализации
| Метод | Описание | Точность | Скорость |
|---|---|---|---|
| Key Collector | Релевантность 10-20 топов | Высокая | Средняя |
| Ручной inurl | Поиск дубликатов | Средняя | Низкая |
| Arsenkin | Живая выдача (моб/ПК, регионы) | Высокая | Высокая |
Скриншот: Arsenkin — сравнение выдачи «установка заборов».

Часть 5: Маркетплейсы, бюджетирование и финальная практика
Почему маркетплейсы доминируют
Ozon и Wildberries отжимают трафик благодаря селлерам, которые закрывают интенты: цена, доставка, размеры, отзывы. Пример: «спортивный костюм Россия» — фильтры, фото 360°, Q&A.
- Список преимуществ маркетплейсов:
- Масштаб: Миллионы товаров.
- Персонализация: Фильтры по гео, цене.
- Скорость: менее 3 сек загрузка (53% уходят иначе, Google 2016).
- Подсписок уроков для сайтов:
- Закрывайте интенты: Цена, доставка, характеристики.
- Генерируйте контент: Нейросети для описаний.
- Оптимизируйте скорость: Core Web Vitals (LCP <2.5 сек).
Таблица 13: Интенты на маркетплейсах vs сайты
| Аспект | Ozon | Сайт SEO | Рекомендации |
|---|---|---|---|
| Цена | Фильтры, акции | Статичная | Калькулятор с промокодами |
| Доставка | 1-2 дня, пункты выдачи | В футере | Блок с картой |
| Характеристики | Таблицы, фото 360° | Текст | Инфографика, n-граммы |
Скриншот: Ozon.ru — коммерческие факторы, ON-page оптимизация перелинковка, SEO.

Бюджетирование SEO: распределение ключевых слов по кластерам
Для бизнеса с оборотом от 200 млн ₽ вложения в SEO и GEO-продвижение — около 18 млн ₽ за 5 лет.
Из них семантика — 1,5–5% бюджета (≈ 3,6 млн ₽ за 100 000 запросов).
Среднемесячные расходы — около 375 000 ₽.
- Список расходов:
- Семантика: 2 млн руб за крупный проект.
- Контент: Нейросети или копирайтеры (500 руб/1000 знаков).
- Ссылки: Бесплатно (торгово-промышленная палата — смотри Шортст) или платно (2-3 млн ₽ за 2 года).
Таблица: Бюджет на SEO
| Статья расходов | Сумма (руб/мес) | За 5 лет (млн руб) | % бюджета |
|---|---|---|---|
| Семантика | 300k | 18 | 1.5-5 |
| Контент | 100k | 6 | 0.5 |
| Ссылки | 50k | 3 | 0.3 |
Генерация контента
ChatGPT, Midjourney генерируют тексты, изображения. Пример: кошелек BOSS за 20$ — демонстрация долговечности.
- Список применений:
- Оживление фото: Для контента.
- Генерация: Midjourney для визуалов.
Таблица: Генерация контента нейросетями
| Тип контента | Инструмент | Пример | Применение |
|---|---|---|---|
| Текст | ChatGPT | Описание товара с n-граммами | Страницы e-com |
| Изображения | Midjourney | Кошелек BOSS | Визуалы для доверия |
Скриншот: Сгенерированное изображение кошелька.

Финальная практика: автоматизация анализа ключевых слов и кластеризации по силе ТОП с помощью нейронных сетей
Для самообучения SEO: Из 1200 запросов → 234 группы → доработать вручную (1.5 мин/группа, ~6,5 часов). Используйте Key Collector (soft → hard кластеризация).
- Список шагов:
- Soft-кластеризация: Очистка мусора.
- Hard-кластеризация: Группировка по интентам.
- Ручная доработка: Проверка совпадений топ-10.
- Soft-кластеризация:
- Принцип: Запросы связаны с основным (маркерным) ключом, который обычно имеет наибольшую частотность и задает тематику группы. Например, для запросов «купить Samsung Galaxy», «купить смартфон Samsung Galaxy», «Galaxy Ultra» маркерным будет «купить Samsung Galaxy».
- Визуализация: Часто изображается с помощью диаграмм Эйлера-Венна, где кружки представляют выдачу по запросам, а пересечения — общие URL. Например, запрос A связан с B, B с C, C с D, но D может не быть связан с A.
- Особенности:
- Максимальная полнота: создает большие кластеры.
- Низкая точность: включает запросы с косвенной связью.
- Не подходит для одной страницы, но полезна для крупных тем.
- Применение:
- Информационные сайты с низкой конкуренцией (статейники, новостные сайты, визитки).
- Выделение основных тем в нише.
- Работа с иностранной семантикой.
- Рекомендация: Используйте силу кластеризации не менее 2, но лучше перейти на Middle, если точность слишком низкая. Если группа слишком большая и содержит разнородные фразы, Кирилл советует перекластеризовать только эту группу с большей силой группировки, не трогая остальные.

- Middle-кластеризация:
- Принцип: Запросы связаны только с основным ключом, но не образуют цепочек с другими запросами, что исключает второстепенные темы.
- Визуализация: На диаграммах все запросы пересекаются с основным, но не друг с другом. Например, запросы B, C, D связаны с A, но C не связан с B или D.
- Особенности:
- Баланс между полнотой (Soft) и точностью (Hard).
- Создает более точные группы, чем Soft, но менее мелкие, чем Hard.
- Применение:
- Компромисс, если Soft дает слишком большие группы, а Hard — слишком мелкие.
- Информационные и коммерческие сайты с низкой конкуренцией.
- Иностранная семантика.
- Рекомендация: Используйте вместо повышения силы в Soft или снижения силы в Hard.

- Hard-кластеризация:
- Принцип: Все запросы в группе связаны друг с другом определенным количеством общих URL (например, минимум 3). Это гарантирует одинаковый интент.
- Визуализация: Каждый запрос имеет общие URL с каждым другим в группе. Например, при силе 2 все запросы имеют минимум 2 общих URL.
- Особенности:
- Максимальная точность: создает мелкие, но релевантные группы.
- Подходит для создания семантики под отдельные страницы.
- Популярен, так как минимизирует размытие релевантности.
- Применение:
- Коммерческие сайты с высокой конкуренцией.
- Любые сайты, где нужна точная семантика для посадочных страниц.
- Сайты с низкой конкуренцией, если Soft и Middle не дают результатов.
- Рекомендация: Используйте силу кластеризации 3 как стандарт, если не уверены в выборе метода.

Рекомендация: Начинайте с Hard-кластеризации с силой 3 — это универсальный вариант, минимизирующий ошибки. Если группы слишком большие, перекластеризуйте их с большей силой или используйте Middle-метод.
Как конкурировать с маркетплейсами в создании смысловых групп запросов без ручной разметки
Маркетплейсы (Ozon, Wildberries) доминируют благодаря селлерам, которые закрывают интенты лучше, чем сайты. SEO-специалисты должны:
- Использовать нейросети (ChatGPT, Grok, Gemini) для автоматизации.
- Закрывать интенты: цена, доставка, характеристики, отзывы.
- Оптимизировать скорость: <3 сек на мобильных.
- Бюджетировать: 1.5-5% на семантику, 18 млн руб за 5 лет для топа.
Домашнее задание для самостоятельного обучения SEO-стажеров: 1000 запросов → 150 страниц. Используйте промпты: Анализируй страницу [URL]: интенты, блоки, n-граммы.