Техническое SEO

Дубли страниц на сайте — как найти и убрать дубликаты

11 мин чтения

Дубли страниц на сайте: как найти и устранить

Дубли страниц — одна из самых распространённых технических проблем, которая негативно влияет на SEO. Когда одинаковый контент доступен по нескольким URL, поисковые системы не понимают, какую версию показывать в выдаче. Проверка дубликатов должна быть частью регулярного технического аудита сайта.

Дубли размывают ссылочный вес, создают конкуренцию между собственными страницами и тратят краулинговый бюджет. В статье разберём, как найти дубли страниц на сайте, какими инструментами пользоваться и какой метод устранения выбрать: canonical, редирект или noindex.

Что такое дубли страниц

Дубли страниц — это страницы с одинаковым или существенно похожим контентом, доступные по разным URL-адресам. Поисковые системы воспринимают каждый URL как отдельную страницу, даже если содержимое идентично.

Виды дублей:

Полные дубли

100% совпадение контента на разных URL. Примеры:

  • site.ru/page/ и site.ru/page (со слешем и без)
  • site.ru и www.site.ru
  • http://site.ru и https://site.ru
  • site.ru/PAGE/ и site.ru/page/ (разный регистр)

Частичные дубли

Страницы с большим процентом совпадения контента (70-99%). Примеры:

  • Товары, отличающиеся только цветом или размером
  • Статьи с минимальными изменениями
  • Страницы категорий с разной сортировкой

Технические дубли

Возникают из-за особенностей CMS и сервера:

  • Страницы с GET-параметрами (?utm_source=..., ?sort=price)
  • Сессионные ID в URL
  • Версии для печати
  • Страницы пагинации с дублирующимся контентом

Внешние дубли

Ваш контент скопирован на другие сайты. Это отдельная проблема — борьба с плагиатом.

Почему дубли страниц опасны для SEO

Дубли наносят серьёзный ущерб позициям сайта в поиске. Дубли могут привести к фильтрам — подробнее в статье Фильтры поисковых систем — как избежать.

Каннибализация запросов

Несколько страниц вашего сайта конкурируют за одни и те же ключевые слова. Поисковик не знает, какую показывать, и может выбрать не ту. Позиции обеих страниц ниже, чем могли бы быть у одной качественной.

Размытие ссылочного веса

Внешние ссылки распределяются между дублями. Вместо того чтобы один URL получил 10 бэклинков, каждый из трёх дублей получает по 3-4. Эффект от ссылок снижается.

Трата краул-бюджета

Поисковый робот тратит ресурсы на сканирование дублей вместо новых и важных страниц. На больших сайтах это критично — часть страниц может не индексироваться.

Проблемы с индексацией

Поисковик может проиндексировать «неправильный» дубль — с параметрами, без HTTPS, с www. В выдаче будет отображаться не тот URL, который вы хотели.

Риск санкций

Массовые дубли могут быть расценены как попытка манипуляции. Особенно если дублируется коммерческий контент или создаются дорвеи.

Ухудшение поведенческих факторов

Пользователь может попасть на «неправильную» версию страницы (без HTTPS, с параметрами), что влияет на доверие и конверсию.

Причины появления дублей

Понимание причин помогает предотвратить появление новых дублей. Большинство дублей возникают из-за технических особенностей.

WWW и без WWW

Сайт доступен по site.ru и www.site.ru. Оба адреса работают, индексируются как разные страницы.

HTTP и HTTPS

После установки SSL-сертификата обе версии могут быть доступны. Без редиректа — это дубли.

Слеш в конце URL

site.ru/page и site.ru/page/ — технически разные адреса. Многие CMS отдают одинаковый контент по обоим.

Регистр символов

site.ru/Page и site.ru/page — могут работать как разные URL на некоторых серверах.

GET-параметры

URL с параметрами сортировки, фильтрации, отслеживания:

  • /catalog/?sort=price
  • /catalog/?color=red
  • /page/?utm_source=google

Сессионные идентификаторы

Некоторые CMS добавляют session ID в URL: /page?PHPSESSID=abc123. Каждая сессия — новый «дубль».

Страницы пагинации

/catalog/, /catalog/page/2/, /catalog/page/3/ — если контент частично повторяется.

Версии для печати

/article/ и /article/print/ — тот же контент в другом оформлении.

Мобильная версия на поддомене

m.site.ru дублирует основной сайт. Сейчас редкость, но встречается.

Технические страницы CMS

Теги, архивы, страницы авторов могут создавать дубли категорий или статей.

Как найти дубли страниц на сайте

Найти дубли страниц можно несколькими способами. Разберём, как найти дубли страниц на сайте с помощью разных инструментов.

Основные методы поиска дублей:

1. SEO-краулеры

Screaming Frog, Netpeak Spider, Sitebulb сканируют сайт и находят страницы с одинаковым контентом, title, description.

2. Панели вебмастеров

Яндекс Вебмастер и Google Search Console показывают проблемы с дублями в отчётах об индексации.

3. Оператор site:

Введите site:domain.ru в поиске. Если видите несколько версий одной страницы — это дубли.

4. Проверка вручную

Проверьте основные сценарии: www/без www, http/https, слеш/без слеша.

5. Онлайн-сервисы

Siteliner, Copyscape и аналоги проверяют уникальность контента и находят внутренние дубли.

Что искать:

  • Страницы с одинаковым title
  • Страницы с одинаковым H1
  • Страницы с идентичным контентом (по хешу или сравнению)
  • URL с разными параметрами, ведущие на один контент
  • Страницы без canonical или с некорректным canonical

Проверка дубликатов через Screaming Frog

Screaming Frog — лучший инструмент для проверки дубликатов на сайте. Подробнее о SEO-инструментах — в обзоре.

Поиск дублей по Title:

  1. Запустите сканирование сайта
  2. Перейдите на вкладку «Page Titles»
  3. В фильтре выберите «Duplicate»
  4. Увидите все страницы с одинаковыми title

Поиск дублей по H1:

  1. Вкладка «H1»
  2. Фильтр «Duplicate»
  3. Список страниц с одинаковыми заголовками

Поиск дублей контента:

  1. Включите опцию Content → Near Duplicates в настройках
  2. Запустите сканирование
  3. Вкладка «Content» → «Near Duplicates»
  4. Увидите страницы с похожим контентом и процент совпадения

Проверка canonical:

  1. Вкладка «Canonicals»
  2. Фильтры: «Missing», «Self Referencing», «Canonicalised»
  3. Проверьте, что canonical указывает на правильные страницы

Проверка редиректов:

  1. Вкладка «Response Codes»
  2. Фильтр «Redirection (3xx)»
  3. Убедитесь, что дубли перенаправляются на основные страницы

Экспорт результатов:

Выгрузите найденные дубли в Excel для анализа и планирования исправлений.

Поиск дублей в Яндекс Вебмастере

Яндекс Вебмастер показывает проблемы с дублями в нескольких отчётах.

Диагностика сайта:

  1. Перейдите в Диагностика → Диагностика сайта
  2. Ищите предупреждения о дублях: «Дублирование title», «Дублирование description»
  3. Кликните на проблему — увидите список затронутых страниц

Исключённые страницы:

  1. Индексирование → Страницы в индексе
  2. Посмотрите раздел «Исключённые страницы»
  3. Причина «Дубликат» — страницы, которые Яндекс посчитал дублями

Проверка конкретного URL:

  1. Инструменты → Проверка ответа сервера
  2. Введите URL
  3. Посмотрите, определяет ли Яндекс эту страницу как дубль

Что проверять:

  • Количество страниц в индексе — если сильно больше реальных страниц, есть дубли
  • Предупреждения в диагностике о дублях title/description
  • Исключённые страницы с причиной «Дубликат»

Яндекс сам определяет канонический URL и может не индексировать дубли. Но лучше указывать canonical явно.

Поиск дублей в Google Search Console

Google Search Console детально показывает проблемы с дублями и каноникалами. Как работать с GSC — полное руководство.

Отчёт о покрытии (Страницы):

  1. Индекс → Страницы (или Покрытие)
  2. Раздел «Исключённые»
  3. Ищите статусы, связанные с дублями

Статусы, указывающие на дубли:

  • «Альтернативная страница с правильным каноническим тегом» — дубль с корректным canonical
  • «Дубликат без канонической версии, выбранной пользователем» — Google сам выбрал каноническую
  • «Дубликат: Google выбрал другой канонический URL» — ваш canonical не совпал с выбором Google
  • «Дубликат: отправленный URL не выбран в качестве канонического» — страница из sitemap оказалась дублем

Проверка URL (URL Inspection):

  1. Введите URL в строку поиска GSC
  2. Посмотрите раздел «Покрытие»
  3. Проверьте «Канонический URL, выбранный пользователем» и «Канонический URL, выбранный Google»
  4. Если они различаются — проблема с canonical

Важно: Google может игнорировать ваш canonical, если посчитает его некорректным. Это сигнал к пересмотру стратегии работы с дублями.

Как убрать дубли страниц на сайте

Как убрать дубли страниц на сайте зависит от типа дубля и ваших целей. Есть три основных метода.

МетодКогда использоватьОсобенности
Редирект 301Дубль больше не нуженПолное перенаправление, передаёт ~90% веса
CanonicalОбе страницы нужныУказание основной версии, дубль остаётся доступным
NoindexСтраница нужна, но не в индексеИсключение из индекса, ссылки учитываются

Алгоритм выбора метода:

  1. Дубль больше не нужен, пользователи не должны на него попадать → Редирект 301
  2. Обе страницы должны существовать (товар с разными параметрами, пагинация) → Canonical
  3. Страница нужна для пользователей, но не должна ранжироваться → Noindex

Дополнительные методы:

  • Объединение контента — если дубли можно слить в одну качественную страницу
  • Удаление страницы — если дубль не несёт ценности
  • Настройка CMS — устранение причины появления дублей

Canonical — указание основной страницы

Тег canonical указывает поисковикам, какую версию страницы считать основной. Подробнее о canonical — детальная инструкция.

Синтаксис:

<link rel="canonical" href="https://site.ru/osnovnaya-stranitsa/">

Тег размещается в <head> страницы-дубля и указывает на каноническую (основную) версию.

Когда использовать canonical:

  • Товар доступен с разными параметрами (/tovar/?color=red)
  • Страницы сортировки и фильтрации (/catalog/?sort=price)
  • UTM-метки и другие отслеживающие параметры
  • Пагинация (опционально — можно указывать canonical на первую страницу или на себя)
  • Контент, синдицированный на другие сайты

Правила использования:

  • Canonical должен указывать на существующую страницу
  • Страница не должна быть закрыта в robots.txt
  • Canonical должен быть абсолютным URL (с https://)
  • Один canonical на страницу
  • Самоссылающийся canonical на канонической странице — хорошая практика

Пример для товара с параметрами:

Страница /tovar/?color=red содержит:

<link rel="canonical" href="https://site.ru/tovar/">

Это говорит поисковику: индексируй /tovar/, а /tovar/?color=red — дубль.

Редирект 301 для устранения дублей

Редирект 301 — постоянное перенаправление с одного URL на другой. Как настроить редирект — пошаговая инструкция.

Когда использовать редирект:

  • Склейка www и без www версий
  • Склейка http и https
  • Склейка URL со слешем и без
  • Переезд страницы на новый URL
  • Удаление дублей, которые больше не нужны

Настройка в .htaccess (Apache):

Редирект с www на без www:

RewriteEngine On
RewriteCond %{HTTP_HOST} ^www\.(.*)$ [NC]
RewriteRule ^(.*)$ https://%1/$1 [R=301,L]

Редирект с http на https:

RewriteCond %{HTTPS} off
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]

Редирект конкретной страницы:

Redirect 301 /staraya-stranitsa/ /novaya-stranitsa/

Настройка в Nginx:

server {
    server_name www.site.ru;
    return 301 https://site.ru$request_uri;
}

Преимущества редиректа:

  • Передаёт ссылочный вес (около 90-99%)
  • Пользователь автоматически попадает на правильную страницу
  • Дубль полностью исключается

Недостатки:

  • Необратимое действие (технически можно убрать, но SEO-последствия)
  • При ошибке можно потерять трафик

Noindex для дублей

Noindex запрещает индексировать страницу, но оставляет её доступной для пользователей. Как использовать noindex — подробный гайд.

Когда использовать noindex для дублей:

  • Страницы фильтрации, которые должны работать, но не ранжироваться
  • Версии для печати
  • Служебные дубли, нужные для функционала
  • Когда canonical не работает (Google его игнорирует)

Синтаксис:

<meta name="robots" content="noindex, follow">

noindex — не индексировать страницу follow — переходить по ссылкам на ней (чтобы не терять внутреннюю перелинковку)

Noindex vs Canonical:

  • Canonical — рекомендация поисковику, может быть проигнорирована
  • Noindex — строгий запрет индексации

Если canonical не помогает (Google выбирает другую страницу как каноническую) — используйте noindex.

Важно: Noindex не передаёт ссылочный вес как редирект. Если на дубль есть внешние ссылки — лучше использовать редирект или canonical.

Удалить дубликаты онлайн — сервисы

Удалить дубликаты онлайн можно с помощью специализированных сервисов. Убрать дубликаты онлайн — это проверка и выявление, а устранение потребует работы с сайтом.

Siteliner (siteliner.com)

Находит внутренние дубли контента на сайте. Бесплатно до 250 страниц. Показывает процент дублирования, список страниц-дублей.

Copyscape (copyscape.com)

Проверяет уникальность контента в интернете. Находит внешние копии ваших страниц. Платный сервис, но есть бесплатная проверка одной страницы.

Duplichecker (duplichecker.com)

Бесплатная проверка текста на уникальность. Вставляете текст — сервис ищет совпадения в сети.

Text.ru

Русскоязычный сервис проверки уникальности. Хорошо работает с текстами на русском языке.

Как использовать:

  1. Проверьте сайт через Siteliner — найдёте внутренние дубли
  2. Проверьте важные страницы через Copyscape — найдёте внешние копии
  3. Составьте список проблемных URL
  4. Устраните дубли: редирект, canonical или noindex

Удалить дубликат онлайн в прямом смысле нельзя — сервисы только находят проблемы. Устранение требует изменений на сайте.

Профилактика появления дублей

Лучше предотвратить появление дублей, чем потом их устранять. Настройте сайт правильно с самого начала.

Настройте редиректы на старте:

  • Выберите версию: www или без www — настройте редирект на выбранную
  • Настройте редирект с HTTP на HTTPS
  • Определитесь со слешем в конце URL — настройте единообразие

Используйте самоссылающийся canonical:

На каждой странице должен быть canonical, указывающий на саму себя. Это защита от появления дублей с параметрами.

Настройте CMS:

  • Отключите создание страниц тегов, если они дублируют категории
  • Закройте или настройте canonical для страниц архивов
  • Отключите сессионные ID в URL

Работа с параметрами:

  • В Google Search Console укажите параметры, которые не влияют на контент
  • В Яндекс Вебмастере настройте обработку параметров
  • На страницах с параметрами указывайте canonical на базовый URL

Мониторинг:

  • Регулярно проверяйте отчёты в GSC и Вебмастере
  • Сканируйте сайт Screaming Frog раз в месяц
  • Следите за количеством страниц в индексе — резкий рост может означать дубли

При создании контента:

  • Не создавайте страницы с минимальными отличиями
  • Для товаров-вариаций используйте одну страницу с выбором опций
  • Проверяйте уникальность title и H1 для каждой страницы

Часто задаваемые вопросы

Что такое дубли страниц?

Дубли — это страницы с одинаковым или очень похожим контентом, доступные по разным URL. Примеры: site.ru и www.site.ru, http и https версии, страницы с параметрами (?sort=price). Поисковики воспринимают их как разные страницы с дублирующимся содержимым.

Чем опасны дубли для SEO?

Дубли вызывают: каннибализацию (страницы конкурируют друг с другом), размытие ссылочного веса, трату краулингового бюджета, риск фильтров за неуникальный контент. В итоге — падение позиций и потеря трафика.

Как быстро найти дубли на сайте?

Используйте Screaming Frog — он находит страницы с одинаковыми Title, H1, контентом. Также проверьте: Яндекс Вебмастер (раздел «Индексирование»), Google Search Console (отчёт о покрытии). Для небольших сайтов — site:domain.ru в поиске.

Canonical или редирект — что выбрать?

Редирект 301 — когда старая страница больше не нужна (полное перенаправление). Canonical — когда обе страницы должны существовать, но одна является основной (например, товар с параметрами фильтра). Canonical — рекомендация, редирект — принудительное перенаправление.

Проблемы с дублями на сайте?

Проведём аудит, найдём все дубли и поможем устранить их правильно. Обращайтесь за услугой Технический аудит сайта или закажите специализированный поиск дублей в индексе.

Проверено экспертом

Статья прошла профессиональную проверку качества

Фото Анастасия Крыжановская

Анастасия Крыжановская

SEO-специалист

Проверено: 23 декабря 2025

Области экспертизы:

SEO-аудитДиагностика проблемРекомендации

Теги:

ДублиCanonicalРедиректТехническое SEOДиагностика
Поделиться статьёй:

Читайте также

Понравилась статья?

Закажите профессиональный SEO-аудит и мы применим эти знания для улучшения вашего сайта.

Заказать аудит