Дубли страниц на сайте — как найти и убрать дубликаты

20 декабря 2025

11 мин чтения

Дубли страниц на сайте: как найти и устранить

Дубли страниц — одна из самых распространённых технических проблем, которая негативно влияет на SEO. Когда одинаковый контент доступен по нескольким URL, поисковые системы не понимают, какую версию показывать в выдаче. Проверка дубликатов должна быть частью регулярного технического аудита сайта.

Дубли размывают ссылочный вес, создают конкуренцию между собственными страницами и тратят краулинговый бюджет. В статье разберём, как найти дубли страниц на сайте, какими инструментами пользоваться и какой метод устранения выбрать: canonical, редирект или noindex.

Что такое дубли страниц

Дубли страниц — это страницы с одинаковым или существенно похожим контентом, доступные по разным URL-адресам. Поисковые системы воспринимают каждый URL как отдельную страницу, даже если содержимое идентично.

Виды дублей:

Полные дубли

100% совпадение контента на разных URL. Примеры:

site.ru/page/ и site.ru/page (со слешем и без)
site.ru и www.site.ru
http://site.ru и https://site.ru
site.ru/PAGE/ и site.ru/page/ (разный регистр)

Частичные дубли

Страницы с большим процентом совпадения контента (70-99%). Примеры:

Товары, отличающиеся только цветом или размером
Статьи с минимальными изменениями
Страницы категорий с разной сортировкой

Технические дубли

Возникают из-за особенностей CMS и сервера:

Страницы с GET-параметрами (?utm_source=..., ?sort=price)
Сессионные ID в URL
Версии для печати
Страницы пагинации с дублирующимся контентом

Внешние дубли

Ваш контент скопирован на другие сайты. Это отдельная проблема — борьба с плагиатом.

Почему дубли страниц опасны для SEO

Дубли наносят серьёзный ущерб позициям сайта в поиске. Дубли могут привести к фильтрам — подробнее в статье Фильтры поисковых систем — как избежать.

Каннибализация запросов

Несколько страниц вашего сайта конкурируют за одни и те же ключевые слова. Поисковик не знает, какую показывать, и может выбрать не ту. Позиции обеих страниц ниже, чем могли бы быть у одной качественной.

Размытие ссылочного веса

Внешние ссылки распределяются между дублями. Вместо того чтобы один URL получил 10 бэклинков, каждый из трёх дублей получает по 3-4. Эффект от ссылок снижается.

Трата краул-бюджета

Поисковый робот тратит ресурсы на сканирование дублей вместо новых и важных страниц. На больших сайтах это критично — часть страниц может не индексироваться.

Проблемы с индексацией

Поисковик может проиндексировать «неправильный» дубль — с параметрами, без HTTPS, с www. В выдаче будет отображаться не тот URL, который вы хотели.

Риск санкций

Массовые дубли могут быть расценены как попытка манипуляции. Особенно если дублируется коммерческий контент или создаются дорвеи.

Ухудшение поведенческих факторов

Пользователь может попасть на «неправильную» версию страницы (без HTTPS, с параметрами), что влияет на доверие и конверсию.

Причины появления дублей

Понимание причин помогает предотвратить появление новых дублей. Большинство дублей возникают из-за технических особенностей.

WWW и без WWW

Сайт доступен по site.ru и www.site.ru. Оба адреса работают, индексируются как разные страницы.

HTTP и HTTPS

После установки SSL-сертификата обе версии могут быть доступны. Без редиректа — это дубли.

Слеш в конце URL

site.ru/page и site.ru/page/ — технически разные адреса. Многие CMS отдают одинаковый контент по обоим.

Регистр символов

site.ru/Page и site.ru/page — могут работать как разные URL на некоторых серверах.

GET-параметры

URL с параметрами сортировки, фильтрации, отслеживания:

/catalog/?sort=price
/catalog/?color=red
/page/?utm_source=google

Сессионные идентификаторы

Некоторые CMS добавляют session ID в URL: /page?PHPSESSID=abc123. Каждая сессия — новый «дубль».

Страницы пагинации

/catalog/, /catalog/page/2/, /catalog/page/3/ — если контент частично повторяется.

Версии для печати

/article/ и /article/print/ — тот же контент в другом оформлении.

Мобильная версия на поддомене

m.site.ru дублирует основной сайт. Сейчас редкость, но встречается.

Технические страницы CMS

Теги, архивы, страницы авторов могут создавать дубли категорий или статей.

Как найти дубли страниц на сайте

Найти дубли страниц можно несколькими способами. Разберём, как найти дубли страниц на сайте с помощью разных инструментов.

Основные методы поиска дублей:

1. SEO-краулеры

Screaming Frog, Netpeak Spider, Sitebulb сканируют сайт и находят страницы с одинаковым контентом, title, description.

2. Панели вебмастеров

Яндекс Вебмастер и Google Search Console показывают проблемы с дублями в отчётах об индексации.

3. Оператор site:

Введите site:domain.ru в поиске. Если видите несколько версий одной страницы — это дубли.

4. Проверка вручную

Проверьте основные сценарии: www/без www, http/https, слеш/без слеша.

5. Онлайн-сервисы

Siteliner, Copyscape и аналоги проверяют уникальность контента и находят внутренние дубли.

Что искать:

Страницы с одинаковым title
Страницы с одинаковым H1
Страницы с идентичным контентом (по хешу или сравнению)
URL с разными параметрами, ведущие на один контент
Страницы без canonical или с некорректным canonical

Проверка дубликатов через Screaming Frog

Screaming Frog — лучший инструмент для проверки дубликатов на сайте. Подробнее о SEO-инструментах — в обзоре.

Поиск дублей по Title:

Запустите сканирование сайта
Перейдите на вкладку «Page Titles»
В фильтре выберите «Duplicate»
Увидите все страницы с одинаковыми title

Поиск дублей по H1:

Вкладка «H1»
Фильтр «Duplicate»
Список страниц с одинаковыми заголовками

Поиск дублей контента:

Включите опцию Content → Near Duplicates в настройках
Запустите сканирование
Вкладка «Content» → «Near Duplicates»
Увидите страницы с похожим контентом и процент совпадения

Проверка canonical:

Вкладка «Canonicals»
Фильтры: «Missing», «Self Referencing», «Canonicalised»
Проверьте, что canonical указывает на правильные страницы

Проверка редиректов:

Вкладка «Response Codes»
Фильтр «Redirection (3xx)»
Убедитесь, что дубли перенаправляются на основные страницы

Экспорт результатов:

Выгрузите найденные дубли в Excel для анализа и планирования исправлений.

Поиск дублей в Яндекс Вебмастере

Яндекс Вебмастер показывает проблемы с дублями в нескольких отчётах.

Диагностика сайта:

Перейдите в Диагностика → Диагностика сайта
Ищите предупреждения о дублях: «Дублирование title», «Дублирование description»
Кликните на проблему — увидите список затронутых страниц

Исключённые страницы:

Индексирование → Страницы в индексе
Посмотрите раздел «Исключённые страницы»
Причина «Дубликат» — страницы, которые Яндекс посчитал дублями

Проверка конкретного URL:

Инструменты → Проверка ответа сервера
Введите URL
Посмотрите, определяет ли Яндекс эту страницу как дубль

Что проверять:

Количество страниц в индексе — если сильно больше реальных страниц, есть дубли
Предупреждения в диагностике о дублях title/description
Исключённые страницы с причиной «Дубликат»

Яндекс сам определяет канонический URL и может не индексировать дубли. Но лучше указывать canonical явно.

Поиск дублей в Google Search Console

Google Search Console детально показывает проблемы с дублями и каноникалами. Как работать с GSC — полное руководство.

Отчёт о покрытии (Страницы):

Индекс → Страницы (или Покрытие)
Раздел «Исключённые»
Ищите статусы, связанные с дублями

Статусы, указывающие на дубли:

«Альтернативная страница с правильным каноническим тегом» — дубль с корректным canonical
«Дубликат без канонической версии, выбранной пользователем» — Google сам выбрал каноническую
«Дубликат: Google выбрал другой канонический URL» — ваш canonical не совпал с выбором Google
«Дубликат: отправленный URL не выбран в качестве канонического» — страница из sitemap оказалась дублем

Проверка URL (URL Inspection):

Введите URL в строку поиска GSC
Посмотрите раздел «Покрытие»
Проверьте «Канонический URL, выбранный пользователем» и «Канонический URL, выбранный Google»
Если они различаются — проблема с canonical

Важно: Google может игнорировать ваш canonical, если посчитает его некорректным. Это сигнал к пересмотру стратегии работы с дублями.

Как убрать дубли страниц на сайте

Как убрать дубли страниц на сайте зависит от типа дубля и ваших целей. Есть три основных метода.

Метод	Когда использовать	Особенности
Редирект 301	Дубль больше не нужен	Полное перенаправление, передаёт ~90% веса
Canonical	Обе страницы нужны	Указание основной версии, дубль остаётся доступным
Noindex	Страница нужна, но не в индексе	Исключение из индекса, ссылки учитываются

Алгоритм выбора метода:

Дубль больше не нужен, пользователи не должны на него попадать → Редирект 301
Обе страницы должны существовать (товар с разными параметрами, пагинация) → Canonical
Страница нужна для пользователей, но не должна ранжироваться → Noindex

Дополнительные методы:

Объединение контента — если дубли можно слить в одну качественную страницу
Удаление страницы — если дубль не несёт ценности
Настройка CMS — устранение причины появления дублей

Canonical — указание основной страницы

Тег canonical указывает поисковикам, какую версию страницы считать основной. Подробнее о canonical — детальная инструкция.

Синтаксис:

<link rel="canonical" href="https://site.ru/osnovnaya-stranitsa/">

Тег размещается в <head> страницы-дубля и указывает на каноническую (основную) версию.

Когда использовать canonical:

Товар доступен с разными параметрами (/tovar/?color=red)
Страницы сортировки и фильтрации (/catalog/?sort=price)
UTM-метки и другие отслеживающие параметры
Пагинация (опционально — можно указывать canonical на первую страницу или на себя)
Контент, синдицированный на другие сайты

Правила использования:

Canonical должен указывать на существующую страницу
Страница не должна быть закрыта в robots.txt
Canonical должен быть абсолютным URL (с https://)
Один canonical на страницу
Самоссылающийся canonical на канонической странице — хорошая практика

Пример для товара с параметрами:

Страница /tovar/?color=red содержит:

<link rel="canonical" href="https://site.ru/tovar/">

Это говорит поисковику: индексируй /tovar/, а /tovar/?color=red — дубль.

Редирект 301 для устранения дублей

Редирект 301 — постоянное перенаправление с одного URL на другой. Как настроить редирект — пошаговая инструкция.

Когда использовать редирект:

Склейка www и без www версий
Склейка http и https
Склейка URL со слешем и без
Переезд страницы на новый URL
Удаление дублей, которые больше не нужны

Настройка в .htaccess (Apache):

Редирект с www на без www:

RewriteEngine On
RewriteCond %{HTTP_HOST} ^www\.(.*)$ [NC]
RewriteRule ^(.*)$ https://%1/$1 [R=301,L]

Редирект с http на https:

RewriteCond %{HTTPS} off
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]

Редирект конкретной страницы:

Redirect 301 /staraya-stranitsa/ /novaya-stranitsa/

Настройка в Nginx:

server {
    server_name www.site.ru;
    return 301 https://site.ru$request_uri;
}

Преимущества редиректа:

Передаёт ссылочный вес (около 90-99%)
Пользователь автоматически попадает на правильную страницу
Дубль полностью исключается

Недостатки:

Необратимое действие (технически можно убрать, но SEO-последствия)
При ошибке можно потерять трафик

Noindex для дублей

Noindex запрещает индексировать страницу, но оставляет её доступной для пользователей. Как использовать noindex — подробный гайд.

Когда использовать noindex для дублей:

Страницы фильтрации, которые должны работать, но не ранжироваться
Версии для печати
Служебные дубли, нужные для функционала
Когда canonical не работает (Google его игнорирует)

Синтаксис:

<meta name="robots" content="noindex, follow">

noindex — не индексировать страницу follow — переходить по ссылкам на ней (чтобы не терять внутреннюю перелинковку)

Noindex vs Canonical:

Canonical — рекомендация поисковику, может быть проигнорирована
Noindex — строгий запрет индексации

Если canonical не помогает (Google выбирает другую страницу как каноническую) — используйте noindex.

Важно: Noindex не передаёт ссылочный вес как редирект. Если на дубль есть внешние ссылки — лучше использовать редирект или canonical.

Удалить дубликаты онлайн — сервисы

Удалить дубликаты онлайн можно с помощью специализированных сервисов. Убрать дубликаты онлайн — это проверка и выявление, а устранение потребует работы с сайтом.

Siteliner (siteliner.com)

Находит внутренние дубли контента на сайте. Бесплатно до 250 страниц. Показывает процент дублирования, список страниц-дублей.

Copyscape (copyscape.com)

Проверяет уникальность контента в интернете. Находит внешние копии ваших страниц. Платный сервис, но есть бесплатная проверка одной страницы.

Duplichecker (duplichecker.com)

Бесплатная проверка текста на уникальность. Вставляете текст — сервис ищет совпадения в сети.

Text.ru

Русскоязычный сервис проверки уникальности. Хорошо работает с текстами на русском языке.

Как использовать:

Проверьте сайт через Siteliner — найдёте внутренние дубли
Проверьте важные страницы через Copyscape — найдёте внешние копии
Составьте список проблемных URL
Устраните дубли: редирект, canonical или noindex

Удалить дубликат онлайн в прямом смысле нельзя — сервисы только находят проблемы. Устранение требует изменений на сайте.

Профилактика появления дублей

Лучше предотвратить появление дублей, чем потом их устранять. Настройте сайт правильно с самого начала.

Настройте редиректы на старте:

Выберите версию: www или без www — настройте редирект на выбранную
Настройте редирект с HTTP на HTTPS
Определитесь со слешем в конце URL — настройте единообразие

Используйте самоссылающийся canonical:

На каждой странице должен быть canonical, указывающий на саму себя. Это защита от появления дублей с параметрами.

Настройте CMS:

Отключите создание страниц тегов, если они дублируют категории
Закройте или настройте canonical для страниц архивов
Отключите сессионные ID в URL

Работа с параметрами:

В Google Search Console укажите параметры, которые не влияют на контент
В Яндекс Вебмастере настройте обработку параметров
На страницах с параметрами указывайте canonical на базовый URL

Мониторинг:

Регулярно проверяйте отчёты в GSC и Вебмастере
Сканируйте сайт Screaming Frog раз в месяц
Следите за количеством страниц в индексе — резкий рост может означать дубли

При создании контента:

Не создавайте страницы с минимальными отличиями
Для товаров-вариаций используйте одну страницу с выбором опций
Проверяйте уникальность title и H1 для каждой страницы

Часто задаваемые вопросы

Что такое дубли страниц?

Дубли — это страницы с одинаковым или очень похожим контентом, доступные по разным URL. Примеры: site.ru и www.site.ru, http и https версии, страницы с параметрами (?sort=price). Поисковики воспринимают их как разные страницы с дублирующимся содержимым.

Чем опасны дубли для SEO?

Дубли вызывают: каннибализацию (страницы конкурируют друг с другом), размытие ссылочного веса, трату краулингового бюджета, риск фильтров за неуникальный контент. В итоге — падение позиций и потеря трафика.

Как быстро найти дубли на сайте?

Используйте Screaming Frog — он находит страницы с одинаковыми Title, H1, контентом. Также проверьте: Яндекс Вебмастер (раздел «Индексирование»), Google Search Console (отчёт о покрытии). Для небольших сайтов — site:domain.ru в поиске.

Canonical или редирект — что выбрать?

Редирект 301 — когда старая страница больше не нужна (полное перенаправление). Canonical — когда обе страницы должны существовать, но одна является основной (например, товар с параметрами фильтра). Canonical — рекомендация, редирект — принудительное перенаправление.

Проблемы с дублями на сайте?

Проведём аудит, найдём все дубли и поможем устранить их правильно. Обращайтесь за услугой Технический аудит сайта или закажите специализированный поиск дублей в индексе.

Проверено экспертом

Статья прошла профессиональную проверку качества

Анастасия Крыжановская

SEO-специалист

Проверено: 23 декабря 2025

Области экспертизы:

SEO-аудитДиагностика проблемРекомендации

Битые ссылки на сайте — как найти и исправить онлайн

Что такое битые ссылки и как их найти? Проверка сайта на битые ссылки онлайн бесплатно. Как исправить ошибки 404. Инструменты и сервисы.

АХ

Александра Хилова

28 янв

•

9 мин

Техническое SEO

Noindex — что это, тег meta robots noindex nofollow

Что такое noindex и как использовать? Тег meta robots noindex nofollow в HTML. Когда закрывать страницы от индексации. Как исправить ошибки noindex.

ОК

Олеся Коробка

27 янв

•

12 мин

Техническое SEO

Карта сайта Sitemap XML — как создать + генератор онлайн

Что такое карта сайта sitemap.xml и зачем она нужна? Пошаговая инструкция по созданию. Онлайн-генераторы, примеры кода, настройка для Яндекса и Google.

АК

Анастасия Крыжановская

25 янв

•

14 мин

Техническое SEO

Как ускорить индексацию сайта в Яндексе и Google

Как ускорить индексацию сайта в Яндексе и Google? Ускорение индексации: переобход страниц, sitemap, API. Сколько индексируется сайт. Пошаговая инструкция.

ЕЗ

Екатерина Золотарева

24 янв

•

11 мин

Понравилась статья?

Закажите профессиональный SEO-аудит и мы применим эти знания для улучшения вашего сайта.

Заказать аудит

Дубли страниц на сайте — как найти и убрать дубликаты

Дубли страниц на сайте: как найти и устранить

Что такое дубли страниц

Почему дубли страниц опасны для SEO

Причины появления дублей

Как найти дубли страниц на сайте

Проверка дубликатов через Screaming Frog

Поиск дублей в Яндекс Вебмастере

Поиск дублей в Google Search Console

Как убрать дубли страниц на сайте

Canonical — указание основной страницы

Редирект 301 для устранения дублей

Noindex для дублей

Удалить дубликаты онлайн — сервисы

Профилактика появления дублей

Часто задаваемые вопросы

Что такое дубли страниц?

Чем опасны дубли для SEO?

Как быстро найти дубли на сайте?

Canonical или редирект — что выбрать?

Проблемы с дублями на сайте?

Проверено экспертом

Теги:

Читайте также

Битые ссылки на сайте — как найти и исправить онлайн

Noindex — что это, тег meta robots noindex nofollow

Карта сайта Sitemap XML — как создать + генератор онлайн

Как ускорить индексацию сайта в Яндексе и Google

Понравилась статья?