Что такое дублированный контент? (Влияние на SEO)

Дублированный контент — это когда одинаковый или похожий контент появляется более чем на одном URL. Существует точно дублированный контент 1:1, который можно создать разными способами (о чем мы поговорим ниже), и аналогичный контент, который содержит перекрывающиеся цели поиска.

Оба экземпляра дублированного контента могут отрицательно повлиять на поисковый рейтинг и производительность.

Как дублирующийся контент влияет на эффективность SEO?

Дублированный контент может негативно повлиять на видимость поиска по ряду причин, поскольку поисковым системам трудно решить, какую версию контента показывать пользователям. В результате дублирующийся и/или похожий контент может создавать:

  • Внутренняя конкуренция — поисковые системы не будут знать, какую страницу оценивать, если они одинаковы или похожи. Это также может сбивать с толку пользователей, поскольку они не будут знать, на какую версию страницы нажать в поисковой выдаче.

  • Потраченный впустую бюджет сканирования — если существует множество страниц с повторяющимся содержанием, и вы хотите проиндексировать только одну, сканеры по-прежнему будут сканировать все повторяющиеся варианты, что может отнимать у них время на сканирование не повторяющихся важных страниц.

  • Разбавленное количество ссылок — внешние и внутренние ссылки могут указывать на разные варианты страницы, так как может возникнуть путаница в отношении того, на какой из них ссылаться. Это разделит количество ссылок на несколько страниц, а не приведет к переходу на 1 страницу, которую вы хотите проиндексировать и ранжировать.

Как создается дублирующийся контент?

Существует множество способов создания дублированного контента. Однако часто это случается, но все же необходимо решить эту проблему.

Эти примеры URL-адресов кажутся людям одинаковыми, но технически они отличаются для поисковых систем.

https://libarea.ru
https://www.libarea.ru
https://libarea.ru/index.html
http://libarea.ru/index.html
https://libarea.ru/INDEX.html

Ниже приведены некоторые распространенные способы создания дублированного контента:

Http против Https

Это происходит, когда сайт доступен как по http, так и по https. Распространенная причина, по которой это происходит, заключается в том, что если ваш сайт перешел на https и вы неправильно перенесли (301 перенаправление) http-версию на https-версию, вы столкнетесь с проблемами дублирования контента. Изучите контрольный список миграции для получения дополнительной информации.

https://libarea.ru
http://libarea.ru

Www против не-www

Это происходит, когда сайт доступен как с www, так и без www. Важно, чтобы сайт разрешал только одну версию: www или не www. Наличие обоих вариантов вживую создает дублированный контент.

https:/libarea.ru
https://www.libarea.ru

URL со смешанным регистром

Дублирование в смешанном регистре может происходить, когда URL-адреса доступны с заглавными и строчными буквами. В идеале URL-адреса всегда должны преобразовываться в символы нижнего регистра, чтобы избежать проблем с дублированием содержимого.

https://libarea.ru/Spaces
https://www.libarea.ru/spaces

Конечные и не завершающие URL-адреса с косой чертой и/или несколько окончаний URL-адресов

Дублирование конечных и непостоянных косых черт может происходить, когда URL-адреса имеют несколько несовместимых окончаний. Это также может произойти, если URL-адреса заканчиваются на /index. .html, .aspx и т.д., а также другие варианты. URL-адреса должны быть доступны только с одним окончанием URL.

https://libarea.ru/spaces
https://www.libarea.ru/spaces/

Параметры

Параметры могут использоваться по нескольким причинам. Обычно параметры используются для изменения содержимого страницы с помощью фасетов и фильтров, а также в целях отслеживания. Часто параметризованные URL-адреса могут создавать тонкое содержимое, мало полезное для поисковых систем.

Дублирующий / тонкий контент, созданный из фасетов, можно аккуратно обрабатывать с помощью канонических тегов, тегов noindex, блокировки robots.txt или комбинации этих элементов.

В приведенном ниже примере наиболее целесообразно преобразовать параметризованный URL в чистый URL.

Параметризованный URL:

https://www.example.com/rugs/floor-rugs?brand_name=21688&nav_color=19342

Чистый URL:

https://www.example.com/rugs/floor-rugs

Рядом с дубликатами

Практически дублирующийся контент возникает, когда на сайте есть похожие страницы с одинаковым поисковым намерением.

Например, если у нас есть целевая страница «Почему так важно SEO» и отдельная целевая страница «Преимущества SEO», эти две страницы, скорее всего, будут конкурировать друг с другом за одни и те же поисковые запросы. Вместо того, чтобы иметь две страницы с похожими темами контента, мы должны объединить их в одну целевую страницу.

SEO

2 Ответа

  1. Это означает, что такой же контент появляется где-то еще в Интернете.

    Даже если поисковая система не наказывает дублирующийся контент, поисковой системе будет сложно решить, какой контент более релевантен конкретному запросу.

    1. Да, поисковые системы достаточно хорошо начали определять дубли уже давно. Вообще всё больше убеждаюсь, что поиску необходимо давать куда меньше, чем есть на сайте. Только самое важное, а для этого должны быть инструменты.