Содержание
В сегодняшнем материале мы обсудим все доступные методы борьбы с дублями для сайтов которые созданы в uCoz и uWeb. Будем избавляться от дублей страниц системного календаря, дублей переключателей страниц в модулях каталогах и других страниц которые портят вид сайта в лице поисковых систем.
На сайт где используются модули Блог и Новости и используется блок с календарем, в поиске могут возникнуть дубли с урл адресами подобно:
http://ваш-сайт/news/2020-10-22
http://ваш-сайт/news/2020-10-14
http://ваш-сайт/blog/2020-10-22
http://ваш-сайт/blog/2020-10-14
если материалов в модуле много, соответственно за каждую дату в календаре будут отметки и будет много урл дублей.
То есть, у вас может быть 1 - 2 тысячи новостей в модуле новости, новости добавлялись в разные дни, в итоге ждите 2 тыс урл адресов дублей, подобно примерам выше. Такие дубли не приносят никакой пользы, ниже будет описано решение как с ними бороться, чтобы такие дубли не индексировались, а если уже проиндексировались, чтобы вылетели с поиска.
Для борьбы с такими дублями перейдите в модулях блог и новости в шаблон - Страница архива материалов, далее в блоке хеад ( между тегов <head>сюда</head>) прописать следующее условие:
<?if($PAGE_ID$=='day'||$PAGE_ID$=='month'||$PAGE_ID$=='year')?>
<link rel="canonical" href="$HOME_PAGE_LINK$" />
<meta name="robots" content="noindex, nofollow"/>
<?endif?>
сохраните изменения, далее ждите переиндексации в поисковиках и эти дубли начнут исчезать с поиска.
Имея в модулях блог и новости много материалов, которые распределены по своих категориях или добавлены вне категорий, в модуле материалы разделяются на страницы, в результате всего этого если заранее не настроить борьбу с дублями переключателей страниц, в поиске будет много урл адресов подобно:
http://ваш-сайт/?page2
http://ваш-сайт/?page3
http://ваш-сайт/?page4
http://ваш-сайт/?page5
такие страницы никакой пользы в поиске не приносят.
Чтобы избавиться от таких страниц в поиске, нужно отредактировать ваш файл Robots.txt и удалить с него директиву:
Allow: /*?page
далее системно в роботсе останется директива:
Disallow: /*?
она должна быть, если у вас нет, нужно добавить. Далее при переиндексации такие страницы дубли как описаны в примере выше вылетят с поиска.
Дополнительный метод борьбы с таким страницами в модулях блог и новости для категорий, в шаблоне Страница архива материалов, далее в блоке хеад ( между тегов <head>сюда</head>) прописать следующее условие:
<?if($PAGE_ID$='category')?> <?ifnot($CURRENT_PAGE$=='1')?> <link rel="canonical" href="$HOME_PAGE_LINK$" /> <meta name="robots" content="noindex, nofollow"/> <?endif?><?endif?>
так мы запретим индексацию страниц пагинации ( переключателей страниц ) в категориях кроме первой страницы.
То есть, мы сообщаем роботу поисковика, что в каждой из категорий модуля мы ему говорим, что нужно индексировать первую страницу категории.
Если в категории будет 5-10 и более страниц с материалами, данное условие позволит запретить их индексацию и в итоге поисковики не будут сообщать, что такие страницы являются не каноническими.
По сути поисковики на такие страницы ругаются, так как у них титл повторяется (дублируется).
Прописав это условие мы не навредим индексации материалов модуля и категорий, все будет индексироваться, мы лишь избавимся от страниц дублей (переключателей страниц).
В модулях Блог и Новости метод борьбы с дублями переключателей страниц один, в каталогах (файлов, статей, сайтов, объявлений и игр), метод немного отличается.
Перейти в шаблон Страница со списком материалов категории / раздела, далее в блоке хеад ( между тегов <head>сюда</head>) прописать следующее условие:
<?if($PAGE_ID$='category'||$PAGE_ID$='section')?> <?ifnot($CURRENT_PAGE$=='<span class="currentPage79">1</span>')?> <link rel="canonical" href="$HOME_PAGE_LINK$" /> <meta name="robots" content="noindex, nofollow"/> <?endif?><?endif?>
этот способ решит проблему с дублями подобно как и в модулях блог и новости.
Условие выше запретит индексацию всех переключателей страниц в категориях и разделах каталогов кроме первой страницы.
В модуле Интернет-магазин имеются свои подстраницы:
По сути в поиске нужно оставить лишь первую вкладку "Описание", которая отображает описание товара, другие вкладки нужны для отображения изображений товара и чтобы клиент имел возможность оставить отзывы.
Имея например на сайте 2 - 5 - 10 тыс товаров, на каждый товар прибавьте 3 страницы дубля, это тысячи страниц мусора, чтобы от него избавиться в роботс нужно прописать такие директивы:
Disallow: /shop/*comm
Disallow: /shop/*spec
Disallow: /shop/*imgs
вот так мы избавимся от возможных тысяч дублей в модуле Магазин.
В модуле магазин переключатели страниц работают по таким урл:
Представьте ситуацию, когда в модуле 5-10 тыс товаров или больше, сколько у вас дублей переключателей страниц будет в поиске (такие дубли пользы не несут так как все они не уникальны и положительного влияния на покупки в магазине они не дают). Чтобы решить эту проблему, в файл robots.txt пропишите директиву:
Disallow: /shop/all/
эта директива решит проблему с переключателями страниц.
В категориях модуля магазин вы можете столкнуться с дублями подобно:
Для решения данной проблемы, в файл robots.txt нужно прописать директиву:
Disallow: /shop/*;
она решит проблему с такими дублями и не будет мешать индексации товаров.
Важно в каждом из модулей настроить для категорий, разделов и материалов Canonical, чтобы поисковики понимали какой урл является основным для индексации и не индексировали дубли.
Если у вас на сайте оплачивается платный тариф от Оптимального и выше на выбор, можно перейти в "Премиум настройки" Seo-модуля, далее отметить пункт - "Использовать атрибут rel="canonical" для материалов". После этих настроек достаточно пройтись по всем страницам шаблонам основных модулей и в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<?$SEO_CANONICAL$?>
этого будет достаточно, чтобы поисковики понимали какая страница является канонической и не плодили дубли.
В данной ситуации будет использовать каноникал с помощью внутренних операторов которые существуют в uCoz и uWeb.
Для шаблона Страница материала и комментариев / Страница с полной фотографией и комментариями основных модулей (блог, новости, все каталоги файлов, статей, сайтов, объявлений, игр, видео и фотоальбомы), в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<link rel="canonical" href="$HOME_PAGE_LINK$<?substr($ENTRY_URL$,1)?>"/>
Для шаблона Страница товара в модуле Интернет-магазин, в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<link rel="canonical" href="$HOME_PAGE_LINK$<?substr($DESC_LINK$,1)?>" />
это решит вопрос с каноникалом для товаров.
Для шаблона Страница архива материала модулей (блог и новости), в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<?if($PAGE_ID$='category')?> <link rel="canonical" href="$HOME_PAGE_LINK$<?substr($REQUEST_URI$,1)?>" /> <?endif?>
Для шаблона Страница со списком материалов категории / Страница со списком фотографий альбома / Каталог товаров (каталогов файлов, статей, сайтов, объявлений, игр, видео, фотоальбома и магазина), в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<?if($CAT_URL$)?><link rel="canonical" href="$HOME_PAGE_LINK$<?substr($CAT_URL$,1)?>" /><?endif?>
Для шаблона Страница со списком материалов раздела / Страница со списком фотографий раздела (каталогов файлов, статей, сайтов, объявлений, игр и фотоальбома), в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<?if($SECTION_URL$)?><link rel="canonical" href="$HOME_PAGE_LINK$<?substr($SECTION_URL$,1)?>" /><?endif?>
Если у вас модуль гостевая используется, оставляются отзывы, тогда в данном модуле можно использовать в шаблоне Страница с сообщениями свой каноникал, в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<link rel="canonical" href="<?if($REQUEST_URI$="/gb/" or $REQUEST_URI$="/gb" or $REQUEST_URI$="/gb/1")?>https://ваш-сайт/gb<?else?>https://ваш-сайт/gb/<?substr($REQUEST_URI$,4)?><?endif?>" />
Если у вас модуль Форум используется, тогда в данном модуле можно использовать в шаблоне Общий вид страниц свой каноникал, в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<link rel="canonical" href="<?if($PAGE_ID$='main')?>$HOME_PAGE_LINK$forum<?endif?><?if($PAGE_ID$='category')?>$HOME_PAGE_LINK$<?substr($CUR_SECTION_URL$,1)?><?endif?><?if($PAGE_ID$='forum')?>$HOME_PAGE_LINK$<?substr($CUR_FORUM_URL$,1)?><?endif?><?if($PAGE_ID$='threadpage')?>$HOME_PAGE_LINK$<?substr($CUR_THREAD_URL$,1)?><?endif?>"/>
Примечание! Для подфорумов в модуле форум разграничить каноникал отдельный для форума и подфорума на уровне операторов слишком сложно, в связи с этим, для подфорумов используется урл корневого форума в который подформ добавлен. Я пытался разграничить условиями $CUR_SUBFORUM_NAME$ и $CUR_SUBFORUM_URL$, но в итоге ломается каноникал и выводится два урл и для форума и подфорума. Пока лишь такое условие, далее может найдем решение и для подфорумов.
В данном модуле можно использовать в шаблоне Страницы сайта свой каноникал, в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<link rel="canonical" href="$HOME_PAGE_LINK$<?substr($REQUEST_URI$,1)?>" />
этого будет достаточно для данного модуля.
В данном модуле можно использовать в шаблоне Общий вид страниц FAQ'a свой каноникал, в блоке хеад ( между тегов <head>сюда</head>) прописать следующий код:
<link rel="canonical" href="$HOME_PAGE_LINK$<?substr($REQUEST_URI$,1)?>" />
При необходимости, данный материал будет дополняться новыми решениями для борьбы с дополнительными дублями.
Яндекс может ругаться на страницы фото с урл подобно:
от таких страниц можно избавиться прописав роботс директиву:
Disallow: /photo/*-0-***-3
У некоторых пользователей Яндекс вебмастер может ругаться на мусор с этих страниц или дублирующиеся заголовки, желательно запретить индекс этого мусора так как материалы доступны по прямым ссылкам, страница пользователя должна быть закрыта.
Нужно в файл robots.txt прописать директиву:
Disallow: /*0-*-0-17-1$
В материале выше я дал рекомендации как бороться с дублями и мусором на вашем сайте, которого не должно быть в поиске Яндекс и Google, у некоторых пользователей мнения могут расходиться и они могут считать страницы категорий (переключателей) страниц важными для их сайта. Именно на такой случай я подготовил отдельную статью, в которой рассмотрено как эти страницы чуть больше уникализировать, чтобы поисковики не ругались и не сообщали о дублируемом контенте.
Лицензия: CC BY-SA 4.0
Автор: Юрий Герук
Благодарность автору!
| |
Здравствуй Гость, комментарии могут оставлять только зарегистрированные пользователи, зарегистрируйтесь и поделитесь мнением о материале выше Регистрация или Войти.