Внутрення поисковая оптимизация сайта. Дублированный контент | Кирилл Павлюков
Мар 24

Мне доводилось общаться с многими людьми, которые пытаются продвигать свои сайты не имея достаточного количества знаний в области СЕО. Узнав однажды о том, что для продвижения сайта нужно покупать ссылки, новички начинают без разбора тратить сотни долларов в месяц на сапе и подобных ей биржах ссылок. Между тем, часто деньги тратятся впустую, не принося никакого результата.

Одна из возможных причин, почему так происходит, кроется в том, что сео-новички забывают (или не знают, или ленятся) навести порядок на продвигаемом сайте. Называется такая уборка внутренней оптимизацией, и этой заметкой я начну цикл статей на данную тему.

В этот раз речь пойдет о дублированном контенте.

Я не стану объяснять почему, но прошу поверить на слово – эпоха копипаста уже давно прошла. Качественный сайт, как и раскрутка сайта, невозможны без качественного уникального контента. Это аксиома.

Поэтому, если вы хотите сделать успешный проект, придется позаботиться об уникальном тексте и иллюстрациях. Очень не рекомендую использовать автоматические синонимайзеры и прочие подобные программы и сервисы, которые могут сделать некоторое подобие уникального текста. Поисковые системы постоянно совершенствуются, и каждый новый алгоритм позволяет все лучше определять, какой текст написан человеком и для людей, а какой – синонимайзером для поисковиков.

Лучше потратьте несколько часов своего времени (ну или времени коллег или подчиненных) на то, чтобы написать текст для сайта своими руками. Неужели вы не можете изложить на бумаге информацию о своем товаре, не передирая ее слово-в-слово с сайта поставщика?

Но даже если вы написали 100% уникальный текст, поисковик все равно может посчитать его дублем, если этот текст открывается по нескольким адресам. Когда такое случается, и как с этим бороться – дальше.

Дублирование на несколько доменов

Если у вас есть несколько доменов, по которым доступен ваш сайт (например, фирма.ua, фирма.com.ua и фирма.kiev.ua), следует выбрать только один домен, по которому будет доступен сайт, а со всех остальных доменов поставить на основной редирект. Сделать это можно, например, добавив в файл .htaccess такие строки:

1
2
3
4
RewriteEngine on
RewriteCond %{HTTP_HOST} ^фирма\.com\.ua$ [OR]
RewriteCond %{HTTP_HOST} ^фирма\.kiev\.ua$ [OR]
RewriteRule (.*) http://фирма.ua/$1 [R=301,L]

Дублирование по субдомену

Если ваш сайт доступен по адресам фирма.com.ua и www.фирма.com.ua, это тоже нехорошо. С помощью того же .htaccess сделаем так, чтобы сайт открывался только без www:

1
2
3
4
5
RewriteEngine on
RewriteCond %{HTTP_HOST} ^фирма\.com\.ua$ [OR]
RewriteCond %{HTTP_HOST} ^фирма\.kiev\.ua$ [OR]
RewriteCond %{HTTP_HOST} ^www\.фирма\.ua$ [OR]
RewriteRule (.*) http://фирма.ua/$1 [R=301,L]

Дублирование версии для печати

Многие системы управлением сайтов, автоматически генерируют т.н. версию для печати – страницу с минимальным оформлением, адаптированную для вывода на принтер. Но то, что для принтера хорошо, для СЕО – смерть. Версии для печати нужно запретить для индексации. Как это сделать – зависит от используемой вами ЦМС. Чаще всего достаточно будет добавить пару строк в файл robots.txt примерно такого содержания:

1
2
User-agent: *
Disallow: /printthread.php

Это пример для форумов на движке VBulletin.

Дублирование из-за ЧПУ

Если в вашем движке используется система ЧПУ (человеко-понятные урлы), важно чтобы страницы индексировалимь только по человекопонятным адресам.

Пример. Страница с новостью может открываться по человекопонятному адресу /news/12345/ и по нечеловекопонятному index.php?action=news&newsId=12345. Наша задача – убрать такое дублирование. Как это сделать – зависит от конкретного сайта, но в большинстве случаев нужного эффекта можно добиться, запретив индексацию файла index.php:

1
2
User-agent: *
Disallow: /index.php

Будьте осторожны: в некоторых случаях такая строка может заблокировать индексацию всего сайта.

Дублирование из-за идентификатора сессии

Иногда параметр сессии передается в адресной строке. Явный признак этого – наличие в строке параметра SID (SID=ЗначениеИдентификатора). Но имя этого параметра может быть и другим – в зависимости от настроек PHP на хостинге. Варианта решения проблемы 2.

  1. Сообщить поисковой системе, что параметр SID нужно игнорировать (это делается в панеле управления настройками сайта – например, Google.Webmasters).
  2. Передавать этот параметр не в адресной строке, а через куки.

Для второго варианта, скорее всего, будет достаточно добавить такую строку в файл .htaccess:

1
php_flag session.use_cookies = On

Продолжение темы следует…

Share

Автор: Кирилл Павлюков \\ Метки: , ,


2 коммент. к “Внутрення поисковая оптимизация сайта. Дублированный контент”

  1. 1. пишет:

    Спасибо за интересную статью, Очень пригодилась информация о дублирование на несколько доменов

  2. 2. пишет:

    Спасибо за статью. Скажите, пожалуйста еще вот что – если сайт доступен по адресу http://site/ и http://site/index.html – как это расценит поисковит и если это будет дублирование – то как с ним бороться?

Оставьте комментарий или два