а) срезаем количество ключей в тексте, ориентируясь на конкурентов – в случае, если в топе преобладают сайты с большим количество вхождений в каталоге и небольшими текстами);
б) ТОЛЬКО по согласованию с ОА закрываем в
3) Если на нашей странице только текст, а в среднем по топ-10 у сайтов есть каталоги, то запрашиваем и добавляем каталог.
11. Использование тега
Тег
Закрытие текста, в котором нет ключевых запросов, но который убрать со страницы невозможно (например, пожелание клиента или важная информация о доставке).
Закрытие счетчиков, ссылок на посторонние ресурсы.
Закрытие текста под гугл.
Закрытие форм заказа, поиска, сортировок, фильтров, etc.
Во всех остальных случаях тег
1.2. Работа, направленная на увеличение кликабельности сниппета сайта.
Сниппет - небольшой отрывок текста из найденной поисковой машиной страницы сайта, использующийся в качестве описания ссылки в результатах поиска. В поисковой системе Яндекс, как правило, они представляют собой отрывок текста, в котором встретилось ключевое слово в тексте на странице. Иногда в ПС Яндекс в качестве сниппетов также может выводиться текст из мета-тега «Description». Гугл всегда использует мета-тега «Description» в качестве сниппета.
Написание description. Данный мета-тег необходим для увеличения кликабельности сниппета.
Правила написания description:
- как можно ближе к началу употребляем продающее слово/словосочетание. (например, скидки, бесплатная доставка);
- далее прописываем продвигаемое ключевое слово;
- затем пишем название компании и другие слова.
Например,
http://www.di-ci.ru/notarialnyj_perevod/
Скидки до 30 % на нотариальный перевод от бюро переводов «Диалект Сити». Бесплатная доставка переводов в любую точку Москвы.
ПС Яндекс, как правило, выбирает в качестве сниппета наиболее релевантный кусок текста по соответствующему ключевому слову. Предпочтение отдается тексту, расположенному ближе к началу страницы.
Вариант 1 — Если кликабельность участка текста, который выбрал Яндекс, можно улучшить, добавив в него незначительные изменения (можно добавить продающие слова или скорректировать текст так, чтобы плотность ключей в данном участке осталась неизменной), — делаем.
Вариант 2 — Если Яндекс в качестве сниппета выбрал кусок текста из контента страницы, который обладает низкой степенью кликабельности, то необходимо провести работы по увеличению кликабельности сниппета.
Для этого нужно снизить релевантность данного участка текста (убрать ключи) и добавить текст, такой же по объему и плотности ключей, ближе к началу страницы. Также можно найти более подходящий для сниппета участок текста и преобразовать его таким образом, чтобы плотность ключей была аналогична исходному.
1.3. Основные понятия.
TF-IDF — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Вес некоторого слова пропорционален количеству употребления этого слова в документе, и обратно пропорционален частоте употребления слова в других документах коллекции.
TF – частота слова в документе
IDF – обратная частота запроса
TF — (частота слова в документе) - отношение числа вхождения некоторого слова к общему количеству слов документа. Таким образом, оценивается важность слова ti в пределах отдельного документа.
,
где ni есть число вхождений слова в документ, а в знаменателе — общее число слов в данном документе.
IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции. Учёт IDF уменьшает вес широкоупотребительных слов.
,
где
|D| — количество документов в корпусе;
— количество документов, в которых встречается ti (когда ).
Таким образом, мера TF-IDF является произведением двух сомножителей: TF и IDF.
Большой вес в TF-IDF получат слова с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах.
Вхождения в текст, TITLE, strong, H1-6 и др. считаются не только по формуле TF- IDF, но и по модифицированной формуле Okapi BM-25.
Okapi BM25 учитывает длину поля (в данном случае title, strong или h1) в котором произошел хит (встретилось слово запроса). Чем меньше длина — тем выше значение релевантности конкретного хита.
Формула расчета BM
BM25 = IDF + log ((k1+1)*TF)/(k1(1-b)+b(Dl/ArgDl)+TF)),
где b, k1 – const
Dl – длина нашего документа
ArgDl – средняя длина документа
TF считается для каждого слова, BM – для конкретного запроса.
http://ru.wikipedia.org/wiki/Okapi_BM25 - дополнительная информация
2 Техническая оптимизация сайта.
Техническая оптимизация сайта – это комплекс мер, направленных на корректировку технических аспектов сайта, с целью улучшить его взаимодействие с роботами поисковых систем.
Основная задача технической оптимизации – обеспечить максимально полную и быструю индексацию страниц сайта.
2.1 Общие правила
Грамотная техническая оптимизация позволяет роботам поисковых систем хорошо и быстро индексировать сайт, такой сайт не выдает ошибки и сбои в работе, каждой странице сайта соответствует только один адрес и др. Ниже представлены некоторые моменты на которые стоит особенно уделить внимание. Полный список параметров для проверки оптимизатором, которым должен соответствовать сайт согласно технической оптимизации, описан в чек. листе по тех. оптимизации (на портале в разделе «Документы»).
Robots.txt – файл, специально предназначеный для роботов поисковых систем. В этом файле указываются параметры индексирования сайта: какие страницы заносить в поисковую базу, а какие исключить. В нём можно указывать директивы, как для всех роботов поисковых систем сразу, так и для роботов каждой поисковой системы в отдельности.
Про составление этого файла и настройку можно подробнее узнать на сайте помощи вебмастерам от Яндекса http://help.yandex.ru/webmaster/controlling-robot/robots-txt.xml.
Карты сайта — одна из страниц сайта, информация на которой аналогична разделу «Содержание» обычной книги. Используется как элемент навигации. В карте сайта представлен полный перечень разделов и/или всех страниц, имеющихся на сайте. Нередко, заголовки страниц в списке служат ссылками на эти страницы. Карта бывает двух форматов:
HTML (для пользователя);
XML (для роботов ПС).
Редиректы (перенаправления) делаются с помощью файла .htaccess, который расположен в корне сайта и доступен только вебмастеру. Так как поисковые системы могут считать сайт с www и без www совершенно различными, то прописывается редирект c сайта без www (http://vashsait.ru) на сайт с www (http://www.vashsait.ru) или наоборот. Это автоматически переадресовывает всех, кто заходит на сайт на нужную страницу.
Настройка видов url страниц - корректный вид url также настраивается с помощью .htaccess. Важно, чтобы все внутренние ссылки на сайте имели одинаковый вид. Это можно оценить по следующим критериям:
На всех страницах присутствуют или отсутствуют закрывающие слэши;
адрес сайта полностью написан латинскими буквами (http://www.vashsait.ru/katalog) или в адресе встречаются какие-либо параметры (http://www.vashsait.ru/?id_news=72);
используются латинские или русские буквы в url.
Лучше всего, если во внутренних ссылках сайта содержатся псевдостатические адреса. Это значит, что в них не используются спецсимволы: «?», «=», «&», а сами адреса ссылок имеют вид: http://www.vashsait.ru/about.
404 ошибка – одна из самых важных технических доработок, которые обязательно проводить. Если адрес ссылки, ведущей на страницу сайта введен неправильно, важно чтобы посетителю сайта и поисковому роботу отдавалась страница с кодом 404 (несуществующая страница). Тогда в индекс поисковой системы не попадет большое количество страниц с одинаковым текстом, что крайне негативно влияет на ранжирование.
Идентификаторы сессий. Пользователям, впервые попавшим на сайт, присваивается уникальный идентификатор сессии. Адреса страниц сайта в этом случае имеют вид http://www.vashsite.ru/.?PHPSESSID=код_сессии. В результате одна и та же страница может иметь неограниченное количество адресов из-за различных кодов сессий (появляются т. н. дубли страниц). В базе поисковых систем уже сейчас находится множество страниц сайта с такими адресами, различающимися только набором символом после «PHPSESSID=». Наличие большого числа дублей страниц затрудняет индексацию корректных страниц, снижая тем самым эффективность поисковой оптимизации. Для устранения этого необходимо внести правки в программную часть таким образом, чтобы идентификаторы сессий не появлялись в URL страниц вообще, либо были не видны поисковым роботам.
Неинформативные страницы, страницы-дубли и зеркала сайта. В индексе поисковых систем может находиться большое количество страниц, имеющих одинаковое содержание, но разные адреса (страницы-дубли). Роботы поисковых систем считают такие страницы разными и индексируют их все, в результате поисковый индекс «замусоривается» большим количеством дублированного контента, что приводит к проблемам с индексацией сайта роботами поисковых системам.