Наличие дублей страниц в индексе поисковой машины является серьезным препятствием для корректного ранжирования страниц.
Другой проблемой является наличие в поисковом индексе служебных, пустых и иных неинформативных страниц сайта. Такие страницы также «засоряют» поисковый индекс и препятствуют корректному ранжированию страниц.
Для исключения всех страниц-дублей, других «мусорных» страниц из индекса поисковых систем следует создать в корневой директории сайта текстовый файл robots.txt и с помощью специальной директивы закрыть их от индексации. В корне каждого сайта-зеркала также необходимо создать файл robots.txt и закрыть его от индексации.
Кроссбраузерность – это способность сайта хорошо отображаться в разных браузерах (без перекосов, съездов, с правильной интерпретацией всех правил CSS). За основу берутся самые популярные браузеры – IE, Opera, Mozilla Firefox, Сафари, Хром. Сайт долженкорректно отображается во всех браузерах.
Регистрозависимые адреса страниц. Некоторые ссылки на страницы сайта могут иметь адреса, содержащие как строчные латинские буквы, так и заглавные (напр., http://www.vashsait.ru/sportAndHealth). При этом если попробовать ввести аналогичный адрес, но полностью в нижнем регистре (напр., http://www.vashsait.ru/sportandhealth), сайт может выдать совершенно другую страницу или ошибку.
Проблема заключается в том, что адреса ссылок в Интернете, как правило, записываются полностью в нижнем регистре. По мере того, как сайт будет набирать популярность и накапливать естественные внешние ссылки (например, люди будут рекомендовать сайт друзьям) – будет невозможно осуществить контроль за этим процессом. Таким образом, может получиться, что внешние ссылки ведут на несуществующие страницы, люди не будут получать информацию за которой пришли и посещаемость будет падать.
Нестандартные технические доработки сайта. В каждом конкретном случае, в зависимости от нюансов используемой CMS, работы хостинга и т.п. могут возникать дополнительные моменты, требующие внимания.
2.2 Оптимизация кода сайта
Оптимизация кода сайта — это процесс, основной направленностью которого является снижение объема кода отдаваемого поисковым роботам (при индексации) и посетителям (при загрузке страницы).
Поисковые роботы при сканировании сайта обращают внимание на отношение текста на странице к количеству внутреннего кода используемого на ней же. Это отношение четких значений не имеет.
Чем меньше блог использует кода, тем быстрее происходит загрузка его страниц (снижение нагрузки на сервер).
Поисковые системы определяют скорость загрузки ресурса, как один из важнейших факторов ранжирования. Так же это значительно осложнит задачу для потенциального взломщика т.к. когда нет информации о версиях плагинов, сложно искать в них уязвимости.
Есть три основных направления при оптимизации кода:
Файл СSS;
Кодировка;
Валидность.
CSS расшифровывается, как «каскадные таблицы стилей» (от англ. Cascading Style Sheets). Таблицы стилей предназначены для визуального оформления элементов веб-страницы. Как правило, CSS используется в связке с HTML, что является весьма эффективным «инструментом» при создании любого сайта.
CSS представляет собой совокупность параметров, с помощью которых отображается тот или иной элемент на веб-странице. Эти параметры могут указываться, как в отдельном файле (таблице стилей), так и быть прописаны непосредственно в HTML коде страницы. Например, на веб странице могут быть такие элементы: заголовок статьи, абзацы, цитаты, сноски, картинки, видео ролики, ссылки на другие страницы сайта и т.д. Всем этим элементам мы можем задать определенный стиль отображения — размер шрифта, цвет букв, толщину рамок и картинок, стиль ссылок и так далее.
Если вы используете файлы с расширение .css (стили при оформлении), которые подгружаются в самую последнюю очередь, то следует сделать их более мобильным, то есть применить сжатие. Например, размер строк после оптимизации coda можно уменьшить в 5 раз:
«padding — top: 4px; padding — bottom: 7px»
в
«4px 7px»
Валидность кода — это соответствие исходного кода сайта нормам и правилам, описанным Консоциумом Всемирной Паутины или сокращенно W3C. Чтобы проверить сайт на соответствие этим нормам нужно пройти по ссылке: http://validator.w3.org/. Ввести нужный адрес и посмотреть результаты.
Сервисов, которые осуществляют данную проверку много. Все они покажут какие ошибки присутствуют в коде, а так же укажут их местоположение. Не стоит пугаться, если их количество составит более 100 или 1000 штук, так как исправление одной может автоматически сократить их вдвое.
Кодировка базы данных. Все данные должны корректно отображаться и как следствие индексироваться поисковыми системами. Ниже представлена ошибка в кодировке сайта.
2.3 Отклики сервера
Каждый отклик сервера на команду клиента сопровождается трехзначным кодом. При отправке сообщения может возникнуть исключительная ситуация, при этом в тексте ошибки будет содержаться код последнего отклика SMTP-сервера. Далее приводится описание этих кодов.
Каждая цифра в коде ответа сервера имеет свое назначение. Первая цифра обозначает успех, неудачу или незавершенность команды. Вторая цифра уточняет тип ответа (например, ошибка почтовой системы или синтаксическая ошибка команды). Третья цифра служит для лучшей градации информации.
Ниже приведены пять значений первой цифры:
1yz – положительный предварительный отклик .Сервер воспринял команду, но находится в ожидании подтверждения на продолжение или отказ от выполнения запрошенных действий.
2yz – положительный отклик . Запрошенное действие было выполнено и сервер готов к принятию новой команды.
3yz – положительный промежуточный отклик. Сервер воспринял команду, но для завершения действия ожидает дальней информации.
4yz – временный негативный отклик. Команда не принята, и запрошенные действия не были исполнены. Однако ошибочное состояние временное, и действие может быть запрошено еще раз.
5yz – негативный отклик. Команда не принята, и запрошенные действия не были исполнены.
Вторая цифра показывает категорию ошибки:
x0z – Синтаксис: Отклик обозначает синтаксическую ошибку команды; команда может быть синтаксически правильная, но отклик нельзя отнести к другим категориям; нереализованная команда.
x1z – Информация: Отклик на запрос информации, например, статус или помощь.
x2z – Соединение: Отклики, относящиеся к каналу передачи данных.
x3z – Не определены
x4z – Не определены
x5z – Почтовая система:
Отклики указывают состояние принимающей почтовой системы в отношении запрошенной передачи или другого действия почтовой системы.
Третья цифра служит для лучшей градации значения в каждой категории, определяемой второй цифрой.
Полная таблица откликов:
Код
Название
Описание
Коды первого класса (1xx) не посылаются сервером клиентам.
100
Продолжайте
Клиент должен продолжать передачу запроса.
101
Переключение протоколов
Сервер предлагает изменить протокол на указанный в поле заголовка отклика Update. Обычно это предложение о переходе на более новую версию HTTP.
110
Отклик мог устареть
Отклик является устаревшим (используется в заголовке Warning).
111
Обновление не удалось
Отклик от кэша не является свежим, т. к. попытка обновить его закончилась неудачей (используется в заголовке Warning).
112
Разрыв соединения
Кэш был умышленно отсоединен от остальной сети на некоторое время (используется в заголовке Warning).
113
Эвристическое устаревание
Кэш эвристически выбрал период обновления, больший 24 часов, и возраст отклика более 24 часов (используется в заголовке Warning).
199
Различные предупреждения
Дополнительные предупреждения, не содержащиеся в данном списке (используется в заголовке Warning).
Коды второго класса (2xx) возникают, когда запрос успешно принят и понят сервером.
200
OK
Запрос был успешно обработан. Содержимое отклика зависит от типа запроса.
201
Создано
Запрос был успешно обработан и в результате был создан новый ресурс. Его URI указан в поле заголовка отклика Location.
202
Принято
Запрос был принят, и его обработка началась другим асинхронным процессом, поэтому сервер не сможет сообщить о ее завершении.
203
Неавторитетная информация
Возвращаемая метаинформация получена не от сервера ее происхождения, а из локальной копии.
204
Нет содержимого
Сервер выполнил запрос, но ему нечего возвращать клиенту. Обозреватель не должен изменять отображение документа.
205
Сброс содержимого
Сервер выполнил запрос, и обозреватель должен сбросить отображение документа.
206
Частичное содержимое
Сервер выполнил частичный запрос GET для ресурса.
214
Применено преобразование
Применено преобразование, изменившее кодировку или тип MIME отклика (используется в заголовке Warning).
299
Различные настойчивые предупреждения
Дополнительные предупреждения, не содержащиеся в данном списке (используется в заголовке Warning).
Коды третьего класса (3xx) сообщают о перенаправлениях; чтобы выполнить запрос нужны еще какие-то действия.
300
Несколько вариантов
Запрошенный ресурс имеет несколько представлений, и клиент должен выбрать одно из них.
301
Ресурс перенесен
Запрошенный ресурс сменил свой URI. Его новый URI указан в поле заголовка отклика Location.