Внутренняя оптимизация и индексация сайта

Вы узнали, что такое семантическое ядро сайта, как его составляют. В общих чертах познакомились с внутренними факторами ранжирования страниц и теперь знаете, где и как размещать ключевые слова поисковых запросов.

Пришла пора разобраться, как нужно оптимизировать сайт, чтобы сделать его более доступным для поисковых систем. Для того, чтобы сайт появился в результатах поиска, поисковая система должна включить страницы сайта в свой индекс.

Можно выделить несколько внутренних факторов (параметров) сайта, которые влияют на индексацию страниц сайта поисковыми системами.

Код веб-страниц

Основная часть информации в интернете – это тексты в формате HTML. Поисковый робот выкачивает страницу и начинает отделять HTML-код от текста. От того, насколько корректно составлен код страницы, зависит насколько правильно,  поисковый робот проиндексирует страницу.

Большое количество лишних  тегов, элементов оформления и комментариев в коде страницы, мешает поисковому роботу правильно определить важную информацию.

Чтобы облегчить индексацию страницы, необходимо отделить определение внешнего вида текста от его содержания. Для этого при  верстке страниц или шаблонов сайтов необходимо использовать каскадные таблицы стилей CSS. Таблицы определяют стиль оформления текста, который не распознается поисковиками, поэтому CSS лучше не включать в HTML-код страницы, а размещать в отдельном файле.

Использование текстовой навигации по сайту

Для того, чтобы сделать красивые раскрывающиеся меню веб-мастера используют клиентские скрипты вместо текстовых ссылок. Клиентские скрипты – это программы, которые выполняются браузером пользователя. Самый распространенный язык программирования скриптов – JavaScript. Поисковые роботы в большинстве случаев не выполняют код сценариев на языке JavaScript, поэтому не могут обнаружить и проиндексировать внутренние страницы сайта. Старайтесь использовать в элементах навигации только обычные текстовые ссылки, по которым легко может пройти робот.

Графический текст

Поисковые машины не индексируют текст, написанный графически, т.е. созданный виде картинки. Поэтому не стоит использовать заголовки страниц или название сайта в виде графических изображений.

Оформлять шапки сайтов, логотипы или название фирм в виде картинок, весьма распространенный прием, но вы должны понимать, что поисковик не видит текста на картинке и не сможет прочесть название сайта, фирмы или слоган.

Если все же,  вы хотите использовать графические изображения текста, то обязательно подпишите картинку альтернативным текстом.

Карта сайта

Карта сайта – это специальная страница, где размещена своеобразная модель структуры сайта, в виде ссылок на все страницы сайта. Карта позволяет поисковым роботам легко добраться до всех страниц сайта и проиндексировать их.  Карта должна быть доступна со всех страниц сайта, также как и ссылка на главную страницу.

Адреса страниц

Знакомство поискового робота с сайтом начинается с того, что он записывает адреса страниц сайта для последующей индексации.

Существуют статические и динамические сайты, соответственно – статические и динамические адреса.

Статический сайт представляет собой набор HTML-страниц (документов), которые хранятся в отдельном каталоге. Путь к каждому документу прописывается в адресе страницы. Адреса или URL статических сайтов имеют вид http://www.site.ru/page.html . Поисковые роботы успешно индексируют сайты с подобными адресами.

Динамический сайт – это сайт контент, которого формируется динамически или, как говорят «на лету».  Информационное наполнение сайта хранится в базе данных, расположенной на сервере. Динамический сайт имеет свой шаблон представления. Когда пользователь запрашивает необходимую информацию, то она извлекается из базы данных и вставляется в шаблон. Получается, что страниц динамического сайта, как бы не существует  в виде готовых файлов, они создаются соответствующими программами (серверными скриптами) при обращении к серверу, а потом показываются пользователю. Адрес страниц динамического сайта может выглядеть так: http://www.exsnow.co/Front/Product/?url=Category&cate_no=BIAAAC00

Адрес динамического сайта не очень понятен для поисковых машин, поэтому статические страницы всегда будут выше по рейтингу динамических страниц. На сайте желательно иметь статические адреса страниц, даже если страницы создаются динамически с помощью скриптов. Существует несколько способов избежать использования  громоздких динамических URL.

Самый популярный способ – это использование модуля mod_rewrite, который является программным модулем веб-сервера  Apache. Этот модуль представляет весьма мощные и гибкие средства для различных манипуляций с URL . Множество подробной информации об этом модуле вы сможете найти в Интернете.

Управление индексацией сайта

Вы можете управлять поведением поискового робота на страницах вашего сайта. При индексации поисковой робот скачивает содержание индексируемых страниц, но иногда не все страницы сайта стоит отдавать на индексацию. Для того, чтобы не засорять индекс лишней информацией и обратить внимание робота на более важные страницы, можно запретить индексацию определенных страниц.  Для этого пишется инструкция  для поискового робота о порядке индексации страниц сайта.

Мета-тег Robots

Мета-тег <meta name=”robots” content=”index, follow”> предназначен для управления индексацией отдельно взятой страницы. Разрешение индексации страницы – index, запрещение – noindex.

Разрешение на индексацию всех ссылок на странице – follow, запрещение – nofollow .

Два атрибута этого тега пишутся через запятую, либо вместо них ставится один атрибут all или none.

All - одновременное выполнение условий index и follow, none -  одновременное выполнение условий noindex и nofollow.

Вместо мета-тега robots рекомендуется использовать файл robots.txt.

Файл robots.txt

Robots.txt – это специальный файл, в котором содержится инструкция для различных поисковых систем, по индексированию сайта. Этот файл находится в корневой директории сайта и каждый раз запрашивается при обращении робота к сайту. Отсутствие файла на сайте означает, что робот будет индексировать все встречающиеся страницы.

В этом файле прописывается, кому и что запрещено индексировать. Можно запретить индексировать не только одну страницу, но и целую группу.

Более подробно о файле robots.txt можно узнать на официальном сайте  Robots.txt http://robotstxt.org.ru/

Какое количество внутренних факторов учитывают поисковые машины при индексации и ранжировании страниц сайта, пожалуй, не знает никто, т.к. полный набор держится в глубоком секрете разработчиками поисковых машин.

SEO – не является и не может быть точной наукой, это лишь набор методов оптимизации,  которые позволяют не рассчитывать, я лишь прогнозировать результат.

Вы провели внутреннюю оптимизацию сайта, теперь можно переходить к следующему шагу - выбор хостинга.

 

Комментарии 

 
# Азат Сафиуллов 10.12.2013 13:47
Интересная статья с кратким описанием и возможностью прочесть вопрос в развернутом виде. Особенно, можно выделить пошаговую инструкцию, которая только добавляет удобство для поиска необходимой информации. Так держать! )
специалист по контекстной рекламе компании ClientBar
Ответить | Ответить с цитатой | Цитировать
 
 
# Владимир Иванович 06.07.2015 09:21
Обычно наибольший вес стараются придать "морде" сайта, его главной странице. Но с другой стороны для лучшей индексации делают максимальное количество ссылок с главной на разделы и популярные статьи ресурса. В результате накопленный с помощью внутренней перелинковки вес распыляется обратно. Вот такое получается противоречие и в каждом конкретном случае приходится искать баланс в работе по внутренней оптимизации.
Ответить | Ответить с цитатой | Цитировать
 
Главная Оптимизация сайта Внутренняя оптимизация и индексация сайта