.
Поисковая (SEO) оптимизация сайта. Методы и типичные ошибки.
Автор megabax   
05.02.2010 г.
История развития поисковых систем

Поисковая (SEO) оптимизация сайта. Методы и типичные ошибки.

История развития поисковых систем сети Интернет.

В ранний период развития Интернета количество пользователей было небольшим, так был мал объем доступной информации. в основам пользователями Интернет были сотрудники различных университетов и лабораторий, а сама сеть использовалась, главным образом, в научных целях.  Тогда проблема поиска информации была не такой актуальной, как сейчас.

Одним из первых способов как то упорядочить хранящуюся в Интернете информацию стали каталоги сайтов, в котором ссылки на ресурсы группировались по темам. Первой такой системой стал Yahoo. Он открылся в апреле 1994 года.

Со временем количество сайтов в каталоге стало достаточно большим, что затрудняло работу пользователей. тогда появилась опция "поиск по каталогу". Это еще не было полноценной поисковой системой, так как поиск проходил не по всему Интернету, а только по сайтам, зарегистрированным в Yahoo.

Сейчас каталоги ссылок практически утратили свою популярность. Причина очень проста: даже современны каталоги, содержащие огромное число сайтов, не охватывают всю сеть. Самый большой каталог сети DMOZ (или Open Directory Project) содержит информацию о 5 миллионах ресурсов, в то время как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler появившийся в 1994 году, за ним в 1995 году открылись поисковики Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в Интернет. Далее, в 1997 году Сергей Брин и Парии Пейдж в рамках исследовательского проекта создали поисковую систему Goggle, которая, как вы все знаете, до сих пор является самой популярной системой в мире.

Поискова ясистема Yandex, которая в настоящее время наиболее популярная в среде рунета, открылась 23 сентября 1997 года.

В настоящее время существует 3 основных международных поисковых системы – Google, Yahoo и MSN Search, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих можно насчитать очень много) использует в том или ином виде результаты 3 перечисленных. Например, поиск AOL (search.aol.com) и Mail.ru используют базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

 В России основной поисковой системой является Яндекс, за ним идут Rambler, Google.ru, Aport, Mail.ru и KM.ru.



 

Общие принципы работы поисковых систем.

Поисковая система состоит из следующих блоков:

  • Spider (паук) - браузероподобная программа, которая скачивает веб-страницы.

  • Crawler (ползающий паук) - программа, которая автоматически проходит по всем ссылкам, найденным на странице.

  • Indexer (индексатор) - программа, которая анализирует веб-страницы, скаченные спайдером.

  • Database (база данных) – хранилище скачанных и обработанных страниц.

  • Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных.

  • Web server (веб-сервер) – веб-сервер, который осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы.

Детальная реализация разных поисковых систем может отличаться друг от друга, в частности, например, связка спадер+краулер+индексатор может идти отдельным блоком. Но, тем не менее, вышеперечисленные черты свойственны все поисковикам.

Все поисковые системы работают примерно по такому алгоритму: сперва спайдер скачивает web-страницы тем же способом, что и браузер, с единственной лишь разницей, что у него нет глаз и он не видит графику и прочую визуальную информацию. Спайдер работает напрямую с html-документом. Затем краулер пробегается по всем ссылкам в скаченном документе.  Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Далее индексатор разбивает страницу на составные элементы - собственно сам текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д.

Внутренние факторы ранжирования.

При SEO оптимизации, все факторы, так или иначе влияющие на положение сайта в поисковых системах, можно разделить на внешние, которые находятся вне сферы контроля web-мастера, и на внутренние, на которые владелец сайта может непосредственно влиять.

К последним относятся:

  • Объем текста на странице. Чем больше информации содержит отдельная страница, те выше рейтинг присваивают ей поисковые системы.  Оптимальный объем 500-3000 слов (2-20 кб). Если на странице всего 2-3 предложения, то у нее практически нет шансов попасть в топ поисковика. Напротив, при большом объеме текста наблюдается дополнительное увеличение видимости за счет того, что в они могут быть индексированы по редким или случайным поисковым фразам, что так же увеличивает приток посетителей. Так что имеет смысл начать SEO оптимизацию с увеличения объема страниц.

  • Количество ключевых слов на странице. Ключевые словосочетания (фразы) доложены встречаться в тексте страницы как минимум 3-4 раза. Лучше всего, если фраза встречается несколько раз в виде фразы (ключевые слова в нужном порядке) и несколько раз слова из фразы по отдельности, при чем каждо слово разное число раз. Пример. Пусть у нас поисковая фраза "пластиковые окна". Для качественной SEO-оптимизации нужно, что бы это словосочетание встретилось, допустим, пять раз, а еще три раза отдельно слово "окна" в сочетании с другими словами (например, "стеклянные окна") и отдельно, к примеру 4 раза "пластиковые" (например в сочетании "пластиковые изделия"). Цифры и фразы условны, но они показывают общую идею.

  •  Плотность ключевых слов.  Плотность ключевых слов - это как часто они встречаются в тексте. Она измеряется в процентах. Например, если у нас текст из 100 слов, а 10 из них ключевые, то значит, плотность ключевых слов 10%.  Плотность не должна быть слишком низкая (тогда по этим словам страница не проиндексируется) и не должна быть слишком высокой (тогда сработает спам-фильтр, и по этим запросам страница опустится вниз).  Оптимальной считается плотность 5-7%.

  • Расположение ключевых слов на странице. Чем ближе слово к началу, тем больший вес оно имеет с точки зрения поисковой системы. Оптимальным , SEO оптимизированным, считается текст, где размещены все ключевые слова в первых 2/3 текста.

  • Стилистическое оформление текста.  Наибольшей вес имеют ключевые слова в заголовках, отмеченных тегом <h> (особенно h1 и h2).  Правда, сейчас поисковые системы снижают весомость таких слов, поскольку при помощи CSS можно придать заголовку любой вид, например, заголовок h1 сделать маленьким и "нашпиговать" его ключевыми словами, тем не менее, пренебрегать этим способом оптимизации пока не стоит. Так же имеет смысл некоторые ключевые слова выделять жирным, лучше тегом <strong> чем <b>.

  • Тег <title>. ключевые слова, используемые в этом теге имеют наибольший вес. Кроме того, в ссылке на сайт поисковики как раз и размещают тектс из title,так что он должен быть не только "нашпигован" ключевыми словами, но еще и быть информативным и осмысленным. Имеет смысл размещать ключевые слова в скобках после основного текста заголовка. Следует так же помнить  о том, что поисковик анализирует только первые 50-80 символов заголовка, так что не имеет смысла делать его слишком длинным.

  • Ключевые слова в тексте ссылок. Важно включать ключевые слова в текст ссылок на другие страницы вашего сайта. Это даст дополнительный бонус при ранжировании.

  • Теги Alt изображений. Любое изображение на странице имеет специальный атрибут «альтернативный текст», который задается в теге «ALT». Этот текст будет отображен на экране в том случае, если скачать изображение не удалось или же показ изображений заблокирован в браузере. Однако данный тектс слабо влияет на результаты поиска. Например, Google учитывает текст в теге ALT тех изображений, которые являются ссылками на другие страницы, остальные же теги ALT игнорируются. Однако пренебрегать таким методом оптимизации тоже не стоит, так как многие поисковики сейчас  предоставляют такой сервис, как поиск картинок, иными словами, пользователь, ищущий какое либо изображение в Интернете, может найти картинки с вашего сайта, а по ним уже перейти на сам сайт.

  • Мета тег Desciption.    Мета-тег Description специально предназначен для задания описания страницы. Этот тег никак не влияет на ранжирование, но, тем не менее, очень важен. Многие поисковые системы (и, в частности, крупнейшая Google) отображают информацию из этого тега в результатах поиска, если этот тег присутствует на странице и его содержимое соответствует содержимому страницы и поисковому запросу.   Можно с уверенностью сказать, что высокое место в результатах поиска не всегда обеспечивает большое число посетителей. Если описание ваших конкурентов в результатах выдачи будет более привлекательным, чем вашего сайта, то посетители поисковой системы выберут именно их, а не ваш ресурс.  Поэтому грамотное составление мета-тега Description имеет большое значение. Описание должно быть кратким, но информативным и привлекательным, содержать ключевые слова, характерные для данной страницы.

  • Мета-тег Keywords. Этот мета-тег изначально предназначался для указания ключевых слов данной страницы. Однако в настоящее время он почти не используется поисковыми системами. Тем не менее, стоит заполнить этот тег «на всякий случай». При заполнении следует придерживаться следующего правила: добавлять только те ключевые слова, которые реально присутствуют на странице

  • Число страниц сайта. Увеличение числа страниц сайта положительно сказывается на его видимости в поисковых системах. Если на сайт постоянно выкладываться новые материалы, то это воспринимается поисковиками как развитие сайта, что тоже дает ему немало бонусов при ранжировании.

  • Навигационное меню. Использование в ссылках навигационного меню ключевых слов позволит увеличить рейтинг поисковый рейтинг страниц, на которые ведет ссылка.

  • Ключевые слова в названии файла страницы. Если в имени HTML файла есть ключевые слова, это тоже положительно сказывается на поисковом рейтинге страницы, правда, только касаемо англоязычных запросов.

  • Расположение файлов страницы. Несколько хуже ранжируются страницы, чьи файлы лежат в каталогах. Больший вес имеют файлы, размещенные в корне.

  • Одна страница – одна ключевая фраза.   Старайтесь оптимизировать каждую страницу под свою собственную ключевую фразу. Иногда можно выбрать 2-3 родственных фразы, но не следует оптимизировать одну страницу под 5-10 фраз сразу, скорее всего результата не будет никакого.

  • Главная страница сайта.   Оптимизируйте главную страницу сайта (имя домена, index.html) под наиболее важные для вас словосочетания. Эта страница имеет наибольшие шансы попасть в топ поисковых систем. На главную старицу обычно приходиться 30-40% поискового трафика.


     

    Распространенные ошибки SEO-оптимизации.

  • Графический заголовок.    Очень часто в дизайне сайта используется графический заголовок (шапка), то есть картинка во всю ширину страницы, содержащая, как правило, логотип компании, название и некоторую другую информацию. Иногда дело доходит до такого маразма, как представление текстового заголовка в графическом формате. Естественно, такой текст не может быть учтен поисковиками (глаз то у них нет), а отличное для поисковой оптимизации место пропадает зазря. Если уж так хочется покрасоваться с графикой, и, при этом, не забыть о SEO-оптимизации, то можно применить компромиссный вариант: графический логотип вверх старницы присутсвует, но занимает не всю ее ширину, а оставшаяся часть отведена под текст с ключевыми словами.

  • Графическое навигационное меню.  Меню содержит ссылки, а в этих ссылках весьма полезно размещать ключевые слова. Если меню графическое, то поисковик не учтет при ранжировании эти слова. Если уж нельзя отказать от графического меню, то, проводя SEO-оптимизацию, имеет смысл хотя бы ключевые слова разместитьв теге alt картинок.

  • Навигация через скрипты.   В некоторых случаях навигация по сайту осуществляется через использование скриптов. Следует понимать, что поисковики не могут читать и исполнять скрипты. Таким образом, ссылка, заданная через скрипт будет недоступна для поисковой системы и поисковый робот не пройдет по ней.    В таких случаях следует обязательно дублировать ссылки обычным способом, чтобы навигация по сайту была доступна для всех – и для ваших посетителей и для роботов поисковых систем.

  • Идентификатор сессии.   На некоторых сайтах принято использовать идентификатор сессии – то есть каждый посетитель при заходе на сайт получает уникальный параметр &session_id=, который добавляется к адресу каждой посещаемой страницы сайта.  Использование идентификатора сессии позволяет более удобно собирать статистику о поведении посетителей сайта и может использоваться для некоторых других целей.    Однако, с точки зрения поискового робота страница с новым адресом – это новая страница. При каждом заходе на сайт поисковый робот будет получать новый идентификатор сессии и, посещая те же самые страницы, что и раньше, будет воспринимать их как новые страницы сайта.  Строго говоря, поисковые системы имеют алгоритмы «склейки» зеркал и страниц с одинаковым содержанием, поэтому сайты, использующие идентификаторы сессий, все же будут проиндексированы. Однако, индексация таких сайтов затруднена и в некоторых случаях может пройти некорректно. Поэтому использование на сайте идентификаторов сессий не рекомендуется.

  • Редиректы. Редиректы затрудняют анализ сайта поисковыми роботами, а часто за редиректы сайт просто банится поисковой системой.

  • Скрытый текст.  Это скорее не ошибкам, а к преднамеренный обман поисков, но о нем  все же следует упомянуть.   Использование скрытого текста (цвет текста совпадает с цветом фона, например, белое на белом) позволяет «накачать» страницу нужными ключевыми словами без нарушения логики и дизайна страницы. Такой текст невидим для посетителей, однако прекрасно читается поисковыми роботами.  Использование таких «серых» методов оптимизации может привести к бану сайта – то есть принудительному исключению сайта из индекса (базы данных) поисковой системы.

  • Однопиксельные ссылки.   Использование графических изображений-ссылок размером 1*1 пиксель (то есть фактически невидимых посетителю) также воспринимается поисковыми системами как попытка обмана и может привести к бану сайта.


     

    Внешние факторы ранжирования.



    Как видим из предыдущего текста, почти все факторы, влияющие на ранжирование, находятся под контролем web-мастера, и поисковику трудно отличить действительно релевантный поиску ресурс от искусственно оптимизированного под конкретные ключевые фразы, или даже страницы, созданной роботом и не несущей никакой смысловой нагрузки. Для решения этой проблемы было введено ссылочное ранжирование. По логике создателей поисковых систем, если на сайт ссылается много других сайтов,  значит, он содержит действительно полезную и интересную информацию, так как на плохие сайт ссылки никто ставить не будет. Естественно, поисковики учитывают, кто ссылается. Ссылка с большого и популярного сайта оценивается выше, чем с малоизвестного.

    Так же поисковые системы учитывают текст ссылок, релевантность запросу ссылающихся страниц (ссылка с сайтов аналогичной тематики имеет более высокий "вес", чем с сайтов других тематик).

    Для увеличения количества внешних ссылок многие владелицы сайтов обмениваются ссылками, поэтому перекрестные ссылки понижаться в рейтинге либо не учитываются поисковиками вообще.

    Web-мастерам имеет смысл регистрироваться в большом количестве каталогов, так как ссылки с них, хоть и в малой степени, но поднимают рейтинг сайта. Так же полезно упоминать о своем сайте на различных форумах, блогах, социальных сетях. Не будет лишним открыть рассылку, так как многие рассылочные системы хранят архив выпусков, и если вы размещаете в рассылке ссылки на свой сайт, то помимо прямых переходов по ним, эти ссылки учтутся поисковиками и повысят ваш рейтинг.

Последнее обновление ( 05.02.2013 г. )