Некоторые малоизвестные особенности Гугла
Сейчас Гугл является самым большой поисковой системой Интернета по количеству проиндексированных страниц (несколько миллиардов документов) и по количеству языков (около 70), на которых написаны эти веб-страницы. Очень многие псевдо-искалки используют гугловскую поисковую машину. В Рунете самой крупной псевдо-поисковой системой, использующей поисковый механизм Гугла, на сегодня является поисковик портала Mail.Ru.
О работе поисковой системы Google уже написано очень много. Поэтому здесь я расскажу только о некоторых малоизвестных особенностях этого поисковика, которые также дополнительно отличают его от других поисковых систем. В некоторых случаях будет дано сравнение с поисковой системой Яндекс.
- Гугловский паук Googlebot не сразу заходит на Ваш новый сайт, который Вы указали Гуглу в его АддУрилке, а спустя 2-3 недели. Но после этого гугловский бот начинает заходить на Ваш сайт практически каждый день и индексировать (или переиндексировать) по 2-4 страницы в день. А для больших сайтов может переиндексировать и большее число страниц. Тем самым Гугл старается создавать нагрузку на Ваш сервер по миниму. Паук Яндекса, например, использует другую тактику. Например, бот Яндекса может целый месяц не заходить на Ваш сайт, а потом в один день устроить набег на него и переиндексировать сразу все вэб-страницы Вашего сайта. Это может создать дополнительную нагрузку на сервер.
- Сейчас Гугл ведет свою выдачу под протоколом "https", а не под "http". Для Рунета это началось совсем недавно, в 2013 году, а для зарубежных пользователей это практикуется уже давно. Это привело к тому, что сейчас счетчики посещений сайта не могут распознать, по каким поисковым запросам заходят посетители на сайт с поисковой системы Google. В Яндексе, например, такое происходит только, когда пользователи авторизуются в сервисах Яндекса. Если человек не авторизуется в каком-нибудь сервисе Яндекса через свой логин и пароль, то счетчики посещений сайта распознают фразы, которые набирал пользователь в поисковом запросе. Такая особенность Гугла создает огромные трудности для оптимизации сайта под поисковую выдачу Гугла. Поэтому зайти в ТОП-10 в поисковой выдачи Гугла гораздо труднее, чем в других поисковиках. Из-за этого поисковая выдача Гугла более качественная.
- Гугл очень хорошо индексирует статические страницы сайта, то есть такие, которые имеют расширение ".html" и ".htm". Чуть хуже Google индексирует динамические страницы, то есть такие, которые имеют расширение ".shtml", ".php" и т.п. Поисковик Гугл может совсем не проиндексировать сессионные страницы, то есть такие, в адресе которых есть "?".
- Поисковик Google очень уважает сайты из каталога DMOZ. Пауки Гугла постоянно "пасутся" в этом каталоге в поисках новых сайтов. Сайты из этого каталога редко попадают в бан к Гуглу. При этом сам Гугл не является владельцем этого каталога DMOZ и не влияют на его политику включения сайтов в этот каталог. Например, поисковик Яндекс и Яндекс-Каталог, это разные подразделения одной и той же структуры.
- Google среди всех поисковиков лучше всех индексирует сайты, сделанные на фреймах. Причем он хорошо понимает и классические фреймы и плавающие фреймы. Файлы, залитые во фреймы, индексируются отдельно от индексации вэб-страницы, которая содержит фреймы.
- Поисковик Google считает "квантом" Интернета не сайт и не домен, а отдельные веб-страницы. Поэтому свои индексы цитирования он присваивает не доменам и не сайтам, а каждой отдельной странице сайта. Поэтому иногда Вы можете увидеть, что какая-нибудь внутренняя страница сайта имеет PR более высокий, чем главная страница сайта. Яндекс, например, присваивает свой тИЦ отдельным сайтам. Причем, тИЦ домена может незаслуженно расти за счет тИЦ поддоменов. Поэтому Вы можете иногда обнаружить сайт с высоким тИЦ, на который никто не ссылается (даже сайты в его поддоменах), но у которого много поддоменов с высокими тИЦ.
- Поисковая выдача Гугла очень стабильная. По многим запросам можно целые недели и даже месяцы наблюдать одних и тех же лидеров. Изменения в позициях происходят не часто. Но если эти изменения идут с определенным трендом, то переломить этот наметившийся тренд бывает очень трудно. Например, если Вы обнаружили, что Ваш сайт начал терять свои позиции в выдаче по определенному запросу, то очень трудно понять, почему это происходит. И еще труднее понять, что требуется сделать для того, чтобы Ваш сайт прекратил терять свои позиции по данному запросу. А вот Яндекс очень часто лихорадит с выдачей. Порой через месяц в ТОП-10 по какому-нибудь поисковому запросу мы не видим ни одного сайта, который там был раньше. Ощущение такое, что те, кто разрабатывают поисковый алгоритм Яндекса, сами не понимают, что хотят. Например, нормальный сайт СДЛ с оригинальными текстами может ни с того ни с сего угодить в бан, а через полгода по неизвестной причине выйти из этого бана.
- Поиск Гугла ориентирован, в основном, на поиск интернет-адреса, соответствующего запросу. В то время, как например, поиск Яндекса, ориентирован, в основном, на поиск интернет-текста, соответствующего запросу. Интернет-адрес и интернет-текст, это, вообще говоря, разные вещи, хотя и близкие, а часто и совпадающие. Например, если Вы набираете в поиске фразы, типа "Аэрофлот", "Майкрософт" и т.п., то наверху поисковой выдачи Гугла будет больше, чем в Яндексе, вэб-страниц с официальных сайтов компаний Аэрофлот, Майкрософт и т.д. А наверху поисковой выдачи Яндекса будет больше, чем в Гугле, доля страниц из сайтов, которые не имеют отношения к этим компаниям, но где эти компании много обсуждаются и упоминаются, например, страницы из каких-нибудь блогов независимых блогеров.
------------------
Автор статьи: Евгений Миронов.