Адрес веб-страницы, это первое с чем сталкивается поисковый робот, обнаружив ссылку на новую неизвестную ему страницу. Именно адрес новой неизвестной страницы поисковый робот заносит в специальную очередь новых обнаруженных страниц для последующего посещения её поисковым роботом, чтобы решить вопрос о том, включить ли эту страницу в поисковый индекс.
В кратком перечне факторов, влияющих на индексацию сайта, ничего не было сказано про адреса веб-страниц. Поэтому здесь раскроем эту тему более подробно.
Самый простой вариант адреса веб-страницы, это статический адрес. Такие адреса имеют вид типа вот этих
На таких страницах находится обычный html-код (и, возможно, еще клиентские скрипты, то есть такие скрипты, которые исполняются в браузере пользователя, типа JavaScript). Поэтому такие страницы выглядят одинаково для всех посетителей этих страниц, и для людей и для поисковых роботов.
Эти страницы называются статическими потому, что их код не меняется в зависимости от их посещения. Сам вид страницы на экране монитора может в разных браузерах выглядеть чуть-чуть по разному.
Кроме того, если на статической веб-странице работают клиентские скрипты, то часть страницы может меняться при интерактивном взаимодействии пользователя. Например, если на веб-странице имеется скрипт арифметического калькулятора, написанный на JavaScript, то туда на экране монитора можно вписать какие-нибудь числа. Но при самом первом посещении такая страница для всех выглядит одинаково.
Самое принципиальное отличие статических веб-страниц от других страниц Интернета состоит в том, что эти страницы уже изначально существуют в виде отдельных готовых файлов. Эти файлы обычно имеют расширения ".htm" и ".html". В этих файлах, как правило, имеются уже все элементы веб-страницы.
Отдельно от этих файлов существуют только картинки, содержимое фреймов и плавающих фреймов. В коде статической веб-страницы даются только ссылки на эти картинки и файлы с содержимым фреймов. Это связано с том, что картинки и содержимое фрейма может применяться не один раз, а несколько раз на одной и той же веб-странице или на разных веб-страницах. Поэтому картинки и файлы с содержимым фреймов существуют отдельно и не интегрируются в файл статической веб-страницы.
Статические веб-страницы являются САМЫМИ ЛЮБИМЫМИ страницами поисковых систем. Они очень хорошо и быстро индексируются.
Веб-страницы с динамическими адресами, это веб-страницы, которые изначально могут по разному выглядеть для разных пользователей и которые могут меняться со временем даже без участия пользователя, который заново просматривает такую страницу. Это, например, веб-страницы форумов и блогов, веб-страницы с регистрацией пользователей для входа в закрытые разделы сайта и т.п.
Такие страницы создают с помощью серверных скриптов, то есть таких скриптов, которые исполняются не в браузере пользователя, а на том сервере, где расположен сайт пользователя, то есть на хостинге. Такие скрипты обычно пишут на таких языках программирования, как PHP, Perl, Python, ASP и др.
Отличительной особенностью динамических веб-страниц является то, что они изначально не существуют в виде отдельного собранного файла. Когда браузер пользователя отправляет на сервер адрес динамической страницы (то есть запрос на показ страницы с таким адресом), то скрипт формирует эту страницу "на лету" и отдает в браузер пользователя уже собранную веб-страницу.
Вид этой динамической страницы может существенно зависеть, от передаваемых на эту страницу параметров. Эти параметры, обычно, пишутся в адресе страницы после знака "?". Например,
В принципе, поисковые системы сейчас хорошо понимают, что такое динамические веб-страницы и нормально их индексируют. Но у поисковиков существуют строгие квоты на индексирование динамических страниц. Поэтому, если на Вашем сайте очень много таких динамических страниц, то многие из них не будут проиндексированы.
Эти квоты связаны с тем, что динамических страниц на сайте может быть бесконечно много, в том смысле, что совершенно одинаковые по виду веб-страницы могут иметь разные адреса с разными передаваемыми параметрами.
Поэтому желательно все динамические адреса на сайте переделать в статические.
Такую переделку динамических адресов в статические можно сделать с помощью файла ".htaccess", если у Вас на хостинге работает веб-сервер Apache и при этом хостеры включили Вам опцию Mod_Rewrite.
Например, Вы сейчас находитесь на сайте www.king.nanoquant.ru, где Вы видите статические адреса с расширением файлов ".html". Но на самом деле, это динамические страницы. Этот сайт работает на самописном движке, в котором динамические страницы собираются "на лету" из отдельных частей, а в файле ".htaccess" написана инструкция по переделыванию динамических адресов в статические с расширением ".html".
Вот пример такой немного упрощенной инструкции, где просто все файлы с расширением ".php" переделываются в файлы с расширением ".html".
-------------------------------------------------
RewriteEngine on
RewriteRule ^.htaccess$ - [F]
RewriteRule ^(.*).html$ content/$1.php
-------------------------------------------------
Эта запись означает, что любые файлы с расширением ".php", которые находятся в папке content, надо показывать с такими же именами, но с расширением ".html" и так, будто бы все эти файлы находятся не в папке content, а в корневой папке сайта.
Вот еще один пример
-------------------------------------------------------------------
RewriteEngine on
RewriteCond %{REQUEST_URI} ^/page1\.php$
RewriteCond %{QUERY_STRING} ^x=abc(.*)$
RewriteRule ^page1\.php$ http://site.ru/page2.php?x=%2 [L]
-------------------------------------------------------------------
Эта запись означает, что при обращении к странице page1.php на сайте site.ru на самом деле идет обращение к странице page2.php этого же сайта, но со строкой параметров в переменной x без начальной части "abc".
Этот пример показывает, что мы можем модифицировать не только расширения файлов, но и имена файлов и передаваемые параметры.
Например, если пользователь запросит адрес site.ru/page1.php?x=abcdefgh, то на самом деле реально это будет запрос по адресу site.ru/page2.php?x=defgh.
Обратите внимание на одну особенность работы файлов ".htaccess". Действие этого файла распространяется на ту папку, в которой он находится и на все внутренние папки, которые находятся в этой папке. Для отмены действия инструкции файла ".htaccess" на какую-нибудь внутреннюю папку, надо в этой внутренней папке создать новый файл ".htaccess" со своей новой инструкцией. Такой новый файл ".htaccess" также начнет действовать не только в той папке, где он создан, но и на все внутренние папки для этой папки.
Но самое интересное состоит в том, что эту модификацию файлов видят не только посетители Вашего сайта, но и поисковые системы. Поэтому поисковики будут считать, что у Вас на сайте находятся статические веб-страницы. Такой сайт со статическими адресами веб-страниц будет лучше индексироваться по сравнению с таким же сайтом, где все страницы имеют адреса динамических веб-страниц.
Как узнать, работает ли на Вашем хостинге опция Mod_Rewrite?
Можно, конечно, просто спросить у службы поддержки Вашего хостинга.
А можно на свой сайт закинуть файл с расширением ".php" (например, с именем phpinfo.php). В этом файле должна быть одна единственная строка с таким содержанием:
<?php phpinfo(); ?>
Это просто вызов системной функции phpinfo(), которая выводит на экран монитора всю информацию о конфигурации PHP и Apache, которая доступна Вам в данный момент на Вашем хостинге на Вашем тарифе.
Ищите там список загруженных модулей (Loaded Modules) и смотрите, есть ли в этом списке упоминание о модуле Mod_Rewrite. Если нет, то просите своего хостера включить Вам этот модуль. Если хостер не включает, то задумайтесь, не поменять ли Вам хостинг.
Некоторые поисковые системы учитывают, если в адресе веб-странице встречается ключевое слово или ключевая фраза данной страницы. Это усиливает релевантность данной страницы данной поисковой фразе. Поэтому многие веб-мастера хотят чтобы в адресе веб-страницы была написана та ключевая фраза, по которой они раскручивают данную страницу.
Однако, при попытке указать в адресе веб-страницы фразу, мы не можем использовать пробелы и запятые.
В этом случае нужно иметь в виду, что для поисковых систем разделителем слов, кроме пробела и запятой, является еще и знак короткого тире "-". Поэтому, например, адрес страницы, которая посвящена продаже
зеркальных телескопов на сайте site.com может быть таким:
www.site.com/sale-of-reflecting-telescopes.html
Обратите внимание, что знак подчеркивания "_" у поисковых систем не является разделителем слов. Поэтому если адрес страницы будет таким
www.site.com/sale_of_reflecting_telescopes.html,
то, хотя поисковик и отличает этот адрес от адреса
www.site.com/saleofreflectingtelescopes.html,
но всё равно будет считать, что в адресе страницы использовано одно длинное непонятное слово "saleofreflectingtelescopes". Такое длинное непонятное слово не поможит усилит релевантность страницы для
поискового запроса "sale of reflecting telescopes".
Замечание. Здесь использован пример с англоязычным запросом, так как повышение релевантности страницы запросу с помощью ключевой фразы в адресе страницы работает на все 100% в англоязычном Интернете. Для Рунета этот вопрос до сих пор остается открытым (за исключением ключевых слов и фраз в именах кириллических доменов в доменной зоне РФ).
Как известно, если Вы обращаетесь к веб-странице по адресу, типа
www.site.ru
или
www.site.ru/dir/,
то Вам в браузере будет показана веб-страница с именем "index" и расширением ".htm" или ".html" или ".php" и т.д. (Существует строгая иерархия приоритетов расширений файла index, на тот случай, если в
папке находится несколько файлов с именем index, но с разными расширениями.) Например, будут показаны веб-страницы
www.site.ru/index.html
или
www.site.ru/dir/index.html.
Или Вы увидите на экране монитора список всех файлов в папке, если там нет файла с именем index со стандартным расширением.
А теперь спрашивается, если модифицировать адреса динамических страниц при помощи файла ".htaccess", то можно ли эти адреса делать в виде папок? То есть каждой странице пусть соответствует своя отдельная
папка. Например, можно ли сделать адрес страницы таким
www.site.ru/name/
Или обязательно адрес нужно сделать таким
www.site.ru/name.html
Оказывается, что правильным будет второй вариант, а не первый. Дело в том, что роботы некоторых поисковых систем отбрасывают слэш в конце адреса веб-страницы, даже если этот слэш там явно поставлен.
Поэтому пользователь поисковой системы будет попадать не на страницу
www.site.ru/name/,
а на страницу
www.site.ru/name.
Но в данном примере в корневой папке нет файла с именем name. Поэтому в браузере выскочит ошибка 404.
Для преодоления этой ситуации придется в файле ".htaccess" писать еще одну инструкцию, чтобы создать зеркала веб-страниц без слэша. А это очень плохо, так как другие поисковые системы будут воспринимать это как дублирование страниц сайта.
Как правильно линковать свой сайт с другими сайтами? Имеется в виду, не то, как технически правильно написать ссылку на языке разметки HTML, а с какими сайтами следует линковаться. То есть, на какие сайты можно и нужно ставить исходящие ссылки со своих вебстраниц, и с каких сайтов желательно иметь входящие ссылки на свой сайт. Правильная политика вебмастера по линкованию своего сайта должна учитывать политику учета ссылок поисковыми системами. Для этого нужно очень хорошо знать, как поисковики относятся к самым разным ссылкам, какие ссылки принесут пользу, а какие ссылки могут повредить раскрутке сайта.
Читать далее >>>
Иногда под словосочетанием "раскрутка сайта" понимают раскрутку только в поисковых системах. На самом деле существует много других способов раскрутить свой сайт, в том числе даже такой сайт, который попал в бан у поисковых систем. Причем по финансовым затратам эти способы могут обойтись даже дешевле, чем раскрутка в поисковых системах, ибо настоящая раскрутка в поисковых системах требует постоянных денежных вложений.
Читать далее >>>
Про PR Гугла можно иногда встретить в Интернете несколько распространенных мифов. Эти мифы достаточно живучие и основаны на неверном понимании природы гугловского ПиАра. Это такие мифы, как миф о том, что исходящие ссылки ведут к потери PR вебстраницы, что, якобы, передаваемый по ссылке PR можно увеличить, сделав другие ссылки со страницы непрямыми, что Page Rank относится не к одной вебстранице, а, будто бы, ко всему сайту сразу.
Читать далее >>>
В последние годы именно копирование чужого контента на свой сайт стало одной из самых главных причин получения бана от поисковых систем. Почему же происходит так, а не иначе? Чтобы понять механизм этого явления нам придется посмотреть на копирование контента глазами поисковых систем. Сначала Вы должны понимать, что поисковикам совершенно наплевать на авторские права копируемого контента. Это не их проблема соблюдать авторские права, так как они никаких авторских прав не нарушают. Также им без разницы, какой контент появился в начале поисковой выдачи, оригинальный или копированный.
Читать далее >>>
------------------
Автор статьи: Евгений Миронов.
[0] Основы раскрутки сайта
[1] Ошибочные способы раскрутки сайта
[2] Каталоги сайтов
[3] Копирование контента - основная причина бана
[4] Формула PR Гугла
[5] Некоторые мифы о PR Гугла
[6] Сколько ссылок повышают PR
[7] На что смотрят поисковые системы
[8] Что поисковые системы игнорируют на сайте
[9] Влияние адресов страниц на раскрутку
[10] Значение HTML-разметки для раскрутки сайта
[11] Трастовый сайт
[12] Классификация методов раскрутки сайта
[13] Политика линкования