Иногда, кажется, что идеально правильная html-разметка не так уж и важна. Дело в том, что многие браузеры умеют сами автоматически корректировать ошибки в html-разметке веб-страницы и правильно отображать на экране монитора страницу с ошибками в html-коде.
Но поисковые системы относятся к html-разметке гораздо более строго. Это связано с тем, что среди всех элементов веб-страницы, поисковая система должна безошибочно выделить полезный контент.
Перед браузером такой задачи не стоит. Браузер выводит всё на экран, как есть. А уже человек, который смотрит на экран монитора, сам понимает, где тут находится система меню, рекламные баннеры и посторонняя информация, а где тут находится полезная информация, которую надо прочитать. То есть работу по отделению полезной информации от дополнительной информации, от рекламы, от меню, от всяких дизайнерских изысков и т.п. автоматически производит наш мозг визуальным способом.
А поисковая система работает не как мозг человека. Она работает с кодом веб-страницы, который представляет собой цепочку разных символов. И поэтому ошибки в html-разметке могут быть критичными при определении поисковиком, какая часть страницы представляет собой значимый контент, а что можно отбросить и не индексировать.
Кроме того, ошибки в html-коде приводят к тому, что поисковая система тратит больше ресурсов на проведение анализа веб-страницы. Поисковые системы не любят, когда какая-то веб-страница требует к себе повышенного внимания в плане расходования ресурсов поисковика. Поисковику легче выкинуть такую страницу из своего индекса, чем возиться с ней.
Наконец, веб-страница никоим образом не будет включена в индекс поисковой системы, если поисковик обнаружит, что, после фильтрации всего лишнего, в качестве значимого контента остается не текст и не картинки, а, например, код какого-то скрипта или рекламного баннера. Такое может произойти из-за неправильной html-разметке на нормальной странице с нормальным значимым контентом. Поисковик просто подумает, что на данной странице значимый контент отсутствует.
Вот четыре основных момента, на которые нужно обращать внимание веб-мастеру, если он хочет, чтобы на его веб-страницах полезный контент заметили не только живые люди, но и роботы поисковых систем.
Как известно, большинство html-тегов являются парными, то есть имеется открывающийся тег и закрывающийся. Для отображения веб-страницы в браузере порой не так критично, если Вы пропускаете закрывающиеся теги. Особенно, если закрывающиеся теги пропущены в самом конце страницы.
Например, вот этот код
<p>текст</p>
<p>текст</p>
<p>текст</p>
и этот код
<p>текст
<p>текст
<p>текст
в большинстве браузеров будет выглядеть одинаково. Но во втором случае робот поисковой системы будет считать, что внутри первого абзаца находится еще один абзац, внутри которого еще и третий абзац.
Поэтому, если веб-мастер считает, что значимый контент здесь заканчивается, то поисковая система на этот счет имеет другое мнение. Поисковик будет считать, что всё, что идет дальше, это продолжение значимого контента, который нужно анализировать и, возможно, индексировать.
Всё, что находится между парными тегами, является отдельным контейнером и должно содержать только полные целые другие контейнеры, а никак не части этих контейнеров.
Например, это правильное вложение контейнера <b></b> в контейнер <p></p>, так как контейнер <b></b> полностью находится внутри контейнера <p></p>:
<p>текст<b>текст</b></p>.
А вот это неправильное вложение контейнера <b></b> в контейнер <p></p>, так как внутри контейнера <p></p> сидит только часть контейнера <b></b>:
<p>текст<b>текст</p></b>.
Аналогично и внутри контейнера <b></b> тоже сидит только часть контейнера <p></p>. Это выглядит также, как если бы часть чемодана находилась бы в мешке, но при этом часть мешка было бы закрыта в чемодане. Так что непонятно, у нас мешок в чемодане или, наоборот, чемодан в мешке.
Обратите внимание, что оба этих примера ничем не отличаются друг от друга, когда мы смотрим на результат их отображения в браузере, так как между тегами </p></b> ничего нет и между тегами </b></p> тоже ничего нет.
Большое количество таких неправильных вложений, наложенных друг на друга, может сильно запутать поисковик относительно того, где у Вас находится важная часть контента, которую обычно выделяют тегами <h1>, ..., <h6>, <strong>, <b>, <u> и др.
Одни и те же дизайнерские решения можно осуществить по-разному. Например, можно разбить текст на абзацы или при помощи тегов <p> или при помощи тега переноса строки <br>. При этом на экране монитора можно добиться совершенно одинакового расположения абзацев текста в первом и во втором случае.
Но правильным решением будет использовать теги <p>, так как именно эти теги как раз и предназначены для разбиения текста на абзацы. И роботы поисковых систем ожидают, что абзацы будут обозначаться именно тегами <p>. Увидев в тексте много тегов <br>, поисковик не поймет, что это отдельные абзацы. А если теги <br> идут подряд по несколько штук в тексте, то это увеличивает степень "закодируемости" страницы (перенасыщенности кодами), что не очень нравится поисковикам.
Кроме применения несоответствующих тегов, веб-мастера поджидает еще и опасность применения плохих дизайнерских решений с соответствующими тегами. Самый распространенный пример, это применение тегов таблицы, когда надо создать таблицы, размещенные в ячейки других таблиц, особенно, когда уровень вложений таких таблиц равен трем и более.
В этом случае мы запросто можем получить такую ситуацию, когда объем кодов таблиц многократно превышает объем значимого контента. И при этом html-коды сильно разбавляют значимый контент, тем самым сильно увеличивая степень "закодируемости" веб-страницы.
Правильным решением в случае, когда надо сделать несколько уровней вложенности таблиц, будет применение не таблиц, а слоев с тегами div.
Для уменьшения объема html-кода на веб-странице, необходимо использовать каскадные таблицы стилей CSS. Дело в том, что поисковым системам глубоко наплевать на Ваши дизайнерские изыски на сайте. Их интересует только значимый контент. К Вашему дизайну они равнодушны.
Поэтому весь дизайн должен быть максимально собран в CSS, так чтобы на веб-странице html-код был как можно проще. В этом смысле самым правильным решением будет весь CSS убрать в отдельный файл, а не прописать его в части HEAD (и не в тегах). Вариант с отдельным css-файлом удобнее еще и тем, что этот файл могут использовать одновременно несколько веб-страниц одного сайта и даже Ваших нескольких разных сайтов, в том числе и на разных хостингах.
После всего сказанного становится понятно, почему для веб-мастера знание HTML является не желательным, а обязательным. Конечно, сейчас существует много самых разных визуальных html-редакторов, которые создают веб-страницы для тех, кто не знает HTML. Но генерируемый этими редакторами html-код оставляет желать лучшего в плане его оптимизации для раскрутки сайта в поисковых системах.
В задачу таких визуальных редакторов никак не входит создание html-кода, оптимизированного для целей раскрутки сайта. Их задача, это генерирование хоть какого-нибудь html-кода для тех, кому лень учиться, и кому требуются быстрые решения в ущерб качеству.
Особенно поражает генерация html-кода страниц, созданных в программе MS Word. При сохранении вордовских файлов в формате html создается, пожалуй, самый замусоренный html-код, который можно себе вообразить. Опять-таки цель компании Майкрософт состоит совсем не том, чтобы создать html-код, оптимизированный под поисковые системы. Её цель создать такой html-код, чтобы в любом браузере веб-страница идеально совпадала бы с тем дизайном, который она имеет в окне программы Word.
Такая дизайнерская изысканность на своем сайте может привлечь только какого-нибудь новичка, который не слишком хорошо разбирается в том, что помогает раскрутке сайта.
Иногда под словосочетанием "раскрутка сайта" понимают раскрутку только в поисковых системах. На самом деле существует много других способов раскрутить свой сайт, в том числе даже такой сайт, который попал в бан у поисковых систем. Причем по финансовым затратам эти способы могут обойтись даже дешевле, чем раскрутка в поисковых системах, ибо настоящая раскрутка в поисковых системах требует постоянных денежных вложений.
Читать далее >>>
Про PR Гугла можно иногда встретить в Интернете несколько распространенных мифов. Эти мифы достаточно живучие и основаны на неверном понимании природы гугловского ПиАра. Это такие мифы, как миф о том, что исходящие ссылки ведут к потери PR вебстраницы, что, якобы, передаваемый по ссылке PR можно увеличить, сделав другие ссылки со страницы непрямыми, что Page Rank относится не к одной вебстранице, а, будто бы, ко всему сайту сразу.
Читать далее >>>
Какие адреса вебстраниц любят поисковые системы? Почему статические адреса лучше динамических? Как динамические адреса вебстраниц преобразовать в статические? Почему хостинг с поддержкой языка веб-программирования PHP лучше, чем хостинг без такой поддержки? Какие модули Apache важны для модификации адресов вебстраниц? Хорошо ли поисковые системы воспринимают адреса вебстраниц в виде папок? Ответы на эти вопросы должен знать каждый вебмастер.
Читать далее >>>
Очень часто вебмастер задается таким практичным вопросом: "А сколько нужно иметь входящих ссылок на какую-нибудь страницу своего сайта, чтобы повысить PR этой страницы?" Используя формулу вычисления PR и зная свойства ссылающихся страниц, можно сделать оценку нужного количества ссылок. Это количество входящих ссылок экспоненциально растет при росте положительной разницы между желаемым значением PR и тем PR, который имеет страница в данный момент. И очень существенно количество входящих ссылок зависит от свойств ссылающихся страниц. Если PR Вашей страницы маленький, то для его повышения бывает достаточно всего одной единственной ссылки со страницы с высоким значением PR.
Читать далее >>>
------------------
Автор статьи: Евгений Миронов.
[0] Основы раскрутки сайта
[1] Ошибочные способы раскрутки сайта
[2] Каталоги сайтов
[3] Копирование контента - основная причина бана
[4] Формула PR Гугла
[5] Некоторые мифы о PR Гугла
[6] Сколько ссылок повышают PR
[7] На что смотрят поисковые системы
[8] Что поисковые системы игнорируют на сайте
[9] Влияние адресов страниц на раскрутку
[10] Значение HTML-разметки для раскрутки сайта
[11] Трастовый сайт
[12] Классификация методов раскрутки сайта
[13] Политика линкования