Иногда, кажется, что идеально правильная html-разметка не так уж и важна. Дело в том, что многие браузеры умеют сами автоматически корректировать ошибки в html-разметке веб-страницы и правильно отображать на экране монитора страницу с ошибками в html-коде.
Но поисковые системы относятся к html-разметке гораздо более строго. Это связано с тем, что среди всех элементов веб-страницы, поисковая система должна безошибочно выделить полезный контент.
Перед браузером такой задачи не стоит. Браузер выводит всё на экран, как есть. А уже человек, который смотрит на экран монитора, сам понимает, где тут находится система меню, рекламные баннеры и посторонняя информация, а где тут находится полезная информация, которую надо прочитать. То есть работу по отделению полезной информации от дополнительной информации, от рекламы, от меню, от всяких дизайнерских изысков и т.п. автоматически производит наш мозг визуальным способом.
А поисковая система работает не как мозг человека. Она работает с кодом веб-страницы, который представляет собой цепочку разных символов. И поэтому ошибки в html-разметке могут быть критичными при определении поисковиком, какая часть страницы представляет собой значимый контент, а что можно отбросить и не индексировать.
Кроме того, ошибки в html-коде приводят к тому, что поисковая система тратит больше ресурсов на проведение анализа веб-страницы. Поисковые системы не любят, когда какая-то веб-страница требует к себе повышенного внимания в плане расходования ресурсов поисковика. Поисковику легче выкинуть такую страницу из своего индекса, чем возиться с ней.
Наконец, веб-страница никоим образом не будет включена в индекс поисковой системы, если поисковик обнаружит, что, после фильтрации всего лишнего, в качестве значимого контента остается не текст и не картинки, а, например, код какого-то скрипта или рекламного баннера. Такое может произойти из-за неправильной html-разметке на нормальной странице с нормальным значимым контентом. Поисковик просто подумает, что на данной странице значимый контент отсутствует.
Вот четыре основных момента, на которые нужно обращать внимание веб-мастеру, если он хочет, чтобы на его веб-страницах полезный контент заметили не только живые люди, но и роботы поисковых систем.
Как известно, большинство html-тегов являются парными, то есть имеется открывающийся тег и закрывающийся. Для отображения веб-страницы в браузере порой не так критично, если Вы пропускаете закрывающиеся теги. Особенно, если закрывающиеся теги пропущены в самом конце страницы.
Например, вот этот код
<p>текст</p>
<p>текст</p>
<p>текст</p>
и этот код
<p>текст
<p>текст
<p>текст
в большинстве браузеров будет выглядеть одинаково. Но во втором случае робот поисковой системы будет считать, что внутри первого абзаца находится еще один абзац, внутри которого еще и третий абзац.
Поэтому, если веб-мастер считает, что значимый контент здесь заканчивается, то поисковая система на этот счет имеет другое мнение. Поисковик будет считать, что всё, что идет дальше, это продолжение значимого контента, который нужно анализировать и, возможно, индексировать.
Всё, что находится между парными тегами, является отдельным контейнером и должно содержать только полные целые другие контейнеры, а никак не части этих контейнеров.
Например, это правильное вложение контейнера <b></b> в контейнер <p></p>, так как контейнер <b></b> полностью находится внутри контейнера <p></p>:
<p>текст<b>текст</b></p>.
А вот это неправильное вложение контейнера <b></b> в контейнер <p></p>, так как внутри контейнера <p></p> сидит только часть контейнера <b></b>:
<p>текст<b>текст</p></b>.
Аналогично и внутри контейнера <b></b> тоже сидит только часть контейнера <p></p>. Это выглядит также, как если бы часть чемодана находилась бы в мешке, но при этом часть мешка было бы закрыта в чемодане. Так что непонятно, у нас мешок в чемодане или, наоборот, чемодан в мешке.
Обратите внимание, что оба этих примера ничем не отличаются друг от друга, когда мы смотрим на результат их отображения в браузере, так как между тегами </p></b> ничего нет и между тегами </b></p> тоже ничего нет.
Большое количество таких неправильных вложений, наложенных друг на друга, может сильно запутать поисковик относительно того, где у Вас находится важная часть контента, которую обычно выделяют тегами <h1>, ..., <h6>, <strong>, <b>, <u> и др.
Одни и те же дизайнерские решения можно осуществить по-разному. Например, можно разбить текст на абзацы или при помощи тегов <p> или при помощи тега переноса строки <br>. При этом на экране монитора можно добиться совершенно одинакового расположения абзацев текста в первом и во втором случае.
Но правильным решением будет использовать теги <p>, так как именно эти теги как раз и предназначены для разбиения текста на абзацы. И роботы поисковых систем ожидают, что абзацы будут обозначаться именно тегами <p>. Увидев в тексте много тегов <br>, поисковик не поймет, что это отдельные абзацы. А если теги <br> идут подряд по несколько штук в тексте, то это увеличивает степень "закодируемости" страницы (перенасыщенности кодами), что не очень нравится поисковикам.
Кроме применения несоответствующих тегов, веб-мастера поджидает еще и опасность применения плохих дизайнерских решений с соответствующими тегами. Самый распространенный пример, это применение тегов таблицы, когда надо создать таблицы, размещенные в ячейки других таблиц, особенно, когда уровень вложений таких таблиц равен трем и более.
В этом случае мы запросто можем получить такую ситуацию, когда объем кодов таблиц многократно превышает объем значимого контента. И при этом html-коды сильно разбавляют значимый контент, тем самым сильно увеличивая степень "закодируемости" веб-страницы.
Правильным решением в случае, когда надо сделать несколько уровней вложенности таблиц, будет применение не таблиц, а слоев с тегами div.
Для уменьшения объема html-кода на веб-странице, необходимо использовать каскадные таблицы стилей CSS. Дело в том, что поисковым системам глубоко наплевать на Ваши дизайнерские изыски на сайте. Их интересует только значимый контент. К Вашему дизайну они равнодушны.
Поэтому весь дизайн должен быть максимально собран в CSS, так чтобы на веб-странице html-код был как можно проще. В этом смысле самым правильным решением будет весь CSS убрать в отдельный файл, а не прописать его в части HEAD (и не в тегах). Вариант с отдельным css-файлом удобнее еще и тем, что этот файл могут использовать одновременно несколько веб-страниц одного сайта и даже Ваших нескольких разных сайтов, в том числе и на разных хостингах.
После всего сказанного становится понятно, почему для веб-мастера знание HTML является не желательным, а обязательным. Конечно, сейчас существует много самых разных визуальных html-редакторов, которые создают веб-страницы для тех, кто не знает HTML. Но генерируемый этими редакторами html-код оставляет желать лучшего в плане его оптимизации для раскрутки сайта в поисковых системах.
В задачу таких визуальных редакторов никак не входит создание html-кода, оптимизированного для целей раскрутки сайта. Их задача, это генерирование хоть какого-нибудь html-кода для тех, кому лень учиться, и кому требуются быстрые решения в ущерб качеству.
Особенно поражает генерация html-кода страниц, созданных в программе MS Word. При сохранении вордовских файлов в формате html создается, пожалуй, самый замусоренный html-код, который можно себе вообразить. Опять-таки цель компании Майкрософт состоит совсем не том, чтобы создать html-код, оптимизированный под поисковые системы. Её цель создать такой html-код, чтобы в любом браузере веб-страница идеально совпадала бы с тем дизайном, который она имеет в окне программы Word.
Такая дизайнерская изысканность на своем сайте может привлечь только какого-нибудь новичка, который не слишком хорошо разбирается в том, что помогает раскрутке сайта.
Как раскрутить свой сайт? Для раскрутки своего сайта нужно уметь пользоваться счетчиком посещаемости сайта, знать, какую полезную информацию может предоставить Вам такой счетчик и как её использовать. Также нужно знать, что такое релевантность страницы поисковому запросу, почему разные вебстраницы в Интернете имеют разную авторитетность в поисковых системах и как влияет удовлетворенность посетителей Вашего сайта на позиции Вашего сайта в поисковой выдаче по тому или другому поисковому запросу.
Читать далее >>>
Почему Вы тратите столько сил, времени и денег на раскрутку своего сайта, а результат получается совсем мизерный. В то время, как другие вебмастера тратят на раскрутку своего сайта совсем немного сил, времени и денег, а результат получается колоссальным. Бывает, что некоторые вебмастера совсем не озабочены раскруткой своего сайта, и тем не менее, каким-то чудом их вебстраницы оказываются в первой десятке поисковой выдаче по, казалось бы, достаточно конкурентному поисковому запросу. Дело в том, что у разных сайтов имеется разная репутация в поисковых системах. Поисковики относятся к разным сайтам с разной степенью доверия. Эта степень доверия зависит от всего прошлого и нынешнего поведения сайта, а точнее от поведения его вебмастера.
Читать далее >>>
Какие адреса вебстраниц любят поисковые системы? Почему статические адреса лучше динамических? Как динамические адреса вебстраниц преобразовать в статические? Почему хостинг с поддержкой языка веб-программирования PHP лучше, чем хостинг без такой поддержки? Какие модули Apache важны для модификации адресов вебстраниц? Хорошо ли поисковые системы воспринимают адреса вебстраниц в виде папок? Ответы на эти вопросы должен знать каждый вебмастер.
Читать далее >>>
Как правильно линковать свой сайт с другими сайтами? Имеется в виду, не то, как технически правильно написать ссылку на языке разметки HTML, а с какими сайтами следует линковаться. То есть, на какие сайты можно и нужно ставить исходящие ссылки со своих вебстраниц, и с каких сайтов желательно иметь входящие ссылки на свой сайт. Правильная политика вебмастера по линкованию своего сайта должна учитывать политику учета ссылок поисковыми системами. Для этого нужно очень хорошо знать, как поисковики относятся к самым разным ссылкам, какие ссылки принесут пользу, а какие ссылки могут повредить раскрутке сайта.
Читать далее >>>
------------------
Автор статьи: Евгений Миронов.
[0] Основы раскрутки сайта
[1] Ошибочные способы раскрутки сайта
[2] Каталоги сайтов
[3] Копирование контента - основная причина бана
[4] Формула PR Гугла
[5] Некоторые мифы о PR Гугла
[6] Сколько ссылок повышают PR
[7] На что смотрят поисковые системы
[8] Что поисковые системы игнорируют на сайте
[9] Влияние адресов страниц на раскрутку
[10] Значение HTML-разметки для раскрутки сайта
[11] Трастовый сайт
[12] Классификация методов раскрутки сайта
[13] Политика линкования