Нашествие толокнян против Галилея

Нашествие толокнян против Галилея

Сейчас некоторые вебмастера в счетчиках посещений на своих сайтах стали замечать, что на их сайты идут заходы с яндексовского сервиса Толока.


Слово "толока" у древних славян и прибалтов означало такую взаимопомощь, при которой объединялись усилия всей деревни, а не отдельно взятых семей. Часто толока применялась, например, при постройки церкви или вырубке леса и т.п. То есть тогда, когда чем больше народу в этом участвует, тем лучше.


Если авторизоваться в Яндексе и зайти на эту Толоку, то там Вам предложат выполнение заданий за деньги. Задания заключаются в том, что надо сходить на предложенные сайты и оценить их. А оплата за труд очень мизерная 1-3 цента США.


Всякий, кто бывал на кликовых и серфинговых сайтах, сразу же узнают в этом что-то очень знакомое. Но от кликовых бирж тут есть одно существенное отличие.


В Толоке нет посторонних работодателей, которые несут в Яндекс деньги для того, чтобы платить за выполненные задания. Яндекс сам отплачивает за проделанную работу. То есть Толока не является биржей.


Зачем же Яндексу понадобилась вся эта затея?


Когда-то Яндекс организовал в своем сервисе для вебмастеров сервис "Оригинальные тексты". Суть этого сервиса следующая. Если Вы на своем сайте публикуете оригинальные тексты, то Вы можете указать на этот факт Яндексу.


Само это указание состоит в следующем. Вы сначала скармливаете сервис "Оригинальные тексты" тем текстом, который планируете опубликовать на своем сайте. И только потом публикуете его на сайте. Нужно, чтобы время скармливания было обязательно раньше, чем время публикации.


Тем самым Яндекс понимает, что этот текст раньше всего появился в недрах его сервиса "Оригинальные тексты", а не в Интернете. И, таким образом, Яндекс определяет, на каком сайте появился оригинальный текст. И тем самым, если этот же текст будет впоследствии найден на других сайтах, то там он признается копированным.


В своё время Яндекс объяснил появление этого сервиса не тем, что он расписывается в своем бессилии определять, где контент оригинальный, а где он копированный. А тем, что это, якобы, такой вспомогательный сервис, который нужен для обучения поисковых алгоритмов Яндекса.


Типа, Яндексу нужно собирать статистику и сравнивать её с результатами того, как его автоматические алгоритмы определяют источники оригинального контента. И если есть ошибки, то алгоритмы подстраивают под более точное определение оригинальных текстов и копированных текстов.


Так вот, эта Толока, это аналог сервиса "Оригинальных текстов", но только для сбора статистики для тех автоматических алгоритмов Яндекса, которые оценивают сайты.


Яндекс.Толока - это бета-версия краудсорсинговой платформы для сбора пользовательских оценок. Чтобы алгоритмы Яндекса обучались, им периодически нужны массивы человеческих оценок. Яндекс практикует "ручную" проверку сайтов, когда какой-то сайт в Интернете посещает специальный работник Яндекса. Этих людей называют асессорами. В основном, они делаю выборку разных сайтов для процесса обучения алгоритмов Яндекса.


В данном случае речь идет о том, что количество работы для асессоров сильно выросло. Поэтому руководство Яндекса решило использовать краудсорсинговую модель. Это когда за денежное вознаграждение задания разного формата и содержания выполняют все желающие, кто зарегистрирован в Яндексе.


Например, очень частыми заданиями для "толокнян" является сходить на какой-то сайт и оценить, это сайт для взрослых (порносайт) или на этот сайт могут ходить дети. Типа, алгоритмы Яндекса сами могут определить такие вещи, но они иногда могут ошибаться. Поэтому надо выискивать их ошибки и на основе найденных ошибок исправлять алгоритм, адаптируя его на более точное распознавание порноресурсов.


Есть, конечно, очень сильное подозрение, что и тут Яндекс тоже замаскировано расписывается в своем бессилии автоматически определять тематику сайтов. Речь идет о разного рода пограничных случаях, типа, сайт, где много неприличных анекдотов, или сайт по искусству, но где есть картины и фотографии эротического содержания.


Поэтому, возможно, Яндексу требуются волонтеры толокняне для того, чтобы просматривать все сайты и искать среди них сайты для взрослых, сайты, нарушающие законы, сайты с террористической тематикой, сайты, нарушающие авторские права и занимающиеся пиратством и т.д. И Яндекс готов даже платить толокнянам за их труд.


Ну да, ладно с этими сайтами, которые нарушают законодательство. Самое неприятное, что там есть задания, типа таких: "Определите, может ли этот документ быть полезен человеку, который ищет информацию по теме такой-то?" Другими словами, в Толоке Яндекса есть задания по определению релевантности той или иной вебстраницы тому или иному поисковому запросу (или тематике).


Например, на Вашем сайте есть какая-то страница по какой-то тематике. Яндекс с помощью сервиса Толока может сделать опрос толокнян на предмет того, на сколько данная страница полезна для того, кто хочет найти ответ на какой-то вопрос или, кто ищет материал по такой-то тематике.


И решение того, на сколько Ваша страница релевантна теме или вопросу, будет зависеть от каких-то толокнян.


А, собственно говоря, кто они такие, эти толокняне?


Есть очень большое подозрение, что толокняне, это те же самые ребята, которые являются рабочей силой кликовых и серфинговых сайтов. То есть это школьники, которые ничего не умеют делать, но хотят хоть каких-то денег. Им совершенно пофиг, какие сайты смотреть и что находится на этих сайтах, лишь бы за каждый просмотр сайта им платили один цент.


Качество работы такого контингента самое что ни на есть отвратительное!


В своей работе они гонятся за количеством. У них нет времени, чтобы посидеть, подумать и правильно оценить сайт. Во многих темах просматриваемых сайтов они не разбираются.


А получить эти жалкие гроши они будут стремиться всеми правдами и неправдами. Например, при регистрации в Яндексе они будут неправильно указывать свой возраст (и, возможно, семейное положение). У них большой опыт этого дела в различных соц.сетях.


Причем, это даже хуже ситуации с Галилеем. Во времена жизни Галилео Галилея, вопрос о том, вращается ли Земля вокруг своей оси или нет, решался не рассмотрением доказательств учеными специалистами, а голосованием уважаемых горожан. Поэтому голосование не было хаотичным и было достаточно предсказуемым, (хотя в большинстве случаев и неправильным).


Эти уважаемые горожане хоть имели на сей счет какое-то своё мнение или убеждение или голосовали из каких-то политических соображений. А в Толоке мы будем иметь дело с достаточной долей хаоса и непредсказуемости.


Толокняне, это своеобразные школоасессоры. Уровень знаний людей, проставляющих оценки сайтов, будет в основном обывательский, если совсем не школьный. И вот эта публика будет судить ваши сайты и их релевантность поисковым запросам.


Хотя есть и другое мнение. Сейчас основной потребитель поисковиков, это как раз и есть обыватель. Так что всё нормально. Просто один обыватель будет оценивать релевантность контента для других таких же обывателей.


Яндекс, это коммерческое предприятие и поэтому он вынужден ориентироваться на массовый спрос.



(По материалам форума Searchengines.)



------------------

Автор статьи: Евгений Миронов.

Комментарии к этой заметке больше не принимаются.



декабрь 2014
пн вт ср чт пт сб вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31