В интернете, как и в реальном мире, некоторые голоса звучат более авторитетно, чем другие. Каждый человек имеет право высказать свое мнение публично. Но как распознать то, которое действительно стоит слушать, спрашивает британский журнал The Economist.
Голосование по Brexit и американские выборы поставили вопрос о том, чьему мнению доверять, более остро. Новостные истории, которые циркулируют в интернете, не всегда наполнены достоверной информацией.
Есть ли алгоритм, который поможет решить, чье мнение надо слушать?
С точки зрения компьютерной науки, вопрос этот связан с репутацией. В маленькой деревне репутация может основываться исключительно на личном опыте; когда мы онлайн, необходимо проследить репутации больших групп незнакомых людей.
В начале 2000-х Сеп Камвар разработал алгоритм под названием EigenTrust, позволяющий построить надежную степень доверия между членами сети. EigenTrust умно использовал информацию от пользователей о поведении друг друга. Если вы передадите мне поврежденный файл, я поставлю вам плохую оценку. Сколько веса алгоритм придаст моему взгляду, зависит от моей собственной репутации. Она зависит от того, сколько пользователей оценили меня положительно, а также и от того, насколько хороши были их репутации.
Такой подход нашел прецеденты в социальном мире. Если вы ищете нового сотрудника, то наверняка уделили много внимания рекомендациям людей, которым вы доверяете в своей сфере.
Аналогичный метод помог Google свергнуть Yahoo как основной поисковик на рубеже веков: знаменитый алгоритм PageRank от Google определяет надежность страницы только по ссылкам, которые он получает от других надежных страниц, самоидентифицирующихся по ссылкам, которые они также получили от других.
Социальные новостные сайты, такие как Reddit, — естественные кандидаты на уподобление алгоритму EigenTrust. Эти сайты полагаются на голосование пользователей — так определяется, какие истории увидят другие посетители. Пользователи получают баллы (карму) для представления популярных историй. И хотя его не так называют, но Facebook также в некотором роде является сайтом социальных новостей.
Однако размещение популярных вещей не всегда синоним хорошего контента — это подчеркивает ключевую проблему для алгоритмов, таких как EigenTrust и PageRank. Можно «отсеять» эти алгоритмы, используя людей. У такого подхода, возможно, все еще есть потенциал, но опыт показывает, что это не так просто. Напрашивается печальный вывод: иногда мы получаем те новости, которых заслуживаем.