Anton Nossik (dolboeb) wrote,
Anton Nossik
dolboeb

This journal has been placed in memorial status. New entries cannot be posted to it.

За кулисами Яндекс.рейтинга

Незнакомый мне пользователь chalif сочинил новую пузомерку.
Она берёт ваш username в ЖЖ, анализирует профайл, и находит всех тысячнегов в вашем списке Friend of.
На выходе выдаёт код, позволяющий похвастаться результатами этого изыскания.
Иногда это бессмысленная цифра. Потому что, как я уже не раз писал, "тысячнег" от нормального человека ровным счётом ничем не отличается. У него такие же две ноги, две руки, одна голова, и, как правило, нет хвоста.
Но иногда о чём-то эта цифирь всё же свидетельствует. В тех случаях, про которые покойный Георг Вильгельм Фридрих Г. подмечал, что количество перешло в качество. Или не перешло. Чтоб в этом убедиться, полезно взглянуть вот на эту табличку:
ЖурналФрендовТысячнеговПроцент
maratguelman45851342,92%
mi3ch84721231,45%
pe3yc17911236,87%
labas26241214,61%
verner15171217,98%
dolboeb102951161,13%
another_kashin30851163,76%
nalymov16051147,10%
sholademi27931103,94%
adagamov.info175481070,60%
abstract200131291033,29%
e_dikiy15211036,77%
tushka20911024,88%
maccolit32011003,12%
plushev3472972,79%
xura1313977,39%
mozgovaya3556962,70%
uisky2102954,52%
krylov4283902,10%
usachev2091904,30%
goblin_gaga7295861,18%
nl6259861,37%
r_l2465853,45%
dimkin6832841,23%
snorapp4637841,81%
ivand1443845,82%
dmitrivrubel1347846,24%
olleke_bolleke7018311,84%
avva4352821,88%
alex_lebedev2812802,84%
maxim_kononenko1957804,06%
chingizid5503781,41%
frumich6568751,14%
radulova5886721,22%
bogushevich3522712,01%
romochka3956661,67%
damian1244645,14%
aqua_snezhok2909612,10%
nevzlin2488582,33%
gospodi1081534,90%
amigo0953954501,26%
doctor_livsy17825490,27%
e_grishkovets11620470,40%
exler7734470,60%
katechkina11451440,38%
cema498408,03%
gosha_o467377,92%
stillavin8505320,38%
graf_garcia1762011,36%
toster17120,10%
solomin247124,86%
antonborisov201125,97%
brad165960,36%
sgt9166,59%

Легко догадаться, что составлял я эту табличку наугад. Ориентировался на такие параметры, как популярность по числу френдов, "авторитетность" по Яндексу и офлайновая известность персонажа. Социологические выводы в основном таковы:
1. На долю тысячнегов среди френдов негативно влияет общая популярность: чем больше френдов, тем ниже среди них доля тысячнегов. Высокая доля тысячнегов среди френдов характерна для ЖЖ с камерной аудиторией, владельцы которых широко известны в узких кругах — причём одинаково часто причиной известности может служить личное знакомство (gosha_o), или профессиональная деятельность персонажа (cema).
2. На число тысячнегов среди читателей влияют очень разные, никак между собой не связанные факторы, относящиеся и к биографии человека, и к возрасту ЖЖ, и к истории его раскрутки, и к месту работы. Любой рейтинг, построенный на учёте этих параметров в том или ином соотношении, будет больше характеризовать само это соотношение, заданное при выборе формулы оценки, чем какие-либо объективные свойства рейтингуемых блогов. Что, собственно говоря, мы и наблюдаем в рейтинге т.н. "авторитетности" Яндекса. Практически табличка наша и показывает (на примере doctor_livsy и stillavin), как именно Яндекс изначально расставлял оценки блогам в ЖЖ. Она же раскрывает секрет изначальной популярности sholademi. Потом формулку подкрутили, и Самсон просел, а Лукьяненко поднялся. Как выше уже сказано, это изменение описывало изменения не в "авторитетности" блоггера (whatever this means), а в алгоритме расчёта.

PS. Я наверняка упустил какие-то журналы, у которых число читателей-тысячнегов выше и в абсолютном значении, и в процентном отношении. Благодарен буду за наводки, помогающие исправить и дополнить таблицу.

PPS. При составлении таблички наткнулся на неслабую дырищу в яндексовом спайдеринге ЖЖ. У Гришковца, как выше указано, 11620 френдов только в ЖЖ. Яндексу из них известно только 7009 (цифра включает все знакомые Яндексу RSS-подписки извне ЖЖ, а не только Friends of). С учётом того факта, что журнал e_grishkovets начал прирастать друзьями с июля с.г. (до этого там было 4 записи и считанные десятки френдов), очевидно, что все 11.620 добавивших — это живые люди, логинившиеся в ЖЖ и пополнявшие свою френдленту за последние 4 месяца. Тот факт, что о существовании 40% из них Яндекс не подозревает, невозможно объяснить цифрой про 17% аккаунтов ЖЖ, запретивших себя индексировать. Ведь данные о френдах журнала Яндекс берёт из профайлов тех, кто его зафрендил, и никто не может запретить Яндексу индексировать userinfo своих читателей. Так что единственное логичное объяснение тут — лаг в работе индексирующего ЖЖ спайдера. В принципе, такое запаздывание является совершенно нормальным явлением, ибо никто не вправе требовать от поисковой машины полной синхронизации и добавления вновь возникающих потоков в режиме реального времени (если только сам хостинг не делает всеобъемлющий content push). Однако же лаг в 40% — это некоторая внештатная величина. Которая, кстати, хорошо объясняет, почему Яндекс знает в ЖЖ 628.498 русских авторов, хотя в действительности их тут 1.236.384 по последнему счёту.

Поясню, во избежание кривотолков, что это наблюдение — совершенно не критика в адрес Яндекса, а просто попытка сопоставления тех данных, которые он транслирует, с реальностью. Ответственность за расхождение этих данных с реальностью лежит скорее на самом ЖЖ, чем на индексирующем его поисковике. Единственная претензия к Яндексу — что он использует термины "авторитетность" и "популярность" вне всякой связи с их значением в русском языке, для обозначения параметра, который менее амбициозные сервисы именуют karma. Но это долгий семантический спор, далеко выходящий за рамки моих скромных изысканий.
Tags: блоги, жж, поиск, социальные сети, яндекс
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 66 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →