Anton Nossik ([info]dolboeb) wrote,
@ 2008-02-23 17:41:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Entry tags:жж, рейтинг, яндекс

Причуды рейтинга
У меня было сильнейшее предчувствие, что пост в [info]nytimesinmoscow, собравший за сутки 1408 комментариев и 48 прямых ссылок (в том числе от [info]drugoi, [info]nl, [info]peresedov, автора этих строк, из [info]ru_politics и других высокорейтинговых блогов), не попадёт ни в пятёрку, ни даже в тридцатку топов Яндекса. Предчувствие меня не обмануло.

Тут, конечно, великое раздолье для конспирологов — задуматься, кто и по какой причине вручную заблокировал в топах запись, которой место в первой строчке по всем официальным яндекс.критериям рейтингования. Но ларчик открывается проще, и не стоит искать злой умысел там, где его нет. Алгоритм как бы автоматического составления списка топовых записей включает столь же автоматические блокировки по разным формальным критериям, не имеющим никакого отношения ни к чему, кроме конкретных условий, когда эти стопперы были добавлены в борьбе с той или иной накруткой. Как антиспамовый фильтр отправляет некоторую часть нужных писем в мусорку, так и стопперы в яндекс.топах регулярно режут именно те записи, которые должны были бы возглавить рейтинг, если б не ошибки алгоритма.

Если яндекс.рейтинг подвергается за это более жёсткой критике, чем антиспамные фильтры, то дело тут не во вселенской несправедливости, а в том всего лишь, что разработчики антиспамов честно и открыто говорят о возможности false positives, и призывают пользователей иногда в спамный ящик заглядывать, или хотя бы искать по нему, если нужное письмо затерялось. А администрация яндекс.рейтинга ни разу на моей памяти не признала существования в нём искажений, ни в принципе, ни по конкретным примерам. Ни разу речь не зашла не только об исправлении этих ошибок при обнаружении, но даже о простом признании их наличия. Думаю, если бы разработчики антиспама заявили, что false positives не существует, на них не меньше бы шишек посыпалось.

Bonus Track: Интересно, что при всей этой героической борьбе со спамом и накрутками Я.ППБ со свистом всосал пиратский ретранслятор dnevn.ru, куда без ссылки на источник чохом высасываются топовые ЖЖ. Теперь в находках ППБ контрафактные копии наших дневников стоят выше оригиналов. И такие же контрафакты с лирушечки тоже почему-то индексируются на ура, хотя, казалось бы, нет ни малейшей проблемы запретить индексирование всего этого мусора одним флажком.



(116 comments) - (Post a new comment)


[info]maxalex
2008-02-23 02:48 pm UTC (link)
Вообще-то все гораздо проще. Сообщество создано недавно и оно все еще не индексируется яндексом в качестве блога. Поэтому оно и не могло попасть с топ.

(Reply to this) (Thread)


[info]maxalex
2008-02-23 02:50 pm UTC (link)
http://blogs.yandex.ru/top/com/?username=nytimesinmoscow - чтобы подтвердить мою догадку

(Reply to this) (Parent)(Thread)(Expand)

(no subject) - [info]dolboeb, 2008-02-23 03:00 pm UTC (Expand)
(no subject) - [info]ma79, 2008-02-23 03:11 pm UTC (Expand)
(no subject) - [info]ma79, 2008-02-23 03:34 pm UTC (Expand)
(no subject) - [info]anton, 2008-02-23 03:55 pm UTC (Expand)
(no subject) - [info]ma79, 2008-02-23 09:08 pm UTC (Expand)
(no subject) - [info]ma79, 2008-02-24 02:52 am UTC (Expand)
(no subject) - [info]ma79, 2008-02-24 02:56 am UTC (Expand)
(no subject) - [info]anton, 2008-02-26 12:42 pm UTC (Expand)

[info]dolboeb
2008-02-23 03:01 pm UTC (link)
Вообще-то для попадания записи в топ совершенно необязательно, чтобы она индексировалась Яндексом. Вот навскидку 46 тому доказательств:
http://deep-water.ru/top/info.php?id=171
http://nl.livejournal.com/robots.txt


Edited at 2008-02-23 03:02 pm UTC

(Reply to this) (Parent)(Thread)(Expand)

(no subject) - [info]anton, 2008-02-23 03:03 pm UTC (Expand)
(no subject) - [info]dolboeb, 2008-02-23 03:20 pm UTC (Expand)
(no subject) - [info]anton, 2008-02-23 03:32 pm UTC (Expand)
(no subject) - [info]molokovoz, 2008-02-24 01:03 pm UTC (Expand)
(no subject) - [info]anton, 2008-02-26 12:41 pm UTC (Expand)
(no subject) - [info]molokovoz, 2008-02-26 11:03 pm UTC (Expand)
(no subject) - [info]nl, 2008-02-23 06:58 pm UTC (Expand)
(no subject) - [info]anton, 2008-02-24 12:30 am UTC (Expand)
(no subject) - [info]nl, 2008-02-24 10:39 am UTC (Expand)
(no subject) - [info]ma79, 2008-02-23 03:07 pm UTC (Expand)
(no subject) - [info]dolboeb, 2008-02-23 03:17 pm UTC (Expand)
(no subject) - [info]ma79, 2008-02-23 03:18 pm UTC (Expand)
(no subject) - [info]linker, 2008-02-24 09:06 pm UTC (Expand)
(no subject) - [info]ma79, 2008-02-24 10:16 pm UTC (Expand)

[info]eldar_m
2008-02-23 02:54 pm UTC (link)
Есть такая проблема. Могу добавить, что яндексовский антиспам оказался способен засунуть в спамный ящик в течение суток 6 из 10 писем от моих американских партнеров, причем все они пришли с одного адреса, без вложений и с одинаковой темой письма. В результате я понес реальные убытки на таможенном складе - что-то около $1500. Если бы не дошли ВСЕ письма, я бы просто позвонил и разобрался в проблеме вовремя, но, т.к. часть писем пришла, получилась глупейшая неразбериха.

(Reply to this) (Thread)


[info]maxalex
2008-02-23 02:56 pm UTC (link)
а вы попробуйте пользоваться ящиком на mail.ru
результаты вас удивят

(Reply to this) (Parent)(Thread)(Expand)

Можно подробнее? - [info]abczeitung, 2008-02-29 08:59 am UTC (Expand)
Re: Можно подробнее? - [info]maxalex, 2008-02-29 11:26 am UTC (Expand)
Re: Можно подробнее? - [info]abczeitung, 2008-02-29 12:41 pm UTC (Expand)
Re: Можно подробнее? - [info]maxalex, 2008-02-29 01:16 pm UTC (Expand)
Re: Можно подробнее? - [info]abczeitung, 2008-02-29 02:01 pm UTC (Expand)

(Reply from suspended user)
(no subject) - [info]eldar_m, 2008-02-23 03:00 pm UTC (Expand)
(no subject) - [info]zemsky, 2008-02-23 03:19 pm UTC (Expand)
(no subject) - [info]eldar_m, 2008-02-23 03:22 pm UTC (Expand)
(no subject) - [info]dolboeb, 2008-02-23 03:28 pm UTC (Expand)
(no subject) - [info]eldar_m, 2008-02-23 03:34 pm UTC (Expand)
(no subject) - [info]panin, 2008-02-23 04:23 pm UTC (Expand)
(no subject) - [info]eldar_m, 2008-02-23 04:37 pm UTC (Expand)
(no subject) - [info]neograff, 2008-02-24 01:25 am UTC (Expand)
(no subject) - [info]eldar_m, 2008-02-24 09:13 am UTC (Expand)
(no subject) - [info]neograff, 2008-02-24 09:25 am UTC (Expand)
(no subject) - [info]eldar_m, 2008-02-24 09:33 am UTC (Expand)
(no subject) - [info]neograff, 2008-02-24 09:35 am UTC (Expand)
(no subject) - [info]polozad, 2008-02-24 10:20 am UTC (Expand)
(no subject) - [info]eldar_m, 2008-02-24 10:41 am UTC (Expand)
(no subject) - [info]polozad, 2008-02-24 10:50 am UTC (Expand)
(no subject) - [info]neograff, 2008-02-24 11:53 pm UTC (Expand)
(no subject) - [info]dolphin278, 2008-02-26 10:53 pm UTC (Expand)
(no subject) - [info]zemsky, 2008-02-24 01:11 pm UTC (Expand)

[info]the_old_boy
2008-02-23 03:06 pm UTC (link)
gmail.com почти не подводит, спам-фильтр работает очень качественно

(Reply to this) (Parent)(Thread)(Expand)

(no subject) - [info]eldar_m, 2008-02-23 03:12 pm UTC (Expand)
(no subject) - [info]richard_roe, 2008-02-23 04:32 pm UTC (Expand)
(no subject) - [info]dolboeb, 2008-02-23 03:22 pm UTC (Expand)
(no subject) - [info]_steppenwolf, 2008-02-23 04:38 pm UTC (Expand)
(no subject) - [info]cooluck, 2008-02-24 11:11 pm UTC (Expand)
(no subject) - [info]rruben, 2008-02-23 03:57 pm UTC (Expand)
(no subject) - [info]neograff, 2008-02-24 01:29 am UTC (Expand)
(no subject) - [info]rruben, 2008-02-24 10:10 am UTC (Expand)
(no subject) - [info]neograff, 2008-02-24 10:17 am UTC (Expand)
(no subject) - [info]rruben, 2008-02-24 10:39 am UTC (Expand)
(no subject) - [info]neograff, 2008-02-24 10:20 am UTC (Expand)
(no subject) - [info]rruben, 2008-02-24 10:36 am UTC (Expand)

[info]drtr0jan
2008-02-24 02:48 pm UTC (link)
А в вайт-лист этот ящик добавлять не пробовали?

(Reply to this) (Parent)

(Reply from suspended user)

[info]zharkov
2008-02-23 02:58 pm UTC (link)
Ну и нечего этому посту в топах делать :)))

(Reply to this) (Thread)(Expand)


[info]the_old_boy
2008-02-23 03:07 pm UTC (link)
От таких постов никакой пользы, кроме вреда.

(Reply to this) (Parent)

(no subject) - [info]romashov, 2008-02-23 03:25 pm UTC (Expand)
(no subject) - [info]zveriozha, 2008-02-23 03:48 pm UTC (Expand)
(no subject) - [info]zharkov, 2008-02-23 04:11 pm UTC (Expand)
(no subject) - [info]zveriozha, 2008-02-23 04:17 pm UTC (Expand)
(no subject) - [info]zharkov, 2008-02-23 04:25 pm UTC (Expand)
(no subject) - [info]boris_petrov, 2008-02-23 04:54 pm UTC (Expand)
(no subject) - [info]zharkov, 2008-02-23 05:44 pm UTC (Expand)
(no subject) - [info]boris_petrov, 2008-02-23 05:48 pm UTC (Expand)
(no subject) - [info]zharkov, 2008-02-23 05:52 pm UTC (Expand)
(no subject) - [info]haraz_bey, 2008-02-23 05:20 pm UTC (Expand)
(no subject) - [info]zveriozha, 2008-02-23 07:58 pm UTC (Expand)
(no subject) - [info]zveriozha, 2008-02-23 05:48 pm UTC (Expand)
(no subject) - [info]zharkov, 2008-02-23 06:05 pm UTC (Expand)
(no subject) - [info]zveriozha, 2008-02-23 07:56 pm UTC (Expand)
(no subject) - [info]zharkov, 2008-02-23 08:16 pm UTC (Expand)
(no subject) - [info]zveriozha, 2008-02-23 09:58 pm UTC (Expand)
(no subject) - [info]zharkov, 2008-02-24 08:26 am UTC (Expand)
(no subject) - [info]zveriozha, 2008-02-24 08:28 am UTC (Expand)
(no subject) - [info]zharkov, 2008-02-24 08:35 am UTC (Expand)
(no subject) - [info]zveriozha, 2008-02-23 08:03 pm UTC (Expand)
(no subject) - [info]1master, 2008-02-23 07:36 pm UTC (Expand)

[info]pe3yc
2008-02-23 03:21 pm UTC (link)
Администрация яндекс-рейтинга (она вроде бы вся состоит из Кукуца и Волнухина, если я не ошибаюсь) не может ничего ни признать, ни опровергнуть, потому что их алгоритм жутко засекречен.

Не могут же они и в самом деле признать, что в реальности этот мегаалгоритм представляет собой набор волюнтаристских и меняющихся чуть ли не ежедневно правил и поправок к коэффициентам, усугубленный к тому же периодическим ручным вмешательством.

(Reply to this) (Thread)(Expand)


[info]dolboeb
2008-02-23 03:23 pm UTC (link)
Да всё они прекрасно могут.
Нормальные люди, читают ЖЖ, пишут в ЖЖ, отвечают на замечания...
Вот, например, выше:
http://dolboeb.livejournal.com/1170423.html?thread=45464311#t45464311

(Reply to this) (Parent)(Thread)(Expand)

(no subject) - [info]pe3yc, 2008-02-23 03:52 pm UTC (Expand)

(Reply from suspended user)

[info]estilitz
2008-02-23 03:25 pm UTC (link)
Да, очень напрягает, что индексация лирушечной трансляции моего блога релевантнее, чем сам блог.

(Reply to this)


[info]pgrigas
2008-02-23 03:35 pm UTC (link)
"...без ссылки на источник чохом высасываются топовые ЖЖ..."
Вопрос - а мой ЖЖ почему там оказался? По рейтигам мой блог ведь только в третьей тысяче?
Оказывается, я себя я недооцениваю?

:)

(Reply to this) (Thread)


[info]dolboeb
2008-02-23 03:52 pm UTC (link)
Там автоматика работает.
И Яндекс, к сожалению, стимулирует её работу.

(Reply to this) (Parent)


[info]faceted_jacinth
2008-02-23 04:22 pm UTC (link)
И что, вам теперь не заплатят или заплатят меньше?

(Reply to this)


[info]metdim
2008-02-23 04:27 pm UTC (link)
А нах анти-Путинскому посту в топах яндекса гулять ? Топы читают тысячи(может миллионы), а писюльки подобной тематики создают общественное мненение. Да и правдоподобность статьи под вопросом .

(Reply to this) (Thread)(Expand)


[info]boris_petrov
2008-02-23 04:56 pm UTC (link)
Может быть, стоит фильтры такие разработать, "идеологические"? Главлит v.2.0 :)

(Reply to this) (Parent)

(no subject) - [info]_bigbrother_, 2008-02-23 08:12 pm UTC (Expand)
(no subject) - [info]metdim, 2008-02-23 09:19 pm UTC (Expand)

[info]semenof663
2008-02-23 05:33 pm UTC (link)
а кто такой этот "другой"?
у него журнал ваще беспантовый, кто ему такой рейтинг нагнал, это наверное русицкие спецслужбы..

(Reply to this)


[info]valez
2008-02-23 06:27 pm UTC (link)
Антон, мне казалось тебе не по возрасту и не по статусу ерунду писать. Ну может молодость вспоминаешь, пиши. Или некомпетентен действительно, в чем сомневаюсь.

(Reply to this)


[info]deargen
2008-02-23 07:03 pm UTC (link)
То бишь борьба Яндекса с накрутками не нравится? Понятно.

(Reply to this)


[info]balamutang
2008-02-23 10:38 pm UTC (link)
а почему СУП сам себе рейтинги не сделает? зачем зависеть от внешних факторов?
да и исходных данных у СУПа побольше будет

(Reply to this) (Thread)


[info]ma79
2008-02-24 12:07 am UTC (link)
омг

(Reply to this) (Parent)

Offtopic
[info]antonborisov
2008-02-23 11:04 pm UTC (link)
Антон, я не знаю, обращали ли Вы на это внимание, но, думаю, для Вас, эта штука очень полезной окажется.

Только не сочтите, пожалуйста, за рекламу. Я сам только недавно это обнаружил, вот вспомнил про Вас. Дело в том, что все Ваши фотографии будут выкладываться автоматически на определенный Вами хрстинг и/или компьютер.

(Reply to this)

Зол
[info]durakdurakom
2008-02-23 11:09 pm UTC (link)
что значит запретить индексирование, убивать за такой плагиат нужно блять семьями причем чтобы уроды больше не появлялись... я в шоке...

(Reply to this)

(Reply from suspended user)

[info]anton
2008-02-24 12:32 am UTC (link)
Где же 0? Больше тысячи, как вы и говорите: http://blogs.yandex.ru/top/?username=samir74#samir74

(Reply to this) (Parent)(Thread)(Expand)

(Reply from suspended user)
(no subject) - [info]anton, 2008-02-24 12:45 am UTC (Expand)
вопрос по статистике LJ
[info]haimovi4
2008-02-24 08:41 am UTC (link)
Антон Борисович, добрый день.

Я уже спрашивал вас про отличии результатов статистики Яндекса и LJ.

Сейчас я понять не могу, откуда у моего журнала ( [info]haimovi4 ) по 1000 посетителей в сутки? Это же невозможно! А статистика LJ показывает за вчерашний день ( хит/пользователь/читатель ) : 2427/1069/668 . Столько народу просто не могло обо мне знать! Может быть учитываются захождения на мои записи в обществе [info]ru_politics ?

Спасибо.


Edited at 2008-02-24 08:41 am UTC

(Reply to this) (Thread)

Re: вопрос по статистике LJ
[info]avaks
2008-02-24 04:06 pm UTC (link)
Почитайте внимательно описание графика посещений. Вы сами себе ответили на свой же вопрос.

(Reply to this) (Parent)


[info]gaus
2008-02-24 12:33 pm UTC (link)
Cверхсекретный алгоритм Яндекс-рейтинга описан в Википедии

(Reply to this)


[info]illyn
2008-02-25 06:03 am UTC (link)
Если у вас есть ЯндексБар в браузере и вы попадаете в пиратку — с поиска, причём — вместо оригинального дневника — то не ленитесь — подлечите эту ерунду.

Нажимайте — «фу спам!», коричневую как гавно кнопку.

Не знаю уж, как там связано или нет, но мне каждый день интересно проверять записи по нескольким запросам — так там тоже были спамрезультаты определённое время — и — то ли я, то ли сообщество таких как я — залечили их нахер. Больше не выдаются.

«Фу! Спам!». Коричневая. Как гавно.

(Reply to this)


(116 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…