Anton Nossik ([info]dolboeb) wrote,
@ 2007-01-29 19:35:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Entry tags:интернет, поиск, рамблер

Интел по слову xyz
nlЛесной экспериментирует с матюгами в Яндекс.ППБ, про которые antonадминистрация сервиса нам рассказывала, что они вычищаются роботом. Лесной умнее робота, и сумел пропихнуть матюг в топ рейтинга, использовав латиницу. Надо заметить, что этот workaround никак не опровергает слов [info]antona о принципе действия робота. Он всего лишь демонстрирует ограниченность списка известных роботу матюгов. То же самое демонстрировало попавшее вчера в топ безо всякой помощи Лесного слово ёпт — видимо, в словаре яндексова фильтра оно не фигурирует как матерное.

А мне в этой связи вспомнился дивный анекдот из первых дней интернет-рекламы в России. Компания Интел через одно симпатичное рекламное агентство купила рекламу на поисковике (кажется, на Рамблере, но могу ошибаться). При этом кто-то особенно умный из менеджеров Интела потребовал, чтобы реклама не показывалась на запросы по слову "х*й". Требование через рекламное агентство было передано администрации поисковика. Которая засела, конечно, писать фильтр по ключевому слову, но обратно передала клиенту вопрос: а по слову "п*зда" надо показывать Вашу рекламу? Нет, ответил клиент. Последовал следующий уточняющий вопрос, потом третий, пятый, девятый. На десятом вопросе до клиента дошло, что пингпонг будет длиться вечно, если не составить сразу весь список стоп-слов. И поручил эту задачу рекламистам. Которые справились. Итоговый список, переданный в Рамблер от имени Intel Corp., имел длину 183 слова. Там учитывались не только русские слова с известными корнями, но и возможность написания ряда букв в этих словах латиницей, или всех слов целиком в транслите. Излишне упоминать, что письмо из Интела в Рамблер, содержащее 183 вариации на заветную тему, в одночасье сделалось легендой РУНЕТа.



(33 comments) - (Post a new comment)


[info]belyrabbit
2007-01-29 04:39 pm UTC (link)
ну что тут сказать
письмо жжот, дайте два ;))

(Reply to this)


[info]belenky
2007-01-29 04:42 pm UTC (link)

А где этот знаменитый список?

Поскольку в России действует закон об оскорблении Президента, я бы предложил составить такой же список слов и выражений, считающихся оскорблениями Президента, и вывесить его во всех госучреждениях.

(Reply to this) (Thread)


[info]renny_
2007-01-29 05:42 pm UTC (link)
+1! Хочу его видеть!!!

(Reply to this) (Parent)(Thread)


[info]bunkind
2007-01-29 06:03 pm UTC (link)
+1
Легенду в студию, пожалуйста.

(Reply to this) (Parent)


[info]ruffe
2007-01-29 04:43 pm UTC (link)
Вывод - не делайте все сами, обращайтесь в агентство, ёпт!

(Reply to this)


[info]vlarine
2007-01-29 04:48 pm UTC (link)
А почему "х*й" и "п*зда" вместо "хуй" и "пизда"?
Чтобы йандекс проиндексировал? ;)

(Reply to this) (Thread)


[info]dolboeb
2007-01-29 05:41 pm UTC (link)
йандекс индексирует независимо.
он только в топах отсекает. А в тексте запросто:
http://blogs.yandex.ru/search.xml?text=%F5%F3%E9+%7C+%EF%E8%E7%E4%E0

(Reply to this) (Parent)


[info]acidgarry
2007-01-29 04:54 pm UTC (link)
найти бы оригинал пиьсма...

а вообще замечательная у тех рекламистов была работа - вспоминать часами весь известный мат и писать его заказчику, осваивая за это некислый бюджет! чтоб я так работал... %)

(Reply to this)


[info]breqwas
2007-01-29 05:43 pm UTC (link)
Помнится, прочитав словарик, по которому фильтрует мат Яндекс, я тоже узнал для себя много нового :)

(Reply to this) (Thread)


[info]miloslavsky
2007-01-29 10:36 pm UTC (link)
А нет ли?

(Reply to this) (Parent)(Thread)


[info]breqwas
2007-01-29 10:37 pm UTC (link)
ДСП. :)

(Reply to this) (Parent)(Thread)


[info]miloslavsky
2007-01-29 10:39 pm UTC (link)
Древесно-стружечная плита? :)
Жаль, а так интересно...

(Reply to this) (Parent)

(Reply from suspended user)
Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]ludoedoed
2007-01-30 12:28 am UTC (link)
Хороший, годный робот.

(Reply to this) (Parent)(Thread)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]svetliy_grustb
2007-05-08 10:35 am UTC (link)
В смысле робот? Что произошло?

(Reply to this) (Parent)(Thread)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]ludoedoed
2007-05-08 08:34 pm UTC (link)
Хотите об этом поговорить?

(Reply to this) (Parent)(Thread)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]svetliy_grustb
2007-05-09 01:57 am UTC (link)
Йа прост не понял ч0 стряслось? Бот? И вы аккаунт заблочили сразу?

(Reply to this) (Parent)(Thread)

Re: кириллическому сегменту скоро каюк. Выборы на Носу.
[info]ludoedoed
2007-05-09 04:39 am UTC (link)
Просто не все роботы одинаково полезны.

(Reply to this) (Parent)


[info]alexmak
2007-01-29 06:08 pm UTC (link)
мне когда-то пришлось создать список слов, против которого проверялся исходный код програм, уходящих заказчику. там были и русские слова, и английские, и транслит, и что угодно. веселый списочек был.

(Reply to this)


[info]alex_derber
2007-01-29 06:20 pm UTC (link)
Ну вот, сразу видно, что в Intel Corp. работают образованные люди :))) Такой мощный список подготовить, это ж сколько высших образований и красных дипломов нужно!

(Reply to this)


[info]myryam76
2007-01-29 06:32 pm UTC (link)
Если учитывать подстановку латиницы, с учетом перебора буковок и транслитов, то как-то даже маловато получается. Пойду, гляну Луку Мудищева и пр...

(Reply to this) (Thread)


[info]dimkin
2007-01-29 06:46 pm UTC (link)
Вот что значит буржуазный ресурс.
Присутствовала ли в списке залупочешуйчатая пропиздоблядская мандихуёвина?

(Reply to this) (Parent)(Thread)


[info]myryam76
2007-01-29 06:52 pm UTC (link)
Ха-Ха-Ха

(Reply to this) (Parent)


[info]dolboeb
2007-01-29 08:11 pm UTC (link)
залупочешуйчатая вряд ли
я думаю, интел еще приплатил бы, чтобы находиться по этому слову.

(Reply to this) (Parent)(Thread)


[info]alex_celly
2007-01-29 08:39 pm UTC (link)
А промандоблядское пиздопроёбище, охуевающее от своей злоебучести?

(Reply to this) (Parent)(Thread)


[info]dolboeb
2007-01-29 08:50 pm UTC (link)
Вряд ли Интел на такое закладывался. Это ж было задолго до Веб 2.0

(Reply to this) (Parent)


[info]akigo
2007-01-29 07:57 pm UTC (link)
А "долбоеб" почему не фильтруется?

(Reply to this) (Thread)


[info]dolboeb
2007-01-29 08:09 pm UTC (link)
Потому что не русскими буквами пишется.
Нет в русском языке такого слова dolboeb.

(Reply to this) (Parent)(Thread)


[info]alfer22
2007-01-30 04:59 am UTC (link)
слова нет, а dolboeb есть

(Reply to this) (Parent)


[info]vadim_i_z
2007-01-29 10:18 pm UTC (link)
Я вот так же написал когда-то для своих школьников прогу по фоносимволическому анализу. Естественно, что сперва они стали проверять свои имена и фамилии, а потом пошли по списку Интела. Я написал фильтрующую процедуру... и получил много впечатлений, составляя список слов и закрывая экран,когда кто-то входил в кабинет информатики.

(Reply to this)


[info]anikitin
2007-01-30 09:55 am UTC (link)
кто интересно был этот прекрасный менеджер.
у меня есть парочка идей, но они как-то подрывают мою веру в людей всё-таки.

(Reply to this) (Thread)


[info]dolboeb
2007-01-30 10:38 am UTC (link)
Я как раз думал, что ты помнишь эту историю лучше меня.

(Reply to this) (Parent)(Thread)


[info]anikitin
2007-01-30 11:01 am UTC (link)
да я ж не занимался никогда медийкой чистой.
это всё делалось через европу в те годы.

именно поэтому мне и удивительно - кто додумался до стоп листа совершенно непонятно.
разве что начальник мой тогдашний непосредственный - но он всегда производил впечатление здравого человека.
ну да бох с ними.

(Reply to this) (Parent)


(33 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…