Anton Nossik (dolboeb) wrote,
Anton Nossik
dolboeb

This journal has been placed in memorial status. New entries cannot be posted to it.

Categories:

Странности Гугла

Некоторые думают, что Гугл от Яндекса отличается строгостью соответствий.
Скажем, Яндекс любую мужскую фамилию на -ев воспринимает как деепричастие совершенного вида, раскладывает на все возможные глагольные формы, и любую из них сочтёт релевантной по запросу (например: лебедеть, лебедею, лебедеешь и т.п. — это всё, по версии Яндекса, релевантные находки по запросу "Лебедев", и они будут подсвечены в выдаче, ежели вдруг найдутся; наоборот, Лебедев окажется релевантен запросу "лебедеть"). А Гугл, хоть и продвинулся слегка за последнюю пятилетку в осознании факта, что в русском языке существительные склоняются, глаголы спрягаются, а прилагательные имеют род, всё же этим ценным знанием не злоупотребляет. Поэтому если в Интернете нет слова лужковать, то Гугл честно нам скажет, что его нет, а Яндекс исправно найдёт 670 страниц на 28 серверах, где нет этого слова (но есть родительный падеж фамилии Лужков, склеенный со следующей буквой — например, ЛужковаВ или ЛужковаЮ, что Яндексом однозначно воспринимается как формы соответствующего глагола, и подсвечивается как находка)1. Нельзя сказать, что один поисковик по этой причине ищет лучше другого, просто полезно бывает знать эти особенности, и их учитывать при составлении запросов. В одних ситуациях важней точный ответ (в том числе — отрицательный); в других, наоборот, нечёткое соответствие чревато полезными подсказками.

Но только что я обнаружил в Гугле забавнейший глюк, который идёт вразрез с его привычным поведением.
Оказывается, Гугл считает, что кириллическая буква "ю", как строчная, так и прописная, является полным синонимом мужского имени Юрий. Поиск в Гугле этой буквы выдаёт находки, где имя Юрий подсвечено жирным шрифтом. При этом, когда мы заходим в кэшированную версию найденных страниц, подсветка "Юрия" заканчивается. Кто-нибудь наблюдал другие примеры такой шизофрении в Гугле, когда одно и то же слово одновременно считается и не считается находкой?

Update: разгадка оказалась проста. Это так Гугл сокращения разворачивает.
Пример: http://www.google.com/search?q=ie
При этом вылезли другие глюки: разным пользователям Google.Ru и Google.Com по-разному выдаёт эту подсветку, причём по одной и той же ссылке с моего поста. Причины выясняются.
_________________________________________
1. При этом обоим поисковикам, в силу особенностей работы PageRank, может прийти в голову выдать документ, вообще не содержащий искомого слова, если оно встречалось в ссылках на данный документ. В таких случаях прямо сообщается, что искомое слово найдено в ссылках. These terms only appear in links pointing to this page, — признаётся Гугл, а Яндекс сереньким цветом пишет текст ссылок:
Tags: google, поиск, яндекс
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 77 comments