Anton Nossik ([info]dolboeb) wrote,
@ 2007-12-12 14:06:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Entry tags:last.fm, lastfm, поиск, яндекс

Завтрашний день мультимедийного поиска
Записал вчера в Коммерсанте-Видео колонку про новый яндекс.поиск по картинкам.
(Как смонтируют — дам тут ссылку).
Мне кажется, что покуда мы тут обсуждаем Web 2.0 и соцсети, реальной интернет-революции завтрашнего дня стоит ждать как раз на этом направлении.

Ведь веб сегодня, как в прошлом тысячелетии, остаётся исключительно текстовой средой. По сути дела, тут доступна только та информация, которая текстуально описана и размечена — и только для ищущих на том языке, на котором её разметили. Это касается и изображений, и музыки, и видеоматериалов. Хотя мультимедийных файлов в Сети доступны сотни миллионов, большинство из них нельзя удовлетворительно выявить поиском, покуда алгоритмы индексации не лезут внутрь и не умеют внятно анализировать содержимое, а довольствуются лишь учётом сопроводительных текстовых меток.

Понятно, что дефицит удачных решений в области содержательного мультимедийного поиска — не чей-то досадный недосмотр. Анализировать сюжеты графических файлов, угадывать мелодию, расшифровывать речь из видео- и аудиопотока разработчики поисковых машин пытаются уже не первый десяток лет. Скажем, АльтаВиста в свои лучшие времена тестировала видеопоиск ещё на трансляции слушаний по импичменту Клинтона... Скромные успехи связаны в первую очередь со сложностью задачи (вплоть до неосуществимости на современном этапе).

Технология, представленная Яндексом в партнёрстве с Picsearch, увы, не даёт пока оснований для того, чтобы говорить о революционном прорыве в анализе изображений. В новой искалке достоверно анализируется лишь ограниченный набор признаков, имеющих отношение больше к техническим свойствам файла, чем к его сюжету (последний по-прежнему берётся из текстовых меток). Picsearch в этом смысле продвинулся дальше, используя смысловой рубрикатор сюжетов, наподобие тех, которые можно встретить в фотобанках. Но построение такого рубрикатора с заявкой на универсальность — адской сложности логическая задача, причём скорей для мозгов, чем для вычислительной техники. А покуда нет универсальности, нет и удовлетворительной надёжности поисковых алгоритмов. Если поисковик справляется с задачей анализа, условно говоря, на 20% или 40%, то он по-прежнему не дотягивает до уровня качества выдачи, который уже достигнут поиском по текстовым меткам. Революция случится лишь тогда, когда от залезания внутрь мультимедийного файла качество выдачи повысится по сравнению с нынешним набором находок.

Один из создателей Last.FM Мартин Штиксель, с которым я в конце ноября обсуждал ту же проблему применительно к аудиофайлам, настроен вполне оптимистично. На базе Last.FM с лета проходит публичный тест технологии fingerprinting, которая позволяет анализировать и узнавать аудиофайлы не по рукописным ID-тегам, а по внутренней их нетекстовой структуре. Пока что речь идёт о standalone-приложении, собирающем "отпечатки пальцев" с десятков миллионов MP3-файлов на дисках бета-тестеров; однако же Штиксель обещал, что в ближайших релизах аудиоскробблера эта функциональность (присутствующая там с версии 1.4.0.0, т.е. со 2 ноября) перейдёт из пассивного состояния в активное. Таким образом создатели Last.FM надеются убить двух зайцев: покончить с неразберихой в каталоге и значительно повысить релевантность выдаваемых системой рекомендаций. Надеюсь, что в обозримом будущем мы увидим какие-нибудь внятные успехи на этом направлении. Переход от "музыки, похожей по демографии/тегам" к "музыке, похожей по звучанию" в самом деле должен сотворить с рекомендательным сервисом чудеса.

А сотворит ли — посмотрим.



(43 comments) - (Post a new comment)


[info]redguy
2007-12-12 11:12 am UTC (link)
с новыми сонериками идет софт умеющий анализировать музыку. на телефоне достаточно выбрать соответствующее музыкальное настроение и будет играть похожая по настрою музыка из всей коллекции.

(Reply to this) (Thread)

(Reply from suspended user)

(Reply from suspended user)

[info]aleks_vk
2007-12-12 03:15 pm UTC (link)
называется MusicID от Gracenote

этот сервис уже встроен в новый Winamp, с версии 5.5 кажется

(Reply to this) (Parent)(Thread)


[info]illyn
2007-12-15 12:09 am UTC (link)
Раньше, но он поменялся в худшую сторону.
Ранее был устроен следующим образом

(Reply to this) (Parent)


[info]letaet
2007-12-12 11:13 am UTC (link)
Самое смешное, Борисыч, что еще в 97-м году я получил "стипендию Шапиро" на два года - под написание поисковой системы, которая будет распознавать картинки. Просто все мои научные труды были про распознавание, вот я и... Выписавший стипендию Исраэль Палхан был несколько удивлен моей наглостью, но решил не мешать развлекаться. В итоге, все удовлетворились книжкой про тырнет и простеньким мегапоиском научной информации.

(Reply to this) (Thread)


[info]cuarto_oscuro
2007-12-14 09:45 am UTC (link)
Смешно.

(Reply to this) (Parent)

(Reply from suspended user)

[info]dadcaptain
2007-12-12 11:37 am UTC (link)
Я понимаю, что вопрос возможно не по адресу, но почему никто до сих пор не научился в опциях расширенного поиска по картинкам давать пользователю задавать банально размер картинки в пикселях - регулярно хочется искать строго 16х16 или 32х32 и т.д. и никто не дает.

(Reply to this)


[info]breqwas
2007-12-12 11:43 am UTC (link)
> Переход от "музыки, похожей по демографии/тегам" к "музыке, похожей по звучанию"

...уже давно состоялся. Называется - Music Genome Project, реализован в радиостанции Pandora. Ей надо сказать название группы либо трека, и оно станет играть похожую музыку.

Проблема состоит в том, что оно работает. И работает слишком хорошо. Если ей написать Led Zeppelin - оно будет играть музыку, похожую по звучанию на Led Zeppelin. Но совершенно не факт, что она будет так же хороша, как Led Zeppelin. Через полчаса - надоедает.

Увы, теперь оно уже недоступно из России.

(Reply to this) (Thread)


[info]poi2punk
2007-12-12 12:01 pm UTC (link)
pandora самый крутой музыкальный сайт. мы всей тусовкой просто болели пандорой пока её не закрыли для россии=\

при этом пандора всё равно опирается на приписаные каждой группе или композиции наборы тегов, а не разбирает само звучание.

то есть вводя "Лед Цепелин" оно тебе будет предлагать банды и треки где в тегах найдет "classic rock roots", "strong male vocals" ну и так далее..

(Reply to this) (Parent)(Thread)


[info]breqwas
2007-12-12 12:04 pm UTC (link)
Я в курсе.
It just works, а остальное неважно :)

Ну то есть - на любую сколько-нибудь известную группу оно мне давало большую и действительно релевантную подборку.

(Reply to this) (Parent)(Thread)


[info]poi2punk
2007-12-12 12:13 pm UTC (link)
ты не поверишь=) оно мне давало охренительные подборки на совершенно местечковые банды=)

закрыли пандору для россии=\ закрыли...

(Reply to this) (Parent)(Thread)


[info]bjick
2007-12-12 02:09 pm UTC (link)
кстати, как-нибудь анонимизироваться через прокси не получается?

(Reply to this) (Parent)(Thread)


[info]poi2punk
2007-12-12 02:33 pm UTC (link)
не

(Reply to this) (Parent)


[info]sencho
2007-12-12 11:10 pm UTC (link)
а почему закрыли?

(Reply to this) (Parent)(Thread)


[info]sencho
2007-12-12 11:16 pm UTC (link)
сейчас у них на сайте прочитал, что они сейчас работают только в штатах. но у меня в англии пашет на отлично :)

(Reply to this) (Parent)


[info]illyn
2007-12-15 12:13 am UTC (link)
Совсем-совсем по звуку подбирает другая технология, она локальная, от предиксиса (русскими основанной компанией, кстати).

(Reply to this) (Parent)


[info]ailon
2007-12-12 03:01 pm UTC (link)
Там ведь ручками это все делалось, но делалось очень хорошо. Рекоммендации ласт.фм нервно курят в стороне. Только вот с менеджерами/юристами у пандоры плохо. Непонятно мне почему ласт.фм работает во всем мире, а пандора только в штатах.

(Reply to this) (Parent)(Thread)


[info]illyn
2007-12-15 02:04 am UTC (link)
А компьютером тоже есть технология, она локальная, от предиксиса в винампы встраивалась раньше.

(Reply to this) (Parent)


[info]sashachist
2007-12-12 11:44 am UTC (link)
в моем sony ericsson
есть прога track id
использовал раз 30 - подносил к источнику звука - по радио, телевизору - он безошибочно выдавал исполнителя, альбом и трэк

(Reply to this)


[info]aengus_spb
2007-12-12 12:40 pm UTC (link)
Секундочку. Программы, определяющие музыку по finger print'у -- это такой боян, что мне казалось, для всех приличных плееров уже несколько лет есть такие плагины. Самый удачный и распространённый проект -- www.freedb.org, сменивший ставший коммерческим cddb.

(Reply to this) (Thread)


[info]sobaker
2007-12-12 02:22 pm UTC (link)
Он определял музыку только по целому диску, используя в качестве идентификатора совокупность продолжительностей треков (или вроде того).

А чисто по звучанию - это http://www.musicbrainz.org/, например

(Reply to this) (Parent)(Thread)


[info]aengus_spb
2007-12-12 04:05 pm UTC (link)
Если я не ошибаюсь, это cddb определял только по целому диску. А freedb, мне казалось, делал это и по отдельным трекам. MusicBrainz это тоже умеет. И foosic.

(Reply to this) (Parent)(Thread)


[info]sobaker
2007-12-13 07:48 am UTC (link)
Нет, freedb тоже считает уникальный ID для целого диска и не умеет определять отдельно взятый трек.
Foosic у меня не открывается сейчас, увы.

(Reply to this) (Parent)


[info]aengus_spb
2007-12-12 04:09 pm UTC (link)
Во всяком случая, мне точно случалось проставлять с помощью freedb тэги для набора mp3-файлов.

(Reply to this) (Parent)(Thread)


[info]sobaker
2007-12-13 07:41 am UTC (link)
Ну естественно. Попробую догадаться: набор mp3-файлов представлял собою оцифрованный диск. В таком наборе, естественно, сохраняется длительность всех треков и их последовательность.

(Reply to this) (Parent)


[info]webid_studio
2007-12-12 12:54 pm UTC (link)
яндекс еще и нано открыл.

(Reply to this)


[info]sinodov
2007-12-12 01:26 pm UTC (link)
Антон Борисович, что вы. "Яндекс" не представил никакой технологии. Он лицензировал поиск у Picsearch.

(Reply to this)


[info]letchik
2007-12-12 01:58 pm UTC (link)
AudioID уже черт знает сколько времени работает

(Reply to this)

а сможет он отличить мое фото до выходных и после?
[info]kuzmaholodcoff
2007-12-12 02:34 pm UTC (link)
мое фото до выходных и после? особенно в праздники!!!

(Reply to this)


[info]nickolas_basile
2007-12-12 03:07 pm UTC (link)
По слову "елка" и по типу "фото" он находит фотки певицы Елки. Удивительная ре-ле-ват-ность или как её там.

(Reply to this)

Работы в направлении поиск в аудио идут полным ходом
[info]boytsov
2007-12-12 03:14 pm UTC (link)
Есть такой отечественный стартап www.tellicity.ru -- пока в ранней стадии, и выложено простое демо.
Делают поиск по русским аудио-записям (аудио в видео, тоже считается за аудио :)
Вроде как уникальная разработка для русского языка. Для инглиша есть несколько довольно успешно развивающихся проектов: www.blinkx.com, www.everyzing.com, www.pluggd.com, www.tveyes.com, а для русского никто ничего толком еще не сделал.

Разработчики пока ищут инвесторов: http://alex-ksy.livejournal.com/2888.html
Надеюсь не слишком долго придется ждать результатов. Для поиска было бы действительно революционно. Да и не только в этой сфере применение будет.

К слову о музыке -- с подобным же подходом к анализу аудио, наверняка можно музыку научиться анализировать детально, выделять множество параметров, в том числе таких "человеческих" как настроение. Тогда музыкальные сайты смогли бы предлагать музыку куда более сочетаемую и "прущую" -)
Хотя, это наверное "послезавтрашний" день и-нет революции :)


(Reply to this)


[info]dimorlus
2007-12-12 03:48 pm UTC (link)
Я думаю, от программ, умеющих найти похожую по настроению/звучанию/психологическому воздействию музыку/фото/видео до программ, синтезирующих по заказу то, чего хочет пользователь полшага. Напишешь ей "подрочить" - она и сварганит видео с нужной данному дрочеру порнухой...

(Reply to this)


[info]n_on
2007-12-12 06:15 pm UTC (link)
Музыка, которая нравится одному человеку различна по звучанию. То есть, если мне нравится нечто, я, ища похожее по звучанию, на самом деле хочу найти то, что мне тоже понравится. А, даже если машины будут анализировать музыкальную композицию, набор инструментов и т.п., это не будет иметь смысла, относительно моей цели. На одних и тех же инструментах с одного и того же листа можно сыграть разную музыку. Это внерационально и не может быть оценено алгоритмически. В чём смысл такого поиска?

(Reply to this) (Thread)


[info]skuzn
2007-12-12 06:51 pm UTC (link)
я хочу по куску из песни понять что за песня и кто исполнитель
особенно хотелось бы, чтобы это работало с опцией "рабинович напел" :)

(Reply to this) (Parent)(Thread)


[info]n_on
2007-12-12 06:53 pm UTC (link)
Да, об этом я не подумал.

(Reply to this) (Parent)


[info]raptor_r
2007-12-12 08:36 pm UTC (link)
Сайт www.moskva.fm, как раз этим и занимается.
Но не с предложенными вами песнями, а с радиоэфиром. Так что технология существует.

(Reply to this) (Parent)


[info]raptor_r
2007-12-12 08:56 pm UTC (link)
К слову, очень забавный поисковик:
http://www.quintura.ru/
В режиме картинок получается еще смешнее.

(Reply to this)


[info]sfajrat
2007-12-12 11:28 pm UTC (link)
насичёт инфы про ласт.фм спасибо

(Reply to this)


[info]sfajrat
2007-12-12 11:32 pm UTC (link)
Антон, а ты юзаешь Wakoopa?
если нет, то почему?

(Reply to this) (Thread)

Я попробовал и не понял
[info]lepin
2007-12-19 05:25 pm UTC (link)
Концепция монтирить использование программ и предлагать новые на основе совпадения привычек с другими пользователями - это занятно.
Но мониторить оно мониторит, а толку от этого никакого не видно. В чем смысл то, зачем?

(Reply to this) (Parent)

похожесть по википедии
[info]4el
2008-01-31 07:37 am UTC (link)
похожесть всё-таки должна быть скорее культурной, чем структурной
вариант культурной похожести:
находим статью про группу/направление в википедии и выходим по ссылкам на другие группы/направления. чем короче путь, тем сильнее похожесть.

(Reply to this)


(43 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…