Не так давно Microsoft сначала анонсировала, а затем и выпустила (в качестве technology preview) довольно красивую "игрушку" под названием 'Photosynth'.
Это технология, позволяющая организовать коллекцию фотографий в виде (почти) трехмерного окружения с удобной навигацией между фото. То есть просмотр набора фотографии одной и той же сцены (например - Московского Кремля) будет выглядеть почти как реальная прогулка по трехмерному "настоящему" Кремлю с разглядыванием всех достопримечательностей.
Для большей понятности лучше посмотреть демонстрационные видео или попробовать саму живую демонстрацию.
Будучи специалистом в области машинного зрения и анализа изображений мне стало интересно - а как это может быть устроено?
Что внутри?
Во-первых нужно сказать, что Photosynth вырос из совместной работы одного из американских университетов и Microsoft под названием "Photo Tourism" и разработок компании Seadragon по быстрому увеличению/уменьшения снимков. Кстати, на сайте университета, посвященном PhotoTourism - http://phototour.cs.washington.edu/ есть java-демо раннего варианта этой технологии, еще не такого удобного, как PhotoSynth. Этот вариант работает, разумеется, не только под IE. Есть и видео на YouTube c рассказом для тех, кому недосуг запускать и испытывать демо.
Из внутреннего устройства меня в основном интересовала часть отвечающая за реконструкцию и сопоставление фотографий. Судя по статье на SIGGRAPH 2006, устроено это так:
В результате получается разреженное (но довольно обширное) облако 3D точек, информация о положениях камер (регистрация фотографий) плюс знания о том на какой фотографии какие точки видны. Этого достаточно для "псевдотрехмерной" навигации между наборами фотографий.
Впечатления
После работы с Photosynth остается приятное впечатление. Весьма интересная штука! Непонятно насколько в действительности удобно, пока оценить сложно - но вообще весьма любопытно.
Понятно, что свои коллекции так организовывать у меня вряд ли получилось бы. Я снимаю обычно не так много фотографий, и к тому же они все обычно бываются довольно разрозненны (в плане мест съемки). А фотографировать все дорожки и улицы, по которым я хожу на отдыхе, чтобы потом это связать в единую сцену - это уж слишком.
Но если использовать фотографии многих и многих людей (что, по-моему, авторы и хотят предложить) можно составить большие протяженные сцены (чуть ли ни целые города в перспективе), куда уже потом вполне можно будет "вставлять" свои пару десятков фотографий, если захочется. И можно будет потом "побродить" по городу, и с удовольствием найти себя в своих любимых местах посещения.
Что говорят люди
На одном российском сайте новостей даже разгорелась небольшая дискуссия (в комментариях к статье) по поводу этой технологии. В большинстве своем люди выражали скепсис по поводу внедрения Photosynth в жизнь.
Собственное мнение
Выглядит многообещающе, и вполне реально. Ни в каких подтасовках я MS не подозреваю - не того масштаба люди это делали. Что имеет место - это использование удачных сцен для демонстрации (но ничего зазорного в этом нет, во-первых в каждой статье подбираются примеры чтобы наиболее выпукло продемонстрировать достоинства новой идеи, а во-вторых это ведь всего лишь первый шаг и смешно было бы требовать чтобы заработало сразу и везде).
Под "удачными сценами" я понимаю сцены, где есть много достаточно уникальных объектов (элементы статуй, резьба по камню на домах, различные архитектурные украшения и т.д.) за которые SIFT могут хорошо "зацепиться". В современных городах, где много однотипных домов, а на самом доме все окна практически одинаковы, работать может гораздо хуже (о чем авторы честно предупреждают). Это мое основное опасение. SIFT - инструмент мощный, но безусловно не всесильный... Кстати, на фотографиях с большим количеством растительности также могут возникать аналогичные проблемы.
Так что мое мнение - скорее всего это все-таки сделают. Но по-моему - не раньше чем через год-два.