10 лет назад 10 мая 2009 в 4:15 58

Автор: Стэн Духанов

Уже через пять-десять лет окружающая реальность перестанет быть такой, какой мы привыкли видеть ее сегодня. Она наполнится огромным количеством дополнительной медиаинформации: от всплывающих текстовых подсказок до видеороликов и трехмерных объектов. Внешне все останется по-прежнему, но стоит посмотреть на мир через камеру любого мобильного устройства будущего, как он преобразится до неузнаваемости.

ОДЕЖДА И МОТОЦИКЛ

То, как примерно будет выглядеть расширенная реальность в конце концов, мы могли наблюдать во многих фантастических фильмах. В “Терминаторе”, например, модуль зрения киборга вовсю использовал эту технологию. Система распознает предметы окружающего мира и выдает всю информацию, которую о них знает. Не имей герой Арнольда Шварценеггера во второй части “Терминатора” такой технологии в своем арсенале, в одной из первых сцен фильма ему бы пришлось перебить добрую половину байкерского клуба, чтобы в итоге найти одежду, подходящую ему по размеру. А так пострадал всего один бедолага.
Иными словами, технология полезная. Степень развития Augmented Reality (AR, расширенной реальности) сегодня еще не достигла подобных высот, но ей тоже есть чем гордиться. Впрочем, прежде стоит рассказать о том, с чего все началось и как все развивалось.

ИСТОРИЯ РАСШИРЕНИЯ

Изначально термин AR воспринимался как альтернатива виртуальной реальности: вместо погружения пользователя в искусственное информационное окружение AR дополняет реальный мир разными формами визуальной информации. Может показаться, что это требует огромных вычислительных мощностей и усилий. Это действительно так, однако история технологии началась гораздо раньше, чем наступила эпоха полупроводников и суперкомпьютеров.
Первым исследователем дополненной реальности стал Иван Сазерленд, который построил прототип AR-системы в 1967 году. Конструкция была настолько тяжела, что крепилась к потолку прочным тросом – нести ее на себе обычному человеку было не под силу. Название у изобретения было соответствующее – Sword of Damocles, “Дамоклов меч”. Для показа трехмерной графики в разработке использовались стереоочки. Изображение в них проецировалось на два полупрозрачных стеклянных дисплея с серебряным напылением. Эта же технология стала родоначальницей еще одного понятия, неразрывно связанного с технологией дополненной реальности – Head-Mounted Display, или носимый дисплей. Эта система была использована в 1968 году в проекте для Bell Helicopter Company. В нем стереоочки работали в паре с инфракрасной камерой, находящейся под днищем вертолета. Камера управлялась движением головы пилота. Работу потомка этой технологии можно было наблюдать в фильме про чудо-вертолет “Голубой гром”.
В следующий раз дополненная реальность напомнила о себе в 90-х. Тогда же технология обрела ее сегодняшнее название. Термин придумали сотрудники авиакомпании “Боинг” Дэвид Майзелл и Том Коделл. В 1990 году руководство компании поставило перед ними задачу: предложить простой способ прокладки кабелей при сборке пассажирских самолетов. “Boeing 747 – вовсе не самолет, а летящая стая из пяти миллионов деталей”, – шутили Коделл и Майзелл спустя два года в статье о найденном ими решении. Действительно, современный пассажирский самолет буквально напичкан кабелями – их там около тысячи. Чтобы не ошибиться при строительстве воздушного судна, сборщикам постоянно приходится сверяться с чертежами, что никак не способствует скорости и удобству процесса сборки. Коделл и Майзелл предложили вооружить сборщиков полупрозрачными наголовными дисплеями, на которых отображалось бы, куда именно нужно прикрепить тот или иной кабель.
Статья исследователей вышла в январе 1992 года – именно тогда родился термин Augmented Reality. Идея поразила широкую общественность – примерно в то же время вышел роман Уильяма Гибсона “Виртуальный свет”, действие которого закручивалось как раз вокруг очков дополненной реальности, однако руководство Boeing общих восторгов не разделило и не стало внедрять перспективную технологию в производство.
Причины так поступить у менеджеров Boeing были. До сих пор нет достаточно эргономичных наголовных дисплеев, которые можно было бы долго носить перед глазами – даже современный уровень технологий приводит к очень скорому утомлению органов зрения. Затея с внедрением дополненной реальности в сборочных доках Boeing, скорее всего, провалилась бы.
Опосредованные доказательства тому появились уже в 2000-х, когда немецкая компания Metaio попыталась внедрить промышленные системы расширенной реальности на нескольких европейских автозаводах с помощью наголовных дисплеев для заводских специалистов. В проекте были использованы особые дорогостоящие дисплеи, которые с помощью лазера проецировали изображение прямо на сетчатку. Это снизило утомляемость глаз, но подобные дисплеи не в состоянии обеспечить минимально необходимую точность трекинга, а кроме того, из-за малой распространенности и высокой стоимости эксплуатацию этого оборудования нельзя было назвать удобной. Иными словами, специальные наголовные дисплеи влетали в копеечку. Можно представить, во что бы обошлось Boeing внедрение подобной технологии в середине девяностых.
Между тем неудача с наголовными дисплеями подтолкнула инженеров и программистов из Metaio к другой идее: что если дополненную реальность удастся реализовать не на специализированном, а на простом и общедоступном железе? Веб-камера, мобильный телефон, любое другое устройство, оснащенное видеокамерой и операционной системой, на которую можно установить необходимое программное обеспечение. Именно концепция “волшебной линзы” – устройства, при взгляде через призму которого реальность дополняется новой информацией – та самая идея, на которую ориентируется большинство разработчиков AR-систем сегодня.

МНОГООБРАЗИЕ ВИДОВ

Один из самых известных исследователей дополненной реальности сегодня – Рональд Азума из HRL Laboratories, который в 1997 году опубликовал большую обзорную статью “Исследование дополненной реальности”. В ней он впервые очертил возможности технологии и проблемы, связанные с ее внедрением. Азума четко определяет AR как систему, которая совмещает виртуальное и реальное, то есть работает в реальном времени и в трехмерном пространстве.
Другой исследователь дополненной реальности Герман Бенес пишет: “Дополненная реальность – это инструмент, который позволяет наблюдателям расширить свое поле зрения с помощью виртуальных элементов, созданных компьютером”. Следом он выводит пять правил, при соблюдении которых продукты дополненной реальности могут быть приняты обществом и бизнесом. Согласно Бенесу, система дополненной реальности должна обеспечивать: полную интерактивность в реальном времени, точное и быстрое отслеживание, возможность использования стереоскопии, сверхпортативность и беспроводность, а также ощущение “полного погружения”.
На сегодняшний день системы, полностью отвечающей всем перечисленным требованиям, не существует. Каждая разработка может отвечать одному или нескольким из них, но не всем сразу. Причем дело тут не столько в несовершенстве технологий, сколько в отсутствии необходимости соответствовать какому-то из правил.
Человеку, желающему просто узнать, что за памятник архитектуры стоит перед ним, совсем не обязательно ощущать эффект полного погружения. А пилоту истребителя, в котором дополненная реальность помогает отслеживать и определять тип цели, некритична сверхкомпактность. Разновидности технологии сами по себе разнятся в зависимости от области их применения.
Основной принцип любой AR-системы – обработка специальным софтом видеопотока в реальном времени. Другое дело – принцип, по которому виртуальное совмещается с реальным. Самой распространенной и самой простой с технической точки зрения системой является система двухмерных маркеров – черно-белых графических изображений, которые она в состоянии распознать с помощью обычной камеры. “Увидев” маркер, система размещает на его месте трехмерный объект, надпись или другое изображение – все зависит от того, с информацией какого рода соотнесен данный конкретный маркер. Подобная система также в состоянии понять, когда положение маркера в пространстве меняется, и, соответственно, поменять расположение трехмерного объекта.
Этот вид дополненной реальности на сегодняшний день является самым доступным для массового пользователя, хотя и не абсолютно. В том смысле, что таким образом в домашних условиях реальность можно дополнить, только будучи подкованным в программировании – библиотеки для создания простых AR-систем выложены в Сети в свободном доступе. Самая известная из них – ARTools.
Другой вид расширенной реальности более сложен в техническом плане, поскольку в нем не используются маркеры. Вместо них – GPS-модуль, встроенный гироскоп и (или) электронный компас. С помощью спутника система определяет местоположение пользователя на карте, а с помощью гироскопа и компаса – положение устройства в пространстве и сторону, в которую повернут объектив его камеры. Проанализировав эти данные, система подкладывает под изображение на дисплее камеры виртуальную карту и таким образом распознает объект, на который направлен объектив камеры.
Третий вид системы самый высокотехнологичный и сложный. Он потенциально превосходит два предыдущих, поскольку не использует ни маркеры, ни какие-либо дополнительные датчики. Вместо этого система напрямую распознает предметы, попавшие в кадр, выделяя их из общей картины и сверяя с базой данных на сервере. Так же, как у Терминатора, когда тот искал себе одежду нужного размера.
Пока самое крупное достижение в этой сфере – набор инструментов для создания программного обеспечения дополненной реальности, который представила в конце зимы компания Microsoft. Речи о создании некоего коммерческого продукта в ближайшем будущем пока не идет, но представители софтверного гиганта пообещали использовать некоторые из элементов новой разработки в грядущих версиях уже существующих программных решений.
Пока каждый из трех описанных выше разновидностей дополненной реальности далек от совершенства. Первый вид требует наличия искусственных маркеров, что делает весьма проблематичным процесс конвертирования окружающего мира в формат, понятный компьютеру: маркер нужно присвоить каждому предмету, от коллекционной фотографии Rolling Stones до горы Фудзи. Второй способ беспомощен в помещении из-за технических ограничений GPS. Третий, во-первых, слишком молод для полномасштабного внедрения, а во-вторых, как и первый, имеет проблемы с индексацией окружающего мира: создать базу обложек дисков, книг и кинопостеров не так уж сложно, но вот как быть с миллионами примечательных мест и объектов, существующих на нашей планете? Это проблема, которую разработчикам дополненной реальности еще предстоит решить.
Впрочем, невзирая на трудности, с которыми сталкивается Augmented Reality, эта технология находит все новые и новые области применения.

ДОПОЛНЕНИЕ К МУЗЕЮ

Unifeye Mobile – одна из первых программ дополненной реальности для мобильных устройств. Она была выпущена компанией Metaio в прошлом году в качестве экспериментальной демонстрации потенциала технологии. Стоит запустить приложение, включить камеру устройства и навести ее на соответствующий маркер на рекламной полосе в журнале (если маркер там имеется, конечно), как на экране возникнет трехмерное изображение рекламируемого предмета. На современных мобильниках при изменении угла обзора трехмерное изображение вращается с сильными тормозами – производительности телефона не хватает. Однако еще десяток лет назад, чтобы проделать такое волшебство, нужны были вычислительные мощности не самого бюджетного настольного компьютера, а теперь с этой задачей справляются смартфоны. Учитывая, что вычислительные мощности последних растут очень быстро, в скором времени запуск и нормальное функционирование подобных предложений на мобильных устройствах перестанет быть проблемной темой.
Metaio использовала похожую технологию и в более практичном ключе. В совместной акции с японским музейно-выставочным центром DNP-Louvre Museum Lab компания предложила пользователям прогуляться по экспозиции без экскурсовода, но с небольшим планшетным компьютером в руках. На оборотной стороне компьютера расположена камера, которая транслировала изображение на экран. Посетители видели в нем виртуального экскурсовода, который показывал, в каком направлении нужно двигаться, чтобы продолжить осмотр экспозиции, а также рассказывал о каждом экспонате познавательные истории. Кроме этого при наведении камеры на какой-либо экспонат на экране появлялось его трехмерное анимированное изображение. Так, если экспонатом являлись осколки древней тарелки, то на экране компьютера можно было увидеть, как тарелка выглядела, когда еще была целой. Очевидно, что в научно-просветительских целях AR имеет небывалые преимущества в сравнении с любой другой существующей выставочной технологией.
Концепция, реализованная в DNP-Louvre Museum Lab, не нова. Нечто подобное описал в своей статье “Мир через компьютер” исследователь из компьютерной лаборатории Sony Дзюн Рекимото в 1994 году. Статья была посвящена разработке под названием Navicam. Внешне устройство было похоже на планшетники, использованные в DNP-Louvre Museum Lab, правда, в Navicam пользователь носил с собой не компьютер, а всего лишь ЖК-монитор, оснащенный камерой и соединенный с компьютером кабелем. В остальном принцип действия технологии был идентичным. Программное обеспечение Navicam выискивало на получаемом изображении цветные маркеры и после обнаружения размещало рядом с ними окно с информацией, соответствовавшей маркерам.

ВИРТУАЛЬНЫЙ НАВИГАТОР

В 1991 году бывший сотрудник лаборатории Xerox PARC Джон Элленби отправился в путешествие. Вместе со своим сыном он плыл на яхте вдоль берегов Мексики. Чтобы не сбиться с пути, они проверяли свои координаты по видимым объектам на берегу. Тогда-то в голову ученого и пришла мысль о том, что если бы бинокль совмещал в себе показания электронного компаса и устройства позиционирования, морскую навигацию можно было бы осуществлять гораздо легче.
В итоге Элленби разработал сервис для мобильных устройств, оборудованных GPS-навигатором и электронным компасом – Geovector. Он не сделал морскую навигацию проще и удобнее, но зато с помощью этого сервиса можно легко отыскать, где поблизости находится ресторан, кафе, кинотеатр или гостиница, а стрелка укажет, в какую сторону нужно двигаться, чтобы добраться до ближайшего к пользователю объекта.
Geovector – не совсем сервис дополненной реальности, поскольку не совмещает живое видео с виртуальной информацией, но назначение у него в данном контексте правильное – сообщать о реальности вокруг пользователя полезную информацию. Работает сервис только в Японии. Там мобильники с GPS-навигатором, компасом или гироскопом – обычное дело (в отличие от большинства других стран мира).
Впрочем, эта ситуация вот-вот переменится: GPS-навигаторы и гироскопы сегодня встраиваются уже не в самые дорогие модели мобильников, а в скором времени они, вместе с мощной 3D-графикой, придут и в бюджетные линейки аппаратов.
Прибытие мобильной дополненной реальности на европейский и американский континенты уже фактически состоялось – в виде приложения Enkin, написанного двумя программистами Максом Брауном и Рафаэлем Шпрингом для операционной системы Google Android. Enkin умеет все то же, что и Geovector, но делает он это, оперируя не только данными с датчиков и из интернета, но и видео с камеры телефона. Приложение разрабатывалось в рамках конкурса на самую инновационную программу для новой ОС, который проводила компания Google.
Авторы Enkin решили написать это приложение, после того как с огромным трудом смогли отыскать клуб, в котором проходил концерт их любимой рок-группы в Японии, где у большинства улиц нет названий, а есть только номера. После первого этапа конкурса Enkin не оказалось в числе прошедших отборочный тур, но, по словам самих создателей, с ними все-таки связались представители Google, и теперь разработка революционного приложения движется полным ходом. Революционного потому, что Enkin имеет все шансы стать первым полноценным пользовательским AR-приложением для мобильных устройств. Даже в тестовой версии возможности программы поражают. Памятники архитектуры, клубы, рестораны, вокзалы и аэропорты, улицы и площади – что бы ни попадало в видоискатель камеры устройства, на котором тестировалась бета-версия программы, Enkin на все дает развернутые туристические комментарии в виде всплывающих окон с текстом. При этом ориентируется программа на показания GPS-датчика и гироскопа, чтобы выяснить координаты и сторону, в которую направлена камера устройства. Как уже было сказано выше, область применения такой системы ограничена открытыми пространствами, но под Android уже написано приложение, способное дополнить собой Enkin в помещениях.
AndroidScan воспринимает машиночитаемые коды в качестве гиперссылок, которые ведут к информации об объекте. Достаточно снять штрихкод, имеющийся на любом продукте, и приложение выяснит, какому товару он соответствует и где в Сети можно получить о нем информацию. Одна из главных замечательных особенностей приложения в том, что ему не нужны нестандартные маркеры – хватит и тех кодов, что уже существуют, а значит, не нужно будет проводить дорогостоящее внедрение новой маркировки.
Справедливости ради стоит отметить, что в 2006 году, за два года до появления Enkin, в исследовательской лаборатории Nokia разрабатывался проект под названием MARA, который умел практически все то же, что умеет приложение под Android. Но на тот момент даже в линейке самой Nokia не было модели телефона, которая технически могла бы обеспечить работу приложения дополненной реальности, поэтому разработка имела чисто научный характер. Ее успешно провели и закрыли. Пока вестей о переносе MARA на производственные рельсы из стана Nokia не приходило.
Несмотря на то что многое из вышеописанного – уже объективная реальность, большинство продуктов дополненной реальности пока находятся на пороге массового внедрения. Есть всего пара сфер, в которых AR-технологии уже чувствуют себя уверенно.

ВИРТУАЛЬНЫЙ БЕЙСБОЛИСТ

Одна из американских компаний, занимающаяся производством карточек с фотографиями бейсболистов, в начале марта вышла на рынок с принципиально новым продуктом. С виду это те же карточки с теми же бейсболистами, но стоит зайти на сайт компании, включить веб-камеру и показать ей карточку, как на карте появляется трехмерная анимированная модель игрока. Примечательно, что бейсболистом можно не только любоваться со всех сторон, но и играть с ним. Карта кладется на горизонтальную поверхность – и спортсмен смело ступает за ее пределы, чтобы поиграть с пользователем. На момент написания этой статьи было доступно три игры: в первой предлагается отбивать мяч битой, нажав кнопку в нужный момент; во второй – точно попасть мячом в движущуюся мишень; в третьей – передвигать бейсболиста по полю таким образом, чтобы он сумел поймать падающие сверху мячи.
На сегодняшний день трехмерные бейсболисты – пожалуй, единственный пример полноценной практической реализации системы дополненной реальности, которая может стать доступной каждому и которая интересна с коммерческой точки зрения, поскольку в состоянии дать пользователю совершенно новый игровой опыт.
У профессионалов, впрочем, тоже имеется новинка. В конце марта немецкий Институт прикладных информационных технологий Фраунхофера представил первую подводную систему дополненной реальности. Она состоит из рюкзака с небольшим компьютером и носимого дисплея. Данная разработка в состоянии превратить даже самый скучный бассейн в пестрящий разноцветными водорослями, рыбками и кораллами риф, или нутро затонувшего корабля, или участок подводного нефтепровода – в зависимости от пожеланий заказчика, который, как предполагается, будет использовать эту систему для обучения аквалангистов работе в самых разных условиях.
На этом проникновение технологии дополненной реальности в нашу повседневную жизнь пока заканчивается. Ряд проблем, связанных со слишком большим количеством разнообразных разработок, малой распространенностью устройств с необходимыми возможностями, а также отсутствием единой информационной базы и поисковой системы, из которых AR-приложения могли бы черпать информацию, тормозят развитие технологии. Однако не нужно быть аналитиком или большим AR-специалистом, чтобы понять, что решение большинства этих проблем – дело не столько принципиально новых технологий, сколько относительно небольшого времени. Все необходимые инструменты уже созданы, осталось только довести их до ума и собрать в одну огромную и слаженно работающую систему. Как только это произойдет, окружающая нас реальность сможет сказать о себе гораздо больше, чем кажется на первый взгляд.