Технология трехмерного распознавания лиц

Автор: Пользователь скрыл имя, 22 Ноября 2012 в 10:36, реферат

Описание работы

Технология, разработанная компанией A4Vision, принципиально отличается от других технологий автоматического распознавания лица, рассмотренных ранее в нашем журнале, (Cognitec, Viisage) тем, что работает с трехмерной моделью лица, а не двухмерным изображением (фотографией). Задача создания трехмерных моделей достаточно сложна, особенно если нужна высокая точность моделирования, и требует специального весьма дорогостоящего и громоздкого оборудования (3D-сканеры). Очевидно, что особенности рынка безопасности диктуют совсем другой подход к решению этой проблемы. Этот подход оказался нетривиальным, и чтобы понять, каким образом задача автоматического распознавания лиц была реализована разработчиками из компании A4Vision, потребуется небольшое теоретическое отступление.

Работа содержит 1 файл

Технология трехмерного распознавания лиц.docx

— 36.45 Кб (Скачать)

Технология трехмерного распознавания лиц 

 

 

              Технология, разработанная компанией  A4Vision, принципиально отличается  от других технологий автоматического  распознавания лица, рассмотренных  ранее в нашем журнале, (Cognitec, Viisage) тем, что работает с трехмерной моделью лица, а не двухмерным изображением (фотографией). Задача создания трехмерных моделей достаточно сложна, особенно если нужна высокая точность моделирования, и требует специального весьма дорогостоящего и громоздкого оборудования (3D-сканеры). Очевидно, что особенности рынка безопасности диктуют совсем другой подход к решению этой проблемы. Этот подход оказался нетривиальным, и чтобы понять, каким образом задача автоматического распознавания лиц была реализована разработчиками из компании A4Vision, потребуется небольшое теоретическое отступление. 
Система трехмерного распознавания лиц, построенная на базе технологии A4Vision, состоит из четырех компонентов: 
1) Сканер поверхности оцифровывает поверхности объектов, находящихся в поле зрения, и передает их в компьютер для дальнейшей обработки в виде трехмерных сеток. 
2) Программный модуль обработки данных восстанавливает трехмерную модель лица для распознавания. 
3) Программный модуль извлечения антропометрических особенностей лица рассчитывает по полученной модели биометрический шаблон, который в дальнейшем используется в процедуре распознавания. 
4) Программный модуль сравнения используется для сравнения полученного шаблона с зарегистрированными ранее шаблонами из базы данных. 

 

Сканер поверхности 
            Принцип построения трехмерной модели лица основан на применении активного метода измерения объектов. В отличие от пассивного метода, при котором используется пассивные элементы, то есть две или более телекамеры, активный метод подразумевает наличие активного элемента, в данном случае ИК-подсветки. Эта подсветка излучает в ближнем инфракрасном диапазоне, который невидим человеческим глазом, но фиксируется вторым пассивным элементом, то есть телекамерой. Метод структурированной подсветки основан на проецировании шаблона с известной пространственной структурой на объект. При проецировании луча изображение искажается в соответствии с геометрией объекта, при этом искажения однозначно определены формой поверхности сканируемого объекта. Искаженное объектом излучение улавливается телекамерой, и, установив соответствие между элементами начальной и искаженной структуры, можно точно восстановить геометрию сканируемого объекта методом триангуляции с очень высокой точностью. 
  
Модуль обработки данных 
          Модуль обработки данных представляет собой набор алгоритмов, предназначенных для восстановления и обработки поверхностей на основе данных, поступающих с устройства. После получения данных с устройства модуль обработки данных выполняет фильтрацию шума, затем вычисляет пространственные координаты точек поверхности, по которым восстанавливается трехмерная модель со сглаживанием и интерполяцией данных. На эту модель может быть наложена и цветная текстура лица, что может быть полезным для визуализации, но не является необходимым для автоматического распознавания лица.   
          Модуль обработки данных автоматически проверяет количественные и качественные характеристики поверхности, отклоняя случаи ошибок восстановления и плохих данных до того, как они попадут в модуль распознавания. Метод восстановления трехмерных поверхностей компании A4Vision позволяет сделать оценку качества входного видеопотока. Эта оценка производится в реальном масштабе времени, что позволяет сразу же оценивать качество получаемых поверхностей и разделять входной поток на два класса: "лицо" и "не лицо". Результатом работы этого модуля является оптимизированная трехмерная поверхность, пригодная для последующего распознавания.  

 

Модуль извлечения антропометрических особенностей лица 
            Данный модуль строит из входной поверхности биометрический шаблон, используя для этого специальный алгоритм. На первом шаге алгоритм семантического анализа поверхности лица извлекает местоположение основных антропометрических точек, наиболее устойчивых к различным типам искажений.  
            На втором шаге, когда положения различных частей лица (таких как глаза, надбровные дуги, лоб, назолабиальная зона, подбородок и пр.) известны, извлекается информация о характере локальной кривизны. Эта информация используется в дальнейшем для построения единого геометрического описания лица, далее она сжимается и сохраняется как биометрический шаблон. Результатом работы этого модуля является биометрический шаблон, уникально характеризующий человека. В дальнейшем этот шаблон используется для сравнения. 

 

Модуль сравнения 
            Работая в режиме идентификации, модуль сравнивает полученный биометрический шаблон с шаблонами, хранящимися в базе данных, и вычисляет меру подобия для каждого из них. Шаблон с максимальным коэффициентом похожести возглавляет список кандидатов. Затем для принятия решения данный коэффициент сравнивается с некоторым порогом, величина которого зависит от конкретного приложения. Если степень схожести не превышает порогового значения, персона отвергается системой, в противном случае она считается распознанной. Полученный шаблон также может быть отвергнут из-за ошибки при получении входных данных приемлемого качества, если модуль обработки данных не смог построить качественную поверхность лица. Чтобы минимизировать эту ошибку, система осуществляет быструю серию независимых снимков за определенный период (время распознавания), а модуль сравнения непрерывно решает задачу распознавания для каждого кадра до тех пор, пока шаблон не будет успешно идентифицирован или не истечет указанный промежуток времени. Шаблон будет отклонен системой, если он не был распознан за данный период.  
             Работая в режиме проверки, модуль сравнивает полученный биометрический шаблон с предварительно сохраненным шаблоном для проверяемого субъекта (данный шаблон может быть сохранен на пластиковой карточке). Далее вероятность совпадения сравнивается с пороговым значением, которое должно быть выбрано в зависимости от конкретного приложения. Если вероятность совпадения выше заданного порога, шаблон принимается системой, в противном случае отвергается.  
             Теперь вернемся из теоретической области в практическую сферу. Для получения трехмерной информации об объекте используется специальное аппаратное и программное обеспечение, при этом система от A4Vision позволяет реконструировать трехмерную форму объекта в реальном масштабе времени, и возможна визуализация построенных поверхностей. 
           Для применения в системах контроля доступа предлагается следующее оборудование: станция регистрации (A4Vision 3D Facial Enrollment Station) и считыватель (A4Vision Access Control Face Reader). 
            Станция регистрации представляет собой рассмотренный выше сканер поверхностей, подключенный к компьютеру, на котором установлено специальное программное обеспечение. Этот программно-аппаратный комплекс позволяет осуществлять ввод трехмерных моделей лица, по которым создается уникальный биометрический шаблон. Затем этот шаблон сохраняется в базе данных и используется для автоматического распознавания лица. 
             Считыватель имеет такой же сканер, но вся необходимая компьютерная "начинка" помещена в тот же корпус, который монтируется на стену. Этот считыватель предназначен для обеспечения автоматического контроля допуска в здания и помещения и может быть использован как в сетевом варианте, так и в автономном режиме. 
            Наиболее интересным и универсальным устройством является именно станция регистрации (может использоваться и как считыватель), которая является ключевым элементом и необходима в любой сфере применения для создания биометрических шаблонов, поскольку для трехмерной системы мы не можем формировать базу данных из обычных двухмерных фотографий. Что касается считывателя, то он, конечно, не столь универсален, и его сфера применения ограничивается контролем доступа. Впрочем, нам продемонстрировали и прототип нового, более компактного считывателя, который могут использовать сотрудники правоохранительных органов для проверки документов и установления личности. Разумеется, это будет возможно только после создания общей базы данных и введения биопаспортов (хотя бы в масштабе одного государства). 
             Чтобы понять, как работает система от A4Vision на практике, достаточно посмотреть, как функционирует станция регистрации. Сама процедура регистрации при небольшом опыте работы со станцией регистрации занимает меньше минуты, да и большая часть этого времени будет потрачена на ввод личной информации (имя, фамилия и т.д.). Сам же процесс распознавания лица занимает и того меньше - 2-5 секунд. Впрочем, при этом нужно учитывать, что в базе данных содержалось не более 200 трехмерных моделей, а проверить то, с какой скоростью ведется  сравнение этих моделей, и как работает система с большими базами данных, мы по понятным причинам не смогли. Здесь мы можем привести только информацию о внутреннем тестировании, которое проводилось в самой A4Vision. 
              В процессе этого тестирования была собрана база данных из 10 000 человек с равномерным половозрастным распределением от 15 до 70 лет. Данные о каждом человеке собирались не единожды, а несколько раз с промежутком в 2 месяца.  
              Каждый сеанс занимал 30-40 минут с одним человеком. За это время снималось по 15 трехмерных фильмов для каждого человека на разных расстояниях и с разными выражениями лица. Каждый фильм состоял примерно из 125 трехмерных моделей. Как заявляют разработчики, полученные данные показали, что точность и скорость распознавания превышает таковые для отпечатков пальцев. 
               Но вернемся к работе станции регистрации. Человеку достаточно посмотреть в течение нескольких секунд на небольшое зеркало, помещенное на сканере поверхностей, после чего на экране монитора можно будет наблюдать трехмерную модель лица. 
              Следует заметить, что визуализация здесь осуществляется на очень высоком уровне, так как имеется возможность выводить не только набор точек, но и строить полноценные трехмерные модели. В результате получается модель, в которой, обладая некоторой долей воображения, несложно узнать знакомое лицо. Во многом такая визуализация носит вспомогательный характер, (ведь распознавание лица ведется в автоматическом режиме), позволяя оператору быстро оценить качество трехмерной модели.  А наглядность такой модели, которая создается с субмиллиметровой точностью, служит в большей степени демонстрационным целям, и, отметим, служит очень эффективно. 
                Впрочем, как считает Дмитрий Повесьма из НПО "Информация" (компания занимается продвижением технологий от A4Vision в России), именно субмиллиметровая точность трехмерной модели является серьезным преимуществом трехмерной системы распознавания лица по сравнению с ее двухмерными аналогами, так как позволяет значительно снизить показатель FAR (False Acceptance Rate) - вероятность принять "чужого" за "своего", тогда как для двухмерных систем распознавания лиц проблема ошибочного распознавания становится очень актуальной при больших базах данных (от 1000 человек). 
               Существует и ряд ограничений при работе с системой от A4Vision. Первое из них касается дистанции от лица до сканера. Для уверенного считывания это расстояние не должно превышать 1,5 метров. Для систем контроля доступа большего расстояния и не потребуется, но для других задач, например, для незаметного сканирования лиц, максимальное расстояние считывания необходимо увеличить. Как заявляют в A4Vision, сейчас в компании ведутся работы по созданию нового сканера, который сможет работать и на больших расстояниях. Более того, такая особенность технологии, как использование невидимой глазу ИК-подсветки позволяет значительно облегчить задачу скрытого сканирования лиц. 
              Другое серьезное ограничение накладывается на угол поворота головы по отношению к сканеру. Так же как и во многих двухмерных системах распознавания лиц, этот угол не должен превышать 15 градусов, что обусловлено самой технологией. 
А вот другое "больное место" двухмерных систем распознавания лиц - влияние освещения на качество распознавания - в трехмерной системе от A4Vision полностью отсутствует. На наш взгляд, это является большим шагом вперед и уже позволяет говорить о серьезном применении этой технологии на практике и не только в системах контроля доступа. Мы проверили работу системы в затемненной комнате, и качество распознавания осталось на том же уровне, что и при ярком дневном свете. Впрочем, мы были бы удивлены, если было бы иначе, так как использование ИК-подсветки позволяет трехмерной системе от A4Vision работать даже при полном отсутствии освещения. 
               Другие проблемы, которые возникают перед двухмерными системами распознавания лица, в системе от A4Vision решаются достаточно эффективно. Сразу стоит отметить устойчивость распознавания к движениям лица, мимике и гримасам, так как использующийся для распознавания биометрический шаблон учитывает точки и области на человеческом лице, не подверженные изменениям. Есть основания полагать, что возрастные изменения тоже не окажут значительного влияния на качество распознавания лица трехмерной системой от A4Vision, но проверить это предположение сейчас невозможно: потребовались бы биометрические шаблоны хотя бы 5-летней давности. 
              Если часть лица прикрыта, например, очками или длинными волосами, то эта часть отбрасывается системой и не участвует в сравнении биометрических шаблонов. Справедливости ради, нужно отметить, что длинные волосы, закрывающие лоб, могут незначительно снизить вероятность распознавания, так как, по словам разработчиков, лоб - это очень информативная часть человеческого лица при распознавании. Вероятно, эта особенность работы системы связана с тем, что инфракрасное излучение от подсветки частично рассеивается и поглощается волосами человека, тогда как ткани лица отражают это излучение значительно лучше. 
              Серьезной проблемой многих двухмерных систем распознавания лиц является то, что их можно обмануть, предъявив обычную фотографию "нужного" человека. Причем, чем лучше алгоритм, тем вернее он сработает на предъявленную фотографию. Некоторые разработчики это даже ставят себе в заслугу, хотя очевидно, что для таких сфер применения, как контроль доступа или пограничный контроль, такая "полезная" возможность на практике оказывается серьезным недостатком. 
             Трехмерная система распознавания лиц от A4Vision оказалась лишена этого недостатка. Более того, в данной связи нам продемонстрировали один интересный эксперимент, замечательно иллюстрирующий особенности отражения инфракрасного излучения подсветки от различных материалов. В качестве объекта системе была предъявлена очень точная копия человеческого лица, трехмерная модель которого уже была занесена в базу данных. Внешне эта копия выглядела как нечто среднее между скульптурой головы и погребальной маской. В результате система показала малую вероятность соответствия между копией и биометрическим шаблоном лица, а при включении визуализации становились заметны своего рода ямы на трехмерной модели копии, которые и не позволили копии сойти за оригинал. Разработчики объяснили этот эффект тем, что от человеческой кожи инфракрасное излучение подсветки будет отражаться иначе, чем от других материалов. А поскольку система оптимизирована на распознавание именно человеческого лица, то все искажения в отраженном излучении интерпретируются как отражение именно от человеческой кожи с соответствующими для нее характеристиками отражения и рассеивания. Следует заметить, что копию лица с необходимой субмиллиметровой точностью можно изготовить, хотя и достаточно сложно, но еще сложнее будет подобрать материал для копии, который бы отражал инфракрасное излучение так же, как и лицо человека. Все это позволяет избежать случаев ложного распознавания, если злоумышленник попытается воспользоваться гримом, маской или копией лица. 
             В настоящее время компания A4Vision предлагает готовые решения для систем контроля доступа, но на этом возможности применения технологии не ограничиваются. Очень перспективным направлением остается применение технологии трехмерного распознавания лица и в национальных идентификационных системах для биометрической идентификации личности. Например, уже несколько стран включили технологию в проект национальных биопаспортов, а также ведутся консультации по возможному участию A4Vision в проекте российского биопаспорта. Как заявляют разработчики из A4Vision, для хранения трехмерной модели лица на чипе биопаспорта потребуется всего лишь 3 килобайта, что на порядок меньше, чем для хранения сжатой фотографии в формате JPEG. 
              При этом в базе данных или на чипе биопаспорта сохраняется не биометрический шаблон, а трехмерная модель лица полностью. Этот способ записи, кстати, уже включен в международный стандарт. Его преимуществом, по сравнению с сохранением биометрического шаблона, является полная совместимость с будущими версиями и потенциальными продуктами других компаний. Здесь нужно отметить, что двухмерные технологии являются не конкурирующими, а скорее дополняющими трехмерную технологию распознавания лиц. В настоящий момент в решениях от A4Vision используется как информация о форме (трехмерная модель лица), так и о текстуре лица (фотография), что нужно для сравнения с уже имеющейся базой фотографий, или фотографиями с визы или паспорта. Как ни парадоксально на первый взгляд, но сама компания A4Vision ведет переговоры об интеграции алгоритмов двухмерного распознавания в свою систему.  В результате индустрия приходит просто к оптическому распознаванию лиц, когда максимально используется вся доступная оптически информация, как геометрическая, так и текстурная. 
             Впрочем, возможно, в будущем именно трехмерная технология, разработанная в России, будет использоваться в биопаспортах для идентификации личности. Конечно, сама по себе трехмерная технология более точна для распознавания, чем ее двухмерные аналоги, но это потребует установки специального оборудования во всех учреждениях, выдающих паспорта, и закупки большого количества мобильных сканеров, хотя в этом нет ничего невозможного, ведь когда-то и фотоаппараты считались большой редкостью. 
              Существует и много других интересных сфер применения технологии от A4Vision: судебная медицина (черепно-лицевая идентификация), медицина (планирование хирургических операций), промышленное производство (репликация деталей, быстрое прототипирование, изготовление макетов, образцов) и даже археология, история и культура (сохранение культурно-исторического наследия, создание виртуальных музеев и выставок, сканирование археологических объектов и ископаемых находок для компьютерного анализа). Но эти сферы применения обусловлены в первую очередь трехмерностью технологии и не имеют отношения к индустрии безопасности, тогда как именно она является сейчас приоритетной в деятельности компании. 
              Как заявляют сами разработчики из A4Vision, современный уровень развития технологии распознавания лиц позволяет ей работать только с "хорошими парнями" ("good guy application", то есть человек должен быть заинтересован в том, чтобы его лицо было распознано системой, и от него требуется содействие, например, посмотреть в течение некоторого времени на зеркало сканера). А вот технологии распознавания лиц, которая эффективно работала бы с "плохими парнями", не разработано до сих пор ("bad guy application", то есть распознавание должно осуществляться без согласия человека и незаметно для него даже в том случае, если он не желает быть опознанным). Существуют, конечно, достаточно очевидные приемы, позволяющие вести автоматическое распознавание лиц незаметно для человека и без его согласия (установка нескольких сканеров, правильная организация прохода, размещение предметов, вынуждающих человека посмотреть в сторону сканера), но все эти приемы не везде применимы и, разумеется, не могут полностью гарантировать распознавание.  
              Остается только сожалеть, что, несмотря на проделанную работу и исследования в области биометрии, уровень развития технологии до сих пор не в состоянии даже приблизиться к решению столь сложной задачи, как поиск и распознавание лица в толпе. Но, как гласит старая английская пословица: "Честность - лучшая политика". Тем более, что преждевременные и не соответствующие действительности утверждения некоторых компаний о решении задачи распознавания лиц в толпе оказали крайне негативное воздействие на рынок систем распознавания лиц, и предстоит еще вернуть утраченное доверие потребителя, особенно такого недоверчивого, как правоохранительные и силовые структуры. 
              Впрочем, разработчики из A4Vision не теряют оптимизма и надеются, что им удастся в ближайшие годы решить и эту задачу. Как говорит Артем Юхин, директор по технологии  компании A4Vision и один из ее основателей: "Самая интересная область применения, о которой до сих пор мы только мечтаем, это "лицо в толпе". Наша система может быть использована, когда работает большое количество устройств, камер, через которые ведется наблюдение, и охватывается какое-то открытое пространство в помещении, скажем, в аэропорту, и необходимо беспрерывно следить за происходящим и определять местоположения опасных личностей, действий, ситуаций для их обнаружения, опознания и последующего реагирования… Мы работаем в этом направлении, и с использованием биометрической технологии нашей компании, трехмерной биометрической технологии, мы надеемся, что описанный мною сценарий можно будет осуществить через год-два". 
              Хотя наша редакция и не разделяет оптимизма разработчиков по поводу решения этой сложной задачи в столь краткие сроки, мы будем по возможности регулярно  информировать наших читателей о развитии технологий трехмерного распознавания лиц.


Информация о работе Технология трехмерного распознавания лиц