Содержание
Алгоритм распознавания лиц [Название_Компании] признан лучшим в мире / Хабр
Возможно, время от времени вам попадались новости с заголовком, похожим на этот. (Если нет, то вот несколько примеров: первый, второй.)
«Первое место в мире» — звучит круто! Но одновременно с этим возникает много вопросов. Кто участвует? Как участники соревнуются? А кто распределяет места?
Мы хотим познакомить вас с самым авторитетным на сегодняшний день «чемпионатом мира» по распознаванию лиц, NIST Face Recognition Vendor Test (FRVT) — что он из себя представляет, для чего создан, как проходит соревнование и главное, насколько он действительно важен для разработчиков и бизнеса.
Что такое NIST?
Национальный институт стандартов и технологий (National Institute of Standards and Technology, NIST) был основан Конгрессом в 1901 году для обеспечения промышленной конкурентоспособности страны по сравнению с ведущими в те годы экономиками — в первую очередь, Германией и Великобританией; и с тех самых пор он является главным государственным органом США по метрологии и стандартизации. Такой, проще говоря, американский аналог нашего Росстандарта, который издаёт американские «госты».
Здесь иной читатель скажет: при чём тут распознавание лиц? где, простите, «госты» и где инновации, какая вообще связь? А связь самая прямая. Когда в нашу жизнь врывается какая-то новая технология, первое, что должны понять её разработчики и пользователи — как эту технологий «померить». Какие исчисляемые показатели можно предложить, чтобы, анализируя их и сопоставляя с какими-то целевыми значениями, делать вывод о состоятельности технологии и целесообразности её применения? И органу по стандартизации здесь самое место — и в части выбора таких показателей, и в части разработки и утверждения безусловно приемлемой для всех заинтересованных сторон методики их измерения.
Измерениями и стандартизацией в области биометрии — технологий распознавания человека по его физическим или поведенческих характеристикам — NIST занимается очень давно. Сфера его интересов охватывает все практически применимые модальности: отпечатки пальцев и радужную оболочку глаза, анализ речи и идентификацию человека по голосу. Первые серьёзные исследования в области распознавания лица человека начались в 2003 году (стимулом к их проведению послужили трагические события 11 сентября), а с 17 февраля 2017 года институт запустил FRVT в качестве регулярно возобновляемого соревнования среди разработчиков технологии. С тех пор в общей сложности протестировали 662 алгоритма, представленные 248 компаниями.
Как организовано тестирование
Соревнование состоит из нескольких треков (позже мы обсудим их подробнее), каждый из которых представляет свой сценарий тестирования. Чтобы принять участие, любой желающий разработчик может отправить свой алгоритм организаторам, и через какое-то время его результаты появятся на сайте. Тест — по крайней мере, на сегодняшний день — проводится регулярно и бессрочно, но обновить алгоритм можно не чаще чем раз в четыре месяца. Участие бесплатное.
Алгоритм должен реализовывать программный интерфейс (API) испытательного стенда, его спецификация описана в документации для каждого конкретного трека. Для удобства организаторы уже реализовали соответствующий шаблон в своем репозитории — участникам нужно только заменить модели на свои собственные, собрать посылку (бинарный файл динамической библиотеки) зашифровать её и отправить. Исходный код алгоритма, вопреки расхожему заблуждению, передавать не нужно. Тестирование проводится на CPU — графические ускорители NIST не поддерживает.
В ходе испытаний замеряют операционные характеристики, иллюстрирующие точность и скорость работы алгоритмов, а также некоторые дополнительные метрики (например, размер вектора признаков в байтах). Все эти сведения для всех протестированных алгоритмов включаются в очередной отчёт, который публикуется на сайте NIST примерно раз в месяц.
Кто участвует в тесте
Количество участников FRVT растет год от года. Если подсчитать всех, кто хоть раз отправлял свой алгоритм в трек FRVT 1:1 Verification с 2020 года, получится такое распределение (в скобках — число участников):
Более половины участников представляют пять стран: Китай, США, Южную Корею, Тайвань и Россию. Если же обратиться к таблице с результатами, то верхние позиции преимущественно занимают организации из России, Китая, США, Южной Кореи и Японии.
Среди участников есть как крупные корпорации, такие как Intel, Samsung или Tencent, так и учебные заведения: МГУ и ИТМО. Здесь есть как компании, специализирующиеся на видеоаналитике, так и те, для которых это направление не является основным — например, банки.
Датасеты и домены
Важным фактором, влияющим на качество работы алгоритма распознавания — это условия, в которых он применяется. Для тестирования алгоритмов NIST использует собственные массивы данных, доступа к которым у участников нет. О датасетах известно немного: описание доменов и пара примеров на каждый из них.
Одна большая часть изображений связана с иммиграционным контролем — как правило, это достаточно качественные фронтальные портретные изображения, которые делятся на следующие домены в зависимости от способа получения изображений:
Visa (Application) — фронтальные портретные снимки, собранные в иммиграционных офисах, на белом фоне, с использованием специального оборудования для захвата и освещения. Размер фотографий примерно 300×300 пикселей. Всего таких изображений 1,6 миллиона, по одному на человека.
Border (Immigration Lane) — фотографии, сделанные сотрудниками миграционной службы в кооперативном режиме (при взаимодействии с объектом съёмки). Возможны небольшие повороты головы, иногда встречается фоновая засветка и искажение перспективы из-за съемки с близкого расстояния. Количество таких изображений — порядка миллиона.
Kiosk — фотографии, собранные при взаимодействии мигранта с автоматическим киоском. Камера расположена над дисплеем киоска, поэтому для этих изображений характерен наклон головы вперёд, иногда значительный (45° и более).
Вторая — самая значительная по объёму — часть изображений связана с деятельностью правоохранительных органов. В ней представлены три подмножества:
Webcam — изображения, собранные с помощью недорогой веб-камеры, имеют размер 240×240 пикселей. Как видно на иллюстрации, встречаются отклонения от фронтального ракурса, низкая контрастность и плохое пространственное разрешение.
Последний, самый сложный домен, представленный в FRVT — Wild. Он включает множество изображений, полученных при репортажной съёмке (в некооперативном режиме). Разрешение варьируется в очень широких пределах, изображения очень непринужденные, с широкими вариациями положения головы, лица могут быть частично перекрыты, например волосами или руками.
Треки
Мы уже упоминали, что NIST FRVT состоит из нескольких треков. Нас интересуют два из них, FRVT 1:1 Verification и FRVT 1:N Identification, непосредственно связанные с распознаванием лиц.
Здесь мы хотим отослать читателя к одной из наших предыдущих статей, где мы рассказывали об основах распознавания лиц:
верификация (она же сопоставление 1:1) представляет собой сравнение двух образцов для исследования их принадлежности одному и тому же человеку. Верификация, в частности, выполняется, когда вы пытаетесь разблокировать смартфон при помощи изображения лица — здесь биометрическая система отвечает на вопрос, достаточна ли высока её уверенность в том, что предъявленное изображение принадлежит владельцу устройства;
идентификация (она же поиск, она же сопоставление 1:N) подразумевает отбор из некоторого множества образцов-кандидатов тех, что предположительно принадлежат тому же человеку, что и представленный системе искомый образец. В качестве примера можно предложить систему контроля доступа, которая отпирает магнитный замок, когда «видит» на камере знакомое лицо.
Оба трека исчисляют для каждого алгоритма одну и ту же метрику качества, FNMR@FMR= (она же FNIR@FPIR=, она же 1 — TMR@FMR=).
Верификация
Сценарий тестирования верификации выглядит следующим образом: из тестового датасета составляется большое количество пар картинок. Какие-то пары будут «позитивными» (включают два изображения одного и того же человека), какие-то — «негативными» (изображения принадлежат разным людям), причем программа испытательного стенда точно знает, где какая пара. Все эти пары сопоставляются тестируемым алгоритмом, который возвращает соответствующие степени схожести.
Полученные результат можно проиллюстрировать примерно следующим образом (зелёные галочки отмечают позитивные пары, а красные крестики — негативные, сами алгоритмы при этом ничего не знают о позитивности или негативности):
Одна и та же картинка может участвовать в нескольких парах. Если тестовый датасет невелик, можно сформировать вообще все возможные пары, а на больших датасетах стандарты предписывают, чтобы на каждую позитивную пару предлагалось не менее 30 негативных пар.
На полученном примере посчитаем FNMR@FMR=0,1. Сначала выберем значение степени схожести, при котором FMR=0,1, то есть такое значение, при котором 10% всех негативных пар алгоритм ошибочно принимает за позитивные. Отсортируем по возрастанию степени схожести, исчисленные для негативных пар:
0,24 0,32 0,33 0,42 0,48 0,49 0,51 0,57 0,61 0,69
Так как в этом примере мы сопоставляли всего 10 негативных пар, порог должен быть таким, чтобы алгоритм счёл позитивной только одну из них — он должен быть меньше 0,69, но больше 0,61.
Оценим, каково будет отношение FNMR — то есть, какую долю позитивных пар алгоритм ошибочно признает негативными — при значении порога 0,61. Отсортируем по возрастанию значения степени схожести, исчисленные для позитивных пар:
0,59 0,72 0,84 0,86
Видно, что установив порог в 0,61, из четырёх сопоставленных позитивных пар алгоритм пропустит одну — ту, для которой получена степени схожести 0,59. Значит, FNMR@FMR=0,1 = 0,25.
(Более подробно об оценке алгоритмов распознавания мы рассказывали в этой статье.)
При тестировании верификации NIST составляет пары из изображений одного датасета или смешивает картинки разных датасетов — например, в тесте VISABORDER изображения датасета Visa сопоставляются датасетом Border. Есть и дополнительный трек, FRVT Face Mask Effects, в котором изучается, насколько хорошо алгоритмы справляются с медицинскими масками. Чтобы избежать дорогостоящего сбора дополнительных данных, однотонную маску искусственно подрисовывают:
Идентификация
Сценарий тестирования второго трека, FRVT 1:N, подразумевает, что накоплена база с изображениями лиц (может быть, достаточно большая) и есть некоторый набор фотографий. Про каждую из них нужно выяснить, есть ли в базе изображение этого человека или нет. Как и в случае с верификацией, какие-то поиски будут позитивными, когда априори известно, что фото этого человека есть в базе, какие-то — негативными.
Проиллюстрируем поиск такой схемой и попробуем по ней вычислить метрику FNIR@FPIR=0,5 (false negative identification rate, при условии что false positive identification rate равен 0,5):
Как и ранее, сначала необходимо найти порог схожести, при котором FPIR = 0,5. Негативных поисков здесь всего два, чтобы один из них мы ошибочно сочли позитивным, порог схожести должен быть равен 0,45. Организаторы FRVT предлагают два варианта подсчета метрики: Identification (T>0) и Investigation (R=1, T=0).
При Identification (T>0) важно, чтобы у положительных поисков схожесть с правильной картинкой была выше порога, и не важно, если в базе найдется какая-то другая картинка с ещё большей схожестью. В этом случае, оба положительных поиска будут успешными, так как 0,65 > 0,45 и 0,8 > 0,45. Следовательно, FNIR@FPIR=0,5 = 0.
При Investigation (R=1, T=0) порог для положительных поисков не важен, но правильная картинка из базы должна давать самую высокую схожесть. Здесь самый нижний поиск на картинке будет неудачным, так как 0,65 < 0,75. Следовательно, FNIR@FPIR=0,5 = 0,5.
Ещё один интересный трек — FRVT Paperless Travel. Его идея заключается в том, чтобы протестировать возможность пересадки при транзитном авиарейсе без использования бумажных документов, только по биометрическим данным.
В этом сценарии составляется 567 групп, по 420 человек в каждой (примерное число пассажиров рейса). Чтобы симулировать реальный перелет, группы формируются с учетом географии, то есть в одну группу попадают люди из одного региона. При прилете в страну транзита делается входное фото пассажира, которое сразу же попадает в базу пассажиров, вылетающих транзитным рейсом из страны. При посадке на вылетающий рейс делается еще одно, выходное фото пассажира, которое сверяется с базой входных лиц, и если путешественник найден в базе, он допускается на борт.
Дополнительные показатели
Метрики производительности
Помимо метрик качества NIST также предоставляет некоторую информацию о параметрах модели. Для этого нужно перейти во вкладку “Resources” на странице трека:
Например, в треке FRVT 1:1 могут быть интересны следующие показатели:
А. Размер вектора признаков модели в байтах — позволяет грубо оценить вычислительные ресурсы, требуемые для обработки поискового массива.
В. Время построения вектора признаков из картинки в миллисекундах. В это время входит весь пайплайн, от детектора лиц до отработки модели. Замеры, напомним, выполняются на CPU. Следует отметить, что в данном треке есть ограничение на этот показатель — он не должен превышать 1500 миллисекунд.
С. Время подсчета схожести между двумя векторами признаков в наносекундах.
Похожие показатели можно найти и для трека FRVT 1:N:
D. Время построения вектора признаков из картинки в миллисекундах. В этом треке более жёсткие ограничения: не выше 1000 миллисекунд.
Е. Время поиска по базе в миллисекундах. Здесь N означает размер базы, а L — ранг идентификации (какое количество кандидатов следует вернуть).
Сами по себе приведенные в этих таблицах цифры, возможно, представляют не самый большой интерес для конечного пользователя, так как условия реального применения алгоритма могут довольно сильно отличаться от тестовых.
Графики и диаграммы
По итогам каждой очередной итерации тестирования NIST публикует объёмный отчёт — несколько сотен страниц с графиками, иллюстрациями и подробными разъяснениями. Среди прочего, он позволяет выяснить, как разные алгоритмы ведут себя при сопоставлении лиц разного пола, возраста, этнической принадлежности. Мы изучим соответствующие графики на примере трёх алгоритмов: ntechlab_011 (один из лидеров NIST), canon_003 (алгоритм из top25) и cyberlink_006 (алгоритм из top50) — при этом мы не ставим себе задачу сравнивать эти алгоритмы между собой.
Вот, например, как разные алгоритмы ведут себя при работе с лицами, отнесёнными к разным когортам: белые мужчины, белые женщины, темнокожие мужчины и темнокожие женщины. Для каждой когорты показана зависимость ошибки второго рода (когда алгоритм ошибочно принимает двух разных людей за одного человека) от порога схожести, на основе которого принято решение (если исчисленная при сопоставлении схожесть выше порога, это один и тот же человек, если ниже — разные):
Поведение моделей может также значительно варьироваться в зависимости от других критериев. На следующих диаграммах зеленая и красная точки показывают пороги для FMR=0,001 и FMR=0,0001 соответственно при работе с лицами разной этнической принадлежности:
…разного возраста (обратите внимание, то самую большую сложность представляют маленькие дети):
Наконец, интересно также изучить, насколько хорошо алгоритмы справляются с возрастными изменениями — когда сопоставляются снимки, сделанные с определённой разницей во времени (дополнительно можно посмотреть результаты в разрезе пола и цвета кожи). На следующей диаграмме порог для каждого алгоритма зафиксирован для FMR=0,0001 на общей совокупности негативных пар:
В чём практическая польза
Давайте поразмышляем, какую практическую пользу можно извлечь из наблюдения за соревнованием NIST FRVT.
Если вы просто интересуетесь распознаванием лиц
Даже у простого обывателя, который никак не связан с разработкой алгоритмов и не собирается внедрять решения на основе лицевой биометрии, так или иначе могут возникать вопросы: насколько хорошо сегодня работает распознавание лиц? насколько ему можно доверять? — ведь технология уже прочно вошла в нашу повседневную жизнь. Возможно, уже завтра мы будем проходить контроль в аэропорту, не предъявляя никаких документов, а покупки будем оплачивать не карточкой и не смартфоном, а просто посмотрев в камеру кассового терминала.
Или всё-таки не завтра? Достаточно ли точны алгоритмы? Не окажусь ли я в ситуации, когда из-за ошибки системы деньги за покупку, которую я не совершал, будут списаны с моего счёта? Экстраполируя результаты теста NIST FRVT, можно даже попытаться оценить размер потенциальных потерь от таких ошибок.
Если вы разработчик
Для разработчиков ответ очевиден: NIST FRVT — пожалуй, самый авторитетный на сегодняшний день бенчмарк, и, если вам интересно, где находится разработанная вами технология по сравнению со всем остальным миром (а как это может не быть интересно?!), вам просто необходимо в нём участвовать.
Но не только это — участие в соревновании поможет вам оценить состоятельность принятых вами решений: улучшилась ли точность системы после реализации новой функции потерь? как повлияло на качество работы изменение параметров обучения? NIST FRVT покрывает огромное количество различных сценариев и аспектов тестирования — и дело не только в том, что реализовать их все при собственном «ин-хаус» тестировании было бы очень трудоёмко и затратно, о некоторых из них многие (особенно, начинающие) разработчики даже и не задумываются.
А если ваш алгоритм будет действительно хорош, то… в общем, см. фразу, вынесенную в заголовок этой статьи!
Если вы планируете внедрение технологии
На что стоит смотреть в NIST FRVT и как выбрать вендора под свою задачу, если ваша компания планирует внедрить технологию распознавания лиц?
Во-первых, нужно понять, какой из сценариев тестирования, представленных в NIST FRVT, больше всего похож на ваш. Если планируете сравнивать между собой пары лиц, стоит обратить внимание на FRVT 1:1 Verification (примером может быть подтверждение подлинности документов, когда фото на документе сравнивается с лицом предъявителя, или авторизация по лицу при входе в информационную систему).
Если вам нужен поиск по лицу в базе, стоит рассмотреть результаты FRVT 1:N Identification и FRVT Paperless Travel. Вообще, системы типа «один ко многим» можно условно разделить на две группы в зависимости от их толерантности к ложноотрицательным и ложноположительным срабатываниям.
В одном случае ожидается, что человек есть в базе, и наша основная проблема — ложноположительные срабатывания. Такую ситуацию описывает FRVT Paperless Travel, где ожидается, что человек, прилетевший транзитным рейсом, успешно пройдет регистрацию на свой вылетающий рейс. Ложноотрицательное срабатывание системы в данном случае не станет большой трагедией — сотрудник авиакомпании проверит документы пассажира, а вот ложноположительное срабатывание действительно может дорого стоить.
Во втором случае ожидается, что человека в базе нет, и главной проблемой будут ложноотрицательные срабатывания. В таком случае стоит обратиться к FRVT 1:N Identification. Примером может служить проверка посетителя казино по базе шулеров, мошенников и других нежелательных личностей. Здесь ложноположительное срабатывание не страшно — «ручная» проверка позволит устранить возможные недоразумения, а ложноотрицательное срабатывание может повлечь серьезные проблемы. Другим примером может быть поиск пропавшего человека.
Сегодня неотъемлемым атрибутом человеческого лица стала медицинская маска, так что достойны изучения результаты FRVT Face Mask Effects.
Важно также понимать, какой домен наилучшим образом отражает нужные вам результаты. Если условия эксплуатацию проектируемой вами системы предполагают работу в основном с качественными фронтальными изображениями, смотрите на домены Visa и Mugshot. Если возможны произвольные поворотов головы и недостатки освещения, ваш выбор — Border и Kiosk.
Время построения шаблона (читай: скорость работы алгоритма) — важно ли оно? И да, и нет. С одной стороны, можно предположить, если один алгоритм показывает ту же точность, что и другой, но при этом работает быстрее, очевидно, что первый алгоритм окажется эффективнее. С другой стороны, реальная скорость работы будет сильно зависеть от аппаратной платформы. Во-вторых, если вам нужна действительно большая скорость, то, скорей всего, большинство разработчиков сможет предложить вам более быструю (но, вероятно, чуть менее точную) модель, о которой из отчёта NIST FRVT вы бы никогда не узнали.
Здесь также стоит отметить, что набор решений, который предлагает видеоаналитика, не ограничивается одним лишь распознаванием лиц. Разработчики могут дополнительно предлагать решения по определению пола, возраста, атрибутов лица, правильности ношения маски. Можно еще добавить подсчет людей, определения их взаимодействий, кластеризацию и многое другое — обо всем этом не узнать из отчёта NIST FRVT, не говоря уже об удобстве работы с пользовательским интерфейсом системы, качестве технической поддержки и цене.
Иными словами, для выбора решения нельзя целиком и полностью полагаться исключительно на отчёт NIST FRVT. Однако он будет самым правильным местом, чтобы начать — помимо возможности исследовать операционные характеристики алгоритма той или иной компании, сама динамика участия её алгоритма в соревновании может говорить о том, что компания, как говорится, «здесь всерьёз и надолго».
Другие соревнования
NIST FRVT является самым большим и разнообразным бенчмарком для распознавания лиц на данный момент. Можно даже сказать, что на сегодняшний день у него просто нет конкурентов, сопоставимых по масштабу и авторитету.
Стоит отметить, что за последний год сразу два вендора из Китая, Insightface и XForwardAI, попробовали создать собственные бенчмарки, их платформы использовались для проведения соревнования по распознаванию лиц в рамках ICCV 2021 Workshop. Пока оба проекта находятся в зачаточном состоянии и даже рядом не стоят с NIST FRVT.
Есть и другие способы сравнить вендоров, которыми нередко пользуются на практике. Вы можете сами построить бенчмарк на основе своих собственных данных, выбрать небольшой пул интересующих вас разработчиков и попросить их прогнать свои решения на вашем тесте. Очевидный плюс — тестирование будет проходить ровно в том сценарии, который вам нужен, и ровно на том домене данных, с которым в дальнейшем будет работать выбранный алгоритм. Если ваш домен очень специфичен, такой подход может оказаться более чем оправданным. Очевидный минус — высокая стоимость с точки зрения времени, усилий и, как следствие, денег.
Система распознавания лиц для компаний-интеграторов
СТАТЬ ПАРТНЁРОМ ЛИЧНЫЙ КАБИНЕТ
Наша бизнес-модель — партнёрские продажи. Мы обеспечиваем партнёрам помощь в продажах, техническую и маркетинговую поддержку, проводим полное обучение и делимся уникальной компетенцией.
С НАМИ ВЫГОДНО РАБОТАТЬ
- Инновации
- БЫСТРЫЙ СТАРТ И ПРОСТОТА РАБОТЫ
- БЫСТРАЯ ОКУПАЕМОСТЬ
- быстрорастущий рынок
- партнерское сообщество
Движущая сила решений FindFace — лучший в мире алгоритм распознавания лиц. Это регулярно подтверждается NIST — ключевым профессиональным рейтингом, а также нашими партнёрами, результатами проектов для крупнейших мегаполисов и международных мероприятий. Мы привержены идее устойчивого развития решений на основе нейронных сетей и искусственного интеллекта и будем продолжать представлять рынку действительно инновационные и востребованные продукты.
Максимально простой и быстрый старт работы с продуктами NtechLab позволит разворачивать проекты в максимально сжатые сроки: прототип интегрированного решения разрабатывается менее, чем за сутки. Вас поддержит менеджер по работе с партнёрами, пресейл, команда технических и маркетинговых экспертов. Удобный API и интеграция с ведущими мировыми VMS позволит быстро создавать решения для ваших клиентов.
Наши продукты позволят вам заработать больше на ценности законченного решения, предлагать клиентам именно то, что им нужно. Для партнёров доступна опция собственного брендирования продуктов (white-label). Мы заботимся о доступности решений для ваших клиентов, оптимизируя технические требования к аппаратной части для работы системы распознавания лиц. Как результат, низкая стоимость владения решением по сравнению с конкурентами гарантирует вам уникальность вашего рыночного предложения и быструю окупаемость. Кроме того, мы передаем часть клиентских запросов в партнёрский канал.
Рынок готовых решений с использованием лицевой биометрии ежегодно растет на 20%. Включение наших продуктов в ваш портфель решений несомненно позволит нарастить рыночную долю вашей компании, а часто и создать новые рынки, благодаря использованию более конкурентоспособных решений по более выгодной цене, быстрее конкурентов. Наши продукты позволяют зарабатывать гораздо больше, опережая рост рынка, благодаря специальным условиям сотрудничества и качеству технологии.
Мы знаем, как создать действительное выгодные партнёрские отношения. Более 100 мировых компаний уже реализуют проекты с использованием продуктов NtechLab для своих клиентов, получая положительные отзывы и высокую маржу. Мы высоко ценим наших партнёров, сопровождаем их работу на всех этапах сделки с клиентом. Стратегические партнёры принимают участие в тестировании новых версий продуктов и получают эксклюзивный доступ к R&D.
ГЕОГРАФИЯ БИЗНЕСА
>100 ПАРТНЁРОВ
20 СТРАН МИРА
УЖЕ ОЦЕНИЛИ ПОТРЯСАЮЩИЕ ВОЗМОЖНОСТИ FINDFACE
ВЫ
В ХОРОШЕЙ КОМПАНИИ
Sigur
Один из крупнейших производителей СКУД в России. Сотрудничает с промышленными предприятиями, предприятиями нефти и газа, банками, аэропортами, учебными заведениями, компаниями малого и среднего бизнеса и многими другими.
Microsoft
Microsoft — одна из крупнейших транснациональных компаний по производству проприетарного программного обеспечения для различного рода вычислительной техники. Разработчик наиболее широко распространённой в мире программной платформы Windows. Надёжный технологический партнёр и поставщик облачного решения Microsoft Azure с 2017 года.
Nvidia
Nvidia — производитель графических процессоров (GPU). Их использование многократно повышает производительность системы распознавания лиц.
БИТ
Разработчик решений для борьбы с шоплифтерами с использованием технологии распознавания лиц.
Акме
ООО «Акме» — интегратор полного цикла. Предлагает широкий спектр услуг: от разработки highload-решений до комплексного digital-маркетинга.
CSI
Компания CSI (Crystal Service Integration) создает решения для крупного сетевого ритейла: разрабатывает и внедряет программы для автоматизации розничной торговли, поставляет кассовое оборудование — собственное и от ведущих мировых производителей, предоставляет сервисную поддержку.
HeadPoint
Компания HeadPoint — российский разработчик цифровых решений в области видеомониторинга и промышленного интернета на базе собственной IoT-платформы InOne.
Dahua Technology
Dahua Technology — мировой лидер по разработке IoT-решений в области видеозаписи. Основываясь на инновационных технологиях, Dahua Technology предлагает готовые продукты для обеспечения государственной и корпоративной безопасности, а также для безопасности частных лиц.
Polygon
Разработчик технологии, основанной на мультимодальной биометрии для веб- и мобильных решений.
Bitrix24
Bitrix24 предоставляет полный набор инструментов для совместной работы, объединяющий систему управления задачами, проектами, соцсеть, чат, управление взаимоотношениями с клиентами, а также решения на основе распознавания лиц.
Kimaldi
Компания с глубокой экспертизой в технологиях биометрической идентификации, а также RFID- решениях и OEM оборудовании. Производитель и дистрибьютор качественного аппаратного обеспечения для автоматической идентификации с 1998 года.
Лаборатория суперкомпьютерного моделирования
Лаборатория обеспечивает фундаментальные и прикладные исследования и разработки инновационного характера.
Intrada Capital SRL
Компания, предоставляющая кастомизированные решения для внедрения приложений с технологий распознавания лиц в различных сферах: безопасность, маркетинг и управление событиями.
Anytec
Anytec является крупным партером NtechLab в Китае и специализируется на разработке высокоэффективных программных решений, основанных на новейших технологиях глубинного обучения.
Lurity
Компания, которая создает и использует технологии на основе искусственного интеллекта для магазинов, позволяя сделать шоппинг еще более увлекательным.
Ten Forward
TEN FORWARD предлагает кастомные/ интегрированные решения для применения в сфере IT, физической безопасности и интернета вещей.
7Seconds
Компания занимается разработкой платформы с использованием технологии распознавания лиц для онлайн и офлайн кредитования.
IMDS Software
IMDS занимается интеллектуальной обработкой документов и предлагает инновационное аппартное и программное обеспечение с технологией распознавания лиц для повышения качества сбора и обработки данных.
Casino Soft
Компания специализируется на кастомизированных программных продуктах и комплексных решениях для казино по всему миру.
TiaR
Эксперт в области информационных, оборонных и защитных технологий. Компания предлагает продукты и услуги для обеспечения национальной безопасности, которые обслуживают правительства, правоохранительные органы и другие организации.
Prisma teknologi informatika
ИТ-компания предоставляет программные решения для управления документооборотом: сканирование и обработка документов и изображений. Решения компании применяются в различных областях: банковское дело, страхование, финансы, логистика, производство, розничная торговля, горнодобывающая промышленность, а также правительственных учреждениях.
Consultores SQE
Консалтинговая компания по вопросам безопасности и разведки, которая является экспертом в области наблюдения, идентификации угроз, анализа данных, а также поиска лиц, представляющих интерес.
International Security Experts s.r.o.
Консалтинговая компания, предлагающая услуги в сфере комплексной безопасности, являющаяся экспертом в области видеонаблюдения, идентификации угроз, анализа данных, управления персоналом.
KSB
Компания «Комплексные системы безопасности» — системный интегратор. Специализируется на организации информационной и телекоммуникационной инфраструктуры для проведения массовых мероприятий, а также на реализации крупных межотраслевых проектов в области телекоммуникаций и информационных технологий. Одним из направлений является разработка специализированного ПО для автоматизации бизнес-процессов предприятия.
Sigur
Один из крупнейших производителей СКУД в России. Сотрудничает с промышленными предприятиями, предприятиями нефти и газа, банками, аэропортами, учебными заведениями, компаниями малого и среднего бизнеса и многими другими.
Microsoft
Microsoft — одна из крупнейших транснациональных компаний по производству проприетарного программного обеспечения для различного рода вычислительной техники. Разработчик наиболее широко распространённой в мире программной платформы Windows. Надёжный технологический партнёр и поставщик облачного решения Microsoft Azure с 2017 года.
Nvidia
Nvidia — производитель графических процессоров (GPU). Их использование многократно повышает производительность системы распознавания лиц.
БИТ
Разработчик решений для борьбы с шоплифтерами с использованием технологии распознавания лиц.
Акме
ООО «Акме» — интегратор полного цикла. Предлагает широкий спектр услуг: от разработки highload-решений до комплексного digital-маркетинга.
CSI
Компания CSI (Crystal Service Integration) создает решения для крупного сетевого ритейла: разрабатывает и внедряет программы для автоматизации розничной торговли, поставляет кассовое оборудование — собственное и от ведущих мировых производителей, предоставляет сервисную поддержку.
HeadPoint
Компания HeadPoint — российский разработчик цифровых решений в области видеомониторинга и промышленного интернета на базе собственной IoT-платформы InOne.
Dahua Technology
Dahua Technology — мировой лидер по разработке IoT-решений в области видеозаписи. Основываясь на инновационных технологиях, Dahua Technology предлагает готовые продукты для обеспечения государственной и корпоративной безопасности, а также для безопасности частных лиц.
Polygon
Разработчик технологии, основанной на мультимодальной биометрии для веб- и мобильных решений.
Bitrix24
Bitrix24 предоставляет полный набор инструментов для совместной работы, объединяющий систему управления задачами, проектами, соцсеть, чат, управление взаимоотношениями с клиентами, а также решения на основе распознавания лиц.
Kimaldi
Компания с глубокой экспертизой в технологиях биометрической идентификации, а также RFID- решениях и OEM оборудовании. Производитель и дистрибьютор качественного аппаратного обеспечения для автоматической идентификации с 1998 года.
Лаборатория суперкомпьютерного моделирования
Лаборатория обеспечивает фундаментальные и прикладные исследования и разработки инновационного характера.
Intrada Capital SRL
Компания, предоставляющая кастомизированные решения для внедрения приложений с технологий распознавания лиц в различных сферах: безопасность, маркетинг и управление событиями.
Anytec
Anytec является крупным партером NtechLab в Китае и специализируется на разработке высокоэффективных программных решений, основанных на новейших технологиях глубинного обучения.
Lurity
Компания, которая создает и использует технологии на основе искусственного интеллекта для магазинов, позволяя сделать шоппинг еще более увлекательным.
Ten Forward
TEN FORWARD предлагает кастомные/ интегрированные решения для применения в сфере IT, физической безопасности и интернета вещей.
7Seconds
Компания занимается разработкой платформы с использованием технологии распознавания лиц для онлайн и офлайн кредитования.
IMDS Software
IMDS занимается интеллектуальной обработкой документов и предлагает инновационное аппартное и программное обеспечение с технологией распознавания лиц для повышения качества сбора и обработки данных.
Casino Soft
Компания специализируется на кастомизированных программных продуктах и комплексных решениях для казино по всему миру.
TiaR
Эксперт в области информационных, оборонных и защитных технологий. Компания предлагает продукты и услуги для обеспечения национальной безопасности, которые обслуживают правительства, правоохранительные органы и другие организации.
Prisma teknologi informatika
ИТ-компания предоставляет программные решения для управления документооборотом: сканирование и обработка документов и изображений. Решения компании применяются в различных областях: банковское дело, страхование, финансы, логистика, производство, розничная торговля, горнодобывающая промышленность, а также правительственных учреждениях.
Consultores SQE
Консалтинговая компания по вопросам безопасности и разведки, которая является экспертом в области наблюдения, идентификации угроз, анализа данных, а также поиска лиц, представляющих интерес.
International Security Experts s.r.o.
Консалтинговая компания, предлагающая услуги в сфере комплексной безопасности, являющаяся экспертом в области видеонаблюдения, идентификации угроз, анализа данных, управления персоналом.
KSB
Компания «Комплексные системы безопасности» — системный интегратор. Специализируется на организации информационной и телекоммуникационной инфраструктуры для проведения массовых мероприятий, а также на реализации крупных межотраслевых проектов в области телекоммуникаций и информационных технологий. Одним из направлений является разработка специализированного ПО для автоматизации бизнес-процессов предприятия.
Еще
Как работает распознавание лиц и можно ли обмануть эту систему
Система камер с распознаванием лиц в Москве признана одной из самых развитых в мире. Чем это нам грозит? Как работают алгоритмы и можно ли их обмануть? Какое будущее у технологии распознавания лиц?
1
Что такое распознавание лиц?
Распознавание лиц — это технология, которая позволяет автоматически идентифицировать (распознать, кто на фото) или верифицировать (подтвердить, что на фото именно этот человек) человека на фото, видео или вживую. Для распознавания используют нейросети, которые умеют считывать и анализировать уникальные черты человеческого лица, а затем сверять их с базой.
Об эксперте: Татьяна Гайнцева, преподаватель Deep Learning School (МФТИ), автор блога об искусственном интеллекте и нейронных сетях.
За вами выехали. Как работает тотальная слежка и можно ли стать невидимкой?
(Видео: РБК)
2
Как развивалась технология распознавания лиц
- Первые эксперименты в области машинного распознавания лиц представил в 1960-х годах Вуди Бледсо — профессор Техасского университета в Остине, исследователь искусственного интеллекта. Его рабочая группа создала базу из 800 снимков людей в разных ракурсах. Далее ученые размечали лица 46 точками-координатами с помощью прототипа современного планшета. Посредством специального алгоритма система разворачивала лица под разными углами, увеличивала и уменьшала масштаб. На втором этапе алгоритм использовал 22 измерения, действуя согласно байесовской теории принятия решений — чтобы общий вывод был максимально точным. В итоге система, разработанная Бледсо, справлялась в 100 раз быстрее, чем человек.
- В 1988 году Майкл Кирби и Лоуренс Сирович из Университета Брауна применили подход Eigenface с использованием линейной алгебры для анализа изображений. Для разметки лиц они применяли менее 100 различных значений.
- В 1991 году Алекс Пентланд и Мэтью Терк из MIT усовершенствовали технологию Eigenfaces, задействуя факторы окружающей среды. Им удалось автоматизировать процесс распознавания.
- В конце 1990-х годов Управление перспективных исследовательских проектов при Минобороне США (DAPRA) и Национальный институт стандартов и технологий выпустили программу FERET с самой обширной базой лиц — более 14 тыс. изображений. Изначально ее использовали, чтобы находить и распознавать преступников по всему миру, но затем представили для открытого доступа.
- С 2010 года Facebook начал использовать функцию распознавания лиц, чтобы находить пользователей на публикуемых фото и предлагать их отметить.
- В 2011 году власти Панамы и США запустили совместный проект FaceFirst. Это технология распознавания лиц, которую использовали для пресечения незаконной деятельности в аэропорту Токумен в Панаме. В том же году полиция и спецслужбы США начали применять распознавание лиц для опознания трупов — включая Усаму бен Ладена.
- С 2014 года распознавание лиц используют в камерах мобильных телефонов, а с 2017 — в ретейле.
3
Как работает распознавание лиц?
В основе технологии — две нейросети:
Первая — сеть-«выравниватель» (англ. aligner). Она берет картинку, которая поступает с камеры наблюдения, детектирует на ней все лица, которые сможет найти, «вырезает» и «выравнивает» их.
Вот как это выглядит:
Этап №1. Программа вырезает лица
(Фото: wikipedia.org)
Программа вырезает обнаруженные лица (те, что плотно расположены друг к другу, повернуты в профиль или просто очень маленькие и нечеткие, система может не распознать).
Затем она их выравнивает: детектирует на лице точки глаз, носа и рта.
Этап №2. Программа распознает ключевые точки на лице
(Фото: wikipedia.org)
Наконец, поворачивает и подгоняет размер фото так, чтобы точки глаз, носа и рта находились в определенных местах.
Этап №3. Программа приводит фото к стандартному виду
(Фото: Tsinghua University)
Некоторые алгоритмы используют больше семи точек — то есть, обводят контуры лица. Это может понадобиться, к примеру, для создания дипфейков.
Вторая — сеть-«распознаватель». Она принимает на входе выровненное изображение, которое передала первая нейросеть, а на выходе выдает вектор лица — то есть, набор чисел фиксированной длины. У разных сетей эти векторы могут отличаться, но чаще всего это некая степень двойки. Например, 512:
Как работает вторая нейросеть, которая распознает лица
(Фото: KDnuggets)
На похожие лица сеть выдает похожие векторы и наоборот.
Возьмем одно фото Анджелины Джоли и два изображения Брэда Питта и прогоним их через сеть. На выходе получим три вектора. Измерим расстояние между вектором Анджелины Джоли и вектором первого Брэда Питта, а также между векторами двух Брэдов Питтов. В первом случае расстояние будет большим — это разные люди, а во втором — маленьким: это один человек.
Как нейросеть отличает одного человека от другого
(Фото: KDnuggets)
Чтобы обучить нейросети, используют огромные базы данных с лицами людей. Нейросети на входе сообщают, кому принадлежит это лицо, а затем, в ходе обучения, добиваются, чтобы она выдавала максимально точные результаты. Обучившись на миллионах разных людей, нейросеть начинает распознавать и новые лица — те, которых не было в базе.
Технология Face ID в смартфонах устроена немного иначе. Алгоритм распознает вас не по фото, а с помощью инфракрасных точек, которые проецируются на ваше лицо через камеру. После этого создается трехмерная модель и сравнивается с той, что вы уже внесли ранее.
Как работает технология FaceID
4
Где применяют распознавание лиц?
💣 Безопасность
Криминалисты, полиция и спецслужбы используют автоматизированные системы биометрической идентификации (ABIS) для поиска преступников, доказательства преступлений и их предотвращения — например, терактов или мошенничества с документами.
Камеры с распознаванием лиц применяют для обеспечения безопасности на массовых мероприятиях, для прохождения контроля в аэропортах, контроля доступа в различных организациях. Системы помогают находить пропавших детей, дезориентированных взрослых или людей, которых держат в рабстве.
💊 Здравоохранение и медицина
Распознавание лиц в больницах и домах престарелых помогает отслеживать, принимают ли пациенты лекарства и следить за их состоянием через специальный монитор. Нейросети даже умеют обнаруживать по лицу генетические заболевания по характерным признакам на лице — такие, как синдром Ди Джорджи, — и оценивать общее состояние пациента.
🍕 Ретейл, общепит и банки
Технология распознавания лиц помогает идентифицировать клиента и предотвратить мошенничество во время покупки в магазине, анализировать поведение покупателей и оптимизировать сервис так, чтобы продавать больше.
С помощью онлайн-биометрии можно открыть счет и получить кредит, а также снять деньги в банкомате. Например, в Китайском KFC и американском Amazon Go действует «оплата по лицу». В России биометрию планируют внедрить во всех крупнейших банках вместо обычной идентификации.
Еще одно перспективное направление — распознавание эмоций. Например, чтобы улучшить взаимодействие с клиентами и сотрудниками, работая онлайн, или анализировать, как пользователи реагируют на контент. В России подобными разработками занимается компания Neurodata Lab.
Выпуск YouTube-канала «Индустрия 4.0» о распознавании эмоций
📚 Образование
Сервисы на базе распознавания лиц помогают во время онлайн-обучения: следят, чтобы ученик не отвлекался во время экзамена, не списывал и не пользовался устными подсказками.
«Экзамус» — система прокторинга на базе ИИ
5
Самые продвинутые разработки в этой области
С 2016 по 2020 год точность распознавания лиц нейросетями улучшилась в 50 раз: коэффициент ошибок составил 0,8%. Согласно исследованию Facial Recognition Market 2019 года, мировой рынок распознавания лиц тогда оценивали в $3,2 млрд. Прогноз на 2024 год — $7 млрд, при ежегодном росте в 16%.
Самые масштабные разработки в области распознавания лиц — у Google, Apple, Facebook, Amazon и Microsoft (GAFAM).
В 2014 году Facebook запустил сервис DeepFace, который определяет, принадлежат ли два сфотографированных лица одному и тому же человеку с точностью 97,25%.
Как работает DeepFace
В 2015 Google представила свою разработку — FaceNet. Благодаря огромному массиву данных, которые собирают сервисы Google, FaceNet достигла рекордной точности — 99,63%. Технологию, в частности, используют в Google Фото для сортировки изображений и автоматических отметок людей на них.
Amazon с 2018 года активно продвигает свой облачный сервис распознавания лиц под названием Rekognition, которым пользуются правоохранительные органы США. Система умеет распознавать до 100 человек на одном фото и искать их в базах данных, содержащих десятки миллионов лиц.
По данным Центра стратегических и международных исследований, а также Управления по науке и технологиям МВД США, лучшим решением в 2020 году было признано FRT: его точность распознавания составила 99,97%.
В России есть пять крупных игроков на рынке распознавания лиц:
- NTechLab;
- VisionLabs;
- Sensemaking Lab;
- Группа ЦРТ.
NTechLab — разработчик нашумевшего приложения FindFace, которое использовали для поиска людей во «ВКонтакте» по фото. Сервис неоднократно оказывался в центре скандалов с нарушением приватности. Максимальная точность их алгоритмов для распознавания лиц — 99%. Компания также выступила подрядчиком для внедрения камер с распознаванием лиц в Москве.
Второй подрядчик московских властей в этой области — VisionLabs. Они также разрабатывали системы для московских камер и участвовали в других городских проектах. С недавних пор VisionLab стала частью экосистемы «Сбера», и теперь их разработки применяют, в том числе, для внедрения биометрии в банковских сервисах.
Группа ЦРТ в 2014 году первой внедрила систему распознавания лиц в спорте. Ее решения используются на стадионах «Газпром-Арена», «ВТБ-Арена» и других.
6
Что не так с распознаванием лиц в Москве?
В Москве действует одна из крупнейших в мире сетей с распознаванием лиц — более 200 тыс. камер общей стоимостью около 5 млрд руб.
Российскую технологию NTechLab признали лучшей в результате тестирования Национального института стандартов и технологий США. NTechLab вели совместные разработки с Genetec — поставщиком систем видеонаблюдения для американского правительства и спецслужб.
Выпуск YouTube-канала «Индустрия 4.0», посвященный распознаванию лиц
Систему для Москвы начали разрабатывать еще в 2015 году, а пилотный проект запустили в 2017-м: тогда это были 1,5 тыс. камер во дворах и подъездах. В 2018-м систему расширили, протестировав на чемпионате мира по футболу. Камеры помогли задержать около 100 нарушителей из базы уголовного розыска. В том же году с помощью камеры с распознаванием лиц задержали грабителя, находящегося в розыске МВД.
Московскую систему видеонаблюдения использовали во время пандемии в 2020 году. С ее помощью выявили более 200 нарушителей карантина и самоизоляции, которым пришлось выплатить штрафы.
Правозащитники указывают на опасность технологии для обычных граждан. Например, юрист Алена Попова неоднократно подавала иски к управлению МВД Москвы и московскому Департаменту информационных технологий с требованием запретить систему распознавания лиц на митингах.
7
Распознавание лиц и правда используют на митингах?
В феврале 2021-го появилась информация о том, что с помощью камер власти отслеживали участников митингов в Москве и привлекали их к ответственности. Полицейские останавливали людей на входе в метро или приходили к ним домой. Такое бывало и в других странах.
Во время протестов в Гонконге 2019-20 годов власти тоже использовали распознавание лиц, чтобы вычислять активистов. Для борьбы с этим протестующие использовали лазерные указки, маски с чужими лицами и проекторы для лица, а также громили столбы с камерами.
Протестующие в Гонконге используют лазеры против камер с распознаванием лиц
По мнению оппозиции, для распознавания используют программу Face++ от китайского стартапа Megvii. Эта система, предположительно, попала в черный список властей США за нарушение прав человека.
Еще один недавний пример — сайт Faces of the Riot, созданный студентом из Вашингтона. Он использовал приложение с открытым исходным кодом, чтобы извлечь лица из 827 видео, размещенных в соцсети Parler во время штурма Капитолия 6 января 2021 года. Затем он применил нейросеть для распознавания лиц, обученную на 200 тыс. фото из базы ФБР, и идентифицировал людей.
8
Какие еще проблемы есть у технологии сегодня?
👁️🗨️ Утечки. В данном случае в сеть утекают доступы к камерам наблюдения и результатам распознавания. За деньги можно проверить по фотографии, где и когда камеры засекли конкретного человека.
🤦 Ошибки в распознавании. В 2018 году технология распознавания лиц от Amazon ошибочно опознала 28 членов Конгресса США как преступников. Недавний пример — москвич Сергей Межуев, которого система распознавания лиц в метро ошибочно приняла за преступника в розыске. В итоге мужчину задержали, собрали все данные и не сняли подозрения, пока реальный подозреваемый не нашелся.
❌ Использование лиц без согласия. В США до недавнего времени для обучения нейросетей распознаванию лиц использовали датасеты с лицами из открытых источников. Готовые датасеты тоже были в открытом доступе. Однако сейчас их убрали, так как это нарушает законы о защите персональных данных. Теперь доступ к ним можно получить по запросу и только для исследовательских (некоммерческих) целей.
😠 Дискриминация и расизм. Для обучения нейросетей используют датасеты, которые содержат, в основном, фото людей титульной нации и расы. В итоге системы распознавания лиц плохо распознают азиатов, латиноамериканцев или афроамериканцев. Системы, которые используют в криминалистике, чаще указывают на чернокожих людей как на потенциальных преступников.
Исследование MIT от 2018 года показало, что алгоритмы Microsoft, IBM и китайского Megvii (FACE ++) очень часто ошибаются при идентификации темнокожих женщин по сравнению со светлокожими мужчинами.
Есть примеры дискриминации по полу: например, нейросеть, которая дорисовывает женским фото тело в бикини, а мужским — в костюме. Просто потому, что в сети большинство изображений именно такие.
👮 Использование технологии для манипуляции людьми. Оказавшись в руках властей, системы с распознаванием лиц вместе с базами персональных данных дают неограниченные возможности. Самый радикальный пример того, к чему это может привести — Китай.
Распознавание лиц в Китае: социальная антиутопия
В Китае распознавание лиц используют в полиции, аэропортах, на улицах, в общественном транспорте. Государство планирует распространить систему по всей стране: по данным CNBC, в конце 2018 года в Китае использовали более 200 млн камер наблюдения, а к концу 2021-го их число достигнет более 500 млн.
Одна из главных причин — внедрение системы социального рейтинга или кредита. Каждый гражданин страны получает положительные баллы за общественно-полезную деятельность, отсутствие нарушений, своевременную уплату налогов. За проступки баллы снимаются. Низкий или отрицательный рейтинг влечет разные последствия: отказ в выдаче кредита и социальных выплатах, запрет на вылет из страны и работу в определенных организациях.
Также при помощи этой технологии правительство Китая следит за представителями уйгурского этнического меньшинства. Сотни тысяч уйгуров поместили в города-гетто и лагеря для политзаключенных и всячески ограничивают их в перемещении.
9
Можно ли обмануть систему распознавания лиц?
Чтобы бороться с «умными» камерами, в ход идут специальные маски, проекторы, лазеры и другие приемы:
Однако все эти способы вряд ли помогут. Во-первых, мы до конца не знаем, по каким именно приметам нейросети распознают лица. Во-вторых, алгоритмы обучают по разным схемам и на разных датасетах. Чтобы их обмануть, нужно точно знать, как устроена конкретная нейросеть.
Можно, конечно, полностью скрыть лицо в публичных местах и на массовых мероприятиях. Но во многих странах — включая Россию и Китай — это запрещено законом.
Есть способы, которые помогают изменить уже готовые фото. Например, компания Generated Media создала Anonymizer: приложение, которое генерирует серию портретов на основе ваших фото и делает их неузнаваемыми для нейросетей.
Можно использовать специальную маску. К примеру, возьмем фото, на котором нейросеть опознала актрису Еву Лонгорию и немного изменим его:
Слева — исходное фото, справа — маска, наложенная на него, посредине — результат. Теперь алгоритм его не узнает, хотя для нас очевидно, что это та же самая женщина. Но и этот способ можно применить только если у вас есть доступ к архитектуре нейросети.
10
Как регулируют распознавание лиц в разных странах?
В ЕС и Великобритании действует самый жесткий регламент по защите данных — GDPR. Он запрещает любое посягательство на личную жизнь человека со стороны частных компаний и госорганов без его согласия. Это касается и систем распознавания лиц.
В США нет единого закона, который бы регулировал использование технологии. Ближе всех к европейскому GDPR по сути стоит Закон о конфиденциальности потребителей в Калифорнии (CCPA). В некоторых штатах действуют ограничения для полиции и других органов — например, в Орегоне, Вашингтоне, Техасе, Иллинойсе, Массачусетсе, Вермонте.
ИТ-корпорации настаивают на принятии законов на федеральном уровне. В 2020 году IBM объявила о прекращении продаж своих продуктов для распознавания лиц. Вслед за ними Amazon и Microsoft временно приостановили сотрудничество с госорганами в этой области. А в июле правозащитники из ACLU подали иск против ClearviewAI за нарушение закона штата Иллинойс о конфиденциальности биометрической информации.
В Китае распознавание лиц используют повсеместно, и у госорганов есть неограниченные возможности по применению технологии. С недавних пор биометрия является обязательной даже при регистрации телефонного номера.
В России есть закон о защите персональных данных. Но он направлен, в первую очередь, на сохранность самих данных: их необходимо защищать, чтобы предотвратить утечки. Права самих граждан, чьи данные используются, никак не защищены. Безопасность биометрических данных в частной сфере пока не регулируется, но у властей с 2019 года есть право использовать распознавание лиц без согласия граждан.
11
Какое будущее у этой технологии?
Эксперты считают, что в ближайшие пару лет распознавание лиц окончательно станет массовой технологией. Ее будут применять в «умных» и обычных гаджетах, для идентификации и оплаты, прохода в офисы и регистрации в аэропорту, а также для доступа к онлайн-сервисам и аккаунтам в соцсетях. В течение 15-20 лет мы полностью перейдем на биометрические паспорта. А вот обмануть алгоритмы или укрыться от камер с распознаванием лиц станет практически невозможно.
Это означает полную утрату приватности и частной жизни.
DeepFace — самое популярное глубокое распознавание лиц в 2022 году (Руководство)
Распознавание лиц было горячей темой на протяжении нескольких десятилетий. И хотя доступны различные библиотеки распознавания лиц, DeepFace стал широко популярным и используется во многих приложениях для распознавания лиц.
В этой статье мы обсудим, что отличает DeepFace от его альтернатив и почему вам следует его использовать. В частности, в статье будет рассмотрено следующее:
- Что такое DeepFace? Руководство по ключевым функциям.
- Краткие пошаговые руководства по использованию библиотеки DeepFace.
- Как собрать детектор лиц с Deep Face.
- Как пользоваться самыми популярными моделями распознавания лиц.
- Учебное пособие по использованию распознавания лиц на основе глубокого обучения с помощью веб-камеры в режиме реального времени.
- Как установить репозиторий GitHub для распознавания лиц, содержащий библиотеку DeepFace.
Прежде чем мы углубимся: Если вы ищете решение корпоративного уровня для доставки приложений распознавания лиц, вы можете использовать DeepFace с платформой без кода Viso Suite. Viso Suite, используемый ведущими организациями по всему миру, предоставляет DeepFace, полностью интегрированный со всем, что вам нужно для запуска и масштабирования ИИ, включая безопасность с нулевым доверием и конфиденциальность данных для ИИ.
Что такое Deepface?
DeepFace — самая легкая библиотека распознавания лиц и анализа атрибутов лица для Python. Библиотека DeepFace с открытым исходным кодом включает в себя все передовые модели искусственного интеллекта для распознавания лиц и автоматически обрабатывает все процедуры распознавания лиц в фоновом режиме.
Хотя вы можете запустить DeepFace, написав всего несколько строк кода, вам не нужно приобретать глубокие знания обо всех процессах, стоящих за ним. Фактически вы просто импортируете библиотеку и передаете точный путь к изображению в качестве входных данных; это все!
Если вы запускаете распознавание лиц с помощью DeepFace, вы получаете доступ к набору функций:
- Проверка лица : Задача проверки лица относится к сравнению лица с другим, чтобы проверить, совпадает оно или нет. Следовательно, проверка лица обычно используется для сравнения лица кандидата с другим. Это можно использовать для подтверждения того, что физическое лицо совпадает с лицом в документе, удостоверяющем личность.
- Распознавание лиц : Задача относится к поиску лица в базе данных изображений. Выполнение распознавания лиц требует многократного запуска проверки лиц.
- Анализ атрибутов лица: Задача анализа атрибутов лица относится к описанию визуальных свойств изображений лица. Соответственно, анализ атрибутов лица используется для извлечения таких атрибутов, как возраст, гендерная классификация, анализ эмоций или предсказание расы/этнической принадлежности.
- Анализ лиц в реальном времени: Эта функция включает проверку распознавания лиц и анализ атрибутов лица с помощью видеопотока с веб-камеры в реальном времени.
Далее я объясню, как выполнять эти задачи глубокого распознавания лиц с помощью DeepFace.
Как использовать DeepFace?
Deepface — это проект с открытым исходным кодом, написанный на Python и распространяемый по лицензии MIT. Разработчикам разрешено использовать, модифицировать и распространять библиотеку как в частном, так и в коммерческом контексте.
Библиотека Deepface также опубликована в Индексе пакетов Python (PyPI), репозитории программного обеспечения для языка программирования Python. Далее я проведу вас через краткое руководство по использованию DeepFace.
1. Установите пакет DeepFace
Самый простой и быстрый способ установить пакет DeepFace — вызвать следующую команду, которая установит саму библиотеку и все необходимые компоненты с GitHub.
"оболочка" #Репо: https://github.com/serengil/deepface пип установить дипфейс ```
2. Импортируйте библиотеку
Затем вы сможете импортировать библиотеку и использовать ее функции с помощью следующей команды.
```питон из импорта Deepface DeepFace ```
Как выполнить распознавание и анализ лиц
Запустить проверку лица с помощью Deep Learning на DeepFace
Следующий пример проверки лица показывает, насколько просто запустить ее. На самом деле, мы передаем только пару изображений в качестве входных данных, и все!
```питон проверка = DeepFace. verify(img1_path = "img1.jpg", img2_path = "img2.jpg") ```
Несмотря на то, что внешний вид Эмилии Кларк в ее повседневной жизни по сравнению с ее ролью Дейенерис Таргариен в «Игре престолов» сильно отличается, DeepFace может проверить эту пару изображений, и механизм DeepFace возвращает ключ «проверено»: True . Это означает, что человек на каждом изображении фактически распознается как один и тот же человек.
Пример проверки лица с помощью библиотеки DeepFace
Как применить технологию распознавания лиц DeepLearn с помощью DeepFace
В повседневной речи мы понимаем распознавание лиц как задачу поиска лица в списке изображений. Однако в литературе под распознаванием лиц понимается задача определения пары лиц как одного и того же или разных лиц. Реальный функционал распознавания лиц отсутствует в большинстве альтернативных библиотек.
Сказав это, DeepFace также покрывает распознавание лиц своим реальным значением. Для этого вы должны хранить изображения из базы данных лиц в папке. Затем DeepFace будет искать идентификатор переданного изображения в папке вашей базы данных лиц.
```питон распознавание = DeepFace.find(img_path = "img.jpg", db_path = "C:/facial_db") ```
DeepFace сравнивает распознанную личность с результатами в базе данных лиц.
Как выполнять анализ атрибутов лица с помощью DeepFace
Кроме того, DeepFace поставляется с мощным модулем анализа атрибутов лица для прогнозирования возраста, пола, эмоций и расы/этнической принадлежности. В то время как модуль распознавания лиц DeepFace объединяет существующие современные модели, его анализ атрибутов лица имеет свои собственные модели. В настоящее время модель прогнозирования возраста достигает средней абсолютной ошибки +/- 4,6 года; а модель предсказания пола достигает точности 97%.
Вы можете использовать следующую команду, чтобы выполнить анализ атрибутов лица и протестировать его самостоятельно:
```python анализ = DeepFace.analyze(img_path = "img. jpg", действия = ["возраст", "пол", "эмоции", "раса"]) печать (анализ) ```
Согласно результатам анализа черт лица, приведенным ниже, возраст Эмилии Кларк был определен как «31 год», пол «женщина», эмоция «счастливая» на основе этого изображения.
Анализ атрибутов лица с помощью глубокого обучения с использованием библиотеки DeepFace
Используйте распознавание лиц и анализ атрибутов в видео в реальном времени
Кроме того, вы можете тестировать модули распознавания лиц и анализа атрибутов лица в режиме реального времени. Функция потока получит доступ к вашей веб-камере и запустит эти модули. Это весело, не так ли?
```питон DeepFace.stream(db_path = «C:/facial_db») ```
Комбинация распознавания лиц и анализа атрибутов лица, применяемая в режиме реального времени на видео с веб-камеры
Самые популярные модели распознавания лиц
В то время как большинство альтернативных библиотек распознавания лиц обслуживают одну модель ИИ, библиотека DeepFace объединяет множество передовых моделей распознавания лиц. Следовательно, это самый простой способ использовать алгоритм Facebook DeepFace и все остальные алгоритмы распознавания лиц, представленные ниже.
Следующие алгоритмы глубокого обучения распознавания лиц можно использовать с библиотекой DeepFace. Большинство из них основаны на современных сверточных нейронных сетях (CNN) и обеспечивают лучшие в своем классе результаты.
1. VGG-Face
VGG означает Visual Geometry Group. Нейронная сеть VGG (VGGNet) — один из наиболее часто используемых типов моделей распознавания изображений, основанный на глубоких сверточных нейронных сетях. Архитектура VGG прославилась тем, что добилась высочайших результатов в конкурсе ImageNet. Модель разработана исследователями из Оксфордского университета.
Несмотря на то, что VGG-Face имеет ту же структуру, что и обычная модель VGG, она настроена на изображения лиц. Модель распознавания лиц VGG достигает 9 баллов.Точность 7,78% в популярном наборе данных Labeled Faces in the Wild (LFW).
Как использовать VGG-Face: Библиотека DeepFace использует VGG-Face в качестве модели по умолчанию.
2. Google FaceNet
Данная модель разработана исследователями Google. FaceNet считается современной моделью для обнаружения и распознавания лиц с помощью глубокого обучения. FaceNet можно использовать для распознавания лиц, проверки и кластеризации (кластеризация лиц используется для кластеризации фотографий людей с одинаковой идентичностью).
Основным преимуществом FaceNet является его высокая эффективность и производительность. Сообщается, что он достигает точности 99,63% в наборе данных LFW и 95,12% в базе данных Youtube Faces, используя при этом всего 128 байт на лицо.
Как использовать FaceNet: Вероятно, самый простой способ использования Google FaceNet — это библиотека DeepFace, которую вы можете установить и указать в качестве аргумента в функциях DeepFace (см. главу ниже).
3. OpenFace
Эта модель распознавания лиц создана исследователями из Университета Карнеги-Меллона. Следовательно, OpenFace во многом вдохновлен проектом FaceNet, но он более легкий, а его тип лицензии более гибкий. OpenFace получает 9 балловТочность 3,80% в наборе данных LFW.
Как использовать OpenFace: Как и в предыдущих моделях, вы можете использовать модель ИИ OpenFace с помощью библиотеки DeepFace.
4. Facebook DeepFace
Эта модель распознавания лиц была разработана исследователями Facebook. Алгоритм Facebook DeepFace был обучен на размеченном наборе данных из четырех миллионов лиц, принадлежащих более чем 4000 человек, который на момент выпуска был самым большим набором данных о лицах. Подход основан на глубокой нейронной сети с девятью слоями.
Точность модели Facebook составляет 97,35 % (+/- 0,25 %) на эталонном наборе данных LFW. Исследователи утверждают, что алгоритм DeepFace Facebook сократит отставание от производительности на уровне человека (97,53%) на том же наборе данных. Это указывает на то, что DeepFace иногда более успешен, чем люди, при выполнении задач по распознаванию лиц.
Как использовать Facebook DeepFace: Простым способом использования алгоритма распознавания лиц Facebook является использование одноименной библиотеки DeepFace, которая содержит модель Facebook. Читайте ниже, как
5. DeepID
Алгоритм проверки лица DeepID выполняет распознавание лиц на основе глубокого обучения. Это была одна из первых моделей, использующих сверточные нейронные сети и обеспечивающих лучшую, чем у человека, производительность в задачах распознавания лиц. Deep-ID был представлен исследователями Китайского университета Гонконга.
Системы, основанные на распознавании лиц DeepID, были одними из первых, кто превзошел человека в выполнении этой задачи. Например, DeepID2 достиг 99,15% в наборе данных Labeled Faces in the Wild (LFW).
Как использовать модель DeepID: DeepID — одна из внешних моделей распознавания лиц, встроенная в библиотеку DeepFace.
6. Dlib
Модель распознавания лиц Dlib называет себя «самым простым в мире API распознавания лиц для Python». Модель машинного обучения используется для распознавания лиц и управления ими из Python или из командной строки. Хотя библиотека dlib изначально написана на C++, она имеет простые в использовании привязки к Python.
Интересно, что модель Dlib не была разработана исследовательской группой. Он представлен Дэвисом Э. Кингом, главным разработчиком библиотеки обработки изображений Dlib.
Инструмент распознавания лиц Dlib отображает изображение человеческого лица в 128-мерном векторном пространстве, где изображения одного и того же человека находятся рядом друг с другом, а изображения разных людей находятся далеко друг от друга. Поэтому dlib выполняет распознавание лиц, сопоставляя лица с пространством 128d, а затем проверяя, достаточно ли мало их евклидово расстояние.
При пороге расстояния 0,6 модель dlib достигла точности 99,38 % в стандартном эталонном тесте распознавания лиц LFW, что ставит ее в один ряд с лучшими алгоритмами распознавания лиц.
Как использовать Dlib для распознавания лиц: Модель также завернута в библиотеку DeepFace и может быть задана в качестве аргумента в функциях Deep Face (подробнее об этом ниже).
7. ArcFace
Это новейшая модель в линейке моделей. Его совместными разработчиками являются исследователи Имперского колледжа Лондона и InsightFace. Точность модели ArcFace для набора данных LFW составляет 99,40 %.
Как использовать модели распознавания лиц
Как упоминалось выше, эксперименты показывают, что люди достигают 97,53% баллов за распознавание лиц в наборе данных Labeled Faces in the Wild. Интересно, что VGG-Face, FaceNet, Dlib и ArcFace уже преодолели этот балл (алгоритмы ИИ, работающие лучше, чем человек). С другой стороны, OpenFace, DeepFace и DeepID показывают очень близкие результаты по производительности человека.
Чтобы использовать эти модели, их можно задать в качестве аргумента в функциях deepface:
```python модели = ["VGG-Face", "Facenet", "OpenFace", "DeepFace", "DeepID", "Dlib", "ArcFace"] #проверка лица проверка = DeepFace.verify("img1.jpg", "img2.jpg", имя_модели = модели[1]) #распознавание лица распознавание = DeepFace. find(img_path = "img.jpg", db_path = "C:/facial_db", model_name = models[1]) ```
Библиотека DeepFace поддерживает 7 современных моделей распознавания лиц.
DeepFace расширяет свой портфель моделей с момента своего первого коммита. Его первоначальная версия охватывает только VGG-Face и Facenet. Он поддерживает семь передовых моделей распознавания лиц. Но и в будущем вы сможете легко использовать новейшие модели распознавания лиц с DeepFace, потому что имя модели является аргументом ее функций, а интерфейс всегда остается прежним.
Самые популярные детекторы лиц
Обнаружение и выравнивание лиц — очень важные этапы конвейера распознавания лиц. Google заявил, что только выравнивание лица увеличивает показатель точности распознавания лиц на 0,76%.
В общем, DeepFace — это простой способ использовать самые популярные современные детекторы лиц. В настоящее время в DeepFace встроено несколько передовых детекторов лиц:
OpenCV
По сравнению с другими, OpenCV является самым легким детектором лиц. Популярный инструмент обработки изображений использует каскадный алгоритм Хаара, который не основан на методах глубокого обучения. Вот почему он быстрый, но его производительность относительно низкая. Для правильной работы OpenCV требуются фронтальные изображения. Кроме того, его производительность обнаружения глаз средняя. Это вызывает проблемы с выравниванием. Обратите внимание, что детектором по умолчанию в DeepFace является OpenCV.
Обнаружение лиц с помощью OpenCV
Dlib
Этот детектор использует алгоритм борова в фоновом режиме. Следовательно, как и OpenCV, он не основан на глубоком обучении. Тем не менее, он имеет относительно высокие показатели обнаружения и выравнивания.
SSD
SSD означает однократный детектор; это популярный детектор на основе глубокого обучения. Производительность SSD сравнима с OpenCV. Однако SSD не поддерживает лицевые ориентиры и зависит от модуля обнаружения глаз OpenCV для выравнивания. Несмотря на то, что его эффективность обнаружения высока, оценка выравнивания только средняя.
MTCNN
Это детектор лиц, основанный на глубоком обучении, и он поставляется с ориентирами лица. Вот почему у MTCNN высокие показатели обнаружения и выравнивания. Однако он медленнее, чем OpenCV, SSD и Dlib.
RetinaFace
RetinaFace признана самой современной моделью распознавания лиц, основанной на глубоком обучении. Его производительность в дикой природе является сложной задачей. Однако для этого требуется высокая вычислительная мощность. Вот почему RetinaFace — самый медленный детектор лиц по сравнению с другими.
Как использовать детекторы лиц
Подобно моделям распознавания лиц, детекторы также могут быть установлены в качестве аргумента в функциях DeepFace:
```python Детекторы = ["opencv", "ssd", "mtcnn", "dlib", "retinaface"] #проверка лица верификация = DeepFace.verify("img1.jpg", "img2.jpg",Detector_backend=детекторы[0]) #распознавание лица распознавание = DeepFace.find(img_path = "img.jpg", db_path = "C:/facial_db",Detector_backend=детекторы[0]) ```
Какой детектор лиц следует использовать?
Если ваше приложение требует высокой достоверности, вам следует рассмотреть возможность использования RetinaFace или MTCNN. С другой стороны, если для вашего проекта важнее высокая скорость, то стоит использовать OpenCV или SSD.
Как выполнять задачи по извлечению лиц с помощью DeepFace
Deepface имеет пользовательскую функцию распознавания лиц в своем интерфейсе. Вы также можете использовать библиотеку с широким набором детекторов лиц только для извлечения лиц. В приведенном ниже примере показано, как распознается и выравнивается лицо актрисы Эмилии Кларк. Программное обеспечение добавляет некоторые отступы, чтобы изменить размер извлеченного изображения, чтобы оно соответствовало ожидаемому размеру целевой модели распознавания лиц.
```питон Детекторы = ["opencv", "ssd", "mtcnn", "dlib", "retinaface"] img = DeepFace.detectFace("img1.jpg",Detector_backend=детекторы[4]) ```
Обнаружение лиц для извлечения лиц с помощью DeepFace
Преимущества библиотеки Deepface
Вы можете спросить себя, почему вы должны использовать библиотеку Deepface по сравнению с альтернативами? Я думаю, что это самые важные причины, по которым люди используют DeepFace для создания приложений для распознавания лиц:
Он легкий
Вы можете использовать любую функциональность с помощью одной строки кода. Вам не нужно приобретать глубокие знания о процессах, стоящих за этим.
Простота установки
Для некоторых популярных библиотек распознавания лиц требуются основные зависимости C и C++. Это затрудняет их установку и инициализацию. У вас могут возникнуть проблемы при компиляции. Однако дипфейс в основном основан на TensorFlow и Keras. Это делает его очень простым в установке.
Несколько моделей и детекторов
В настоящее время библиотека Deepface объединяет семь современных моделей распознавания лиц и пять передовых детекторов лиц. Список поддерживаемых моделей и детекторов расширялся с момента первого коммита и будет продолжать расти в течение следующих нескольких месяцев.
Распознавание лиц с открытым исходным кодом
Deepface находится под лицензией MIT License. Это означает, что вы можете совершенно свободно использовать его как в личных, так и в коммерческих целях. Кроме того, он полностью открыт. Вы можете настроить библиотеку в соответствии с вашими требованиями.
Растущее сообщество Deepface
Более того, библиотека Deepface очень популярна в сообществе. Десятки участников, тысячи звезд на GitHub и сотни тысяч установок на pip. Даже если вы столкнетесь с какой-либо проблемой, вы, скорее всего, найдете решение на дискуссионных форумах.
Пакет, независимый от языка
Deepface — это независимый от языка пакет. Основные функции DeepFace написаны на Python. Его можно развернуть для выполнения выводов ИИ на периферии (распознавание лиц на устройстве). Однако он также обслуживает API (API Deepface), позволяющий запускать распознавание лиц и анализ атрибутов лица с мобильных или веб-клиентов.
Запланированные функции DeepFace
Несмотря на то, что библиотека Deepface уже сегодня поддерживает обширные функции, сообщество получит дополнительные преимущества от новых и будущих функций, таких как: новые модели распознавания лиц, такие как CosFace или SphereFace
Что дальше?
Основная идея DeepFace — объединить лучшие инструменты распознавания изображений для глубокого анализа лица в одной легкой и гибкой библиотеке. Поскольку простота очень важна, мы также называем ее LightFace. Любой может внедрить DeepFace в задачи производственного уровня с высокой оценкой уверенности в использовании самых мощных алгоритмов с открытым исходным кодом.
Если вы хотите использовать DeepFace в приложениях компьютерного зрения корпоративного уровня, рассмотрите возможность использования Viso Suite — комплексной платформы для компьютерного зрения без кода, которая легко интегрируется с DeepFace.
Мы рекомендуем вам ознакомиться с проектом DeepFace на Github. Пожалуйста, помогите и поддержите проект, пометив ⭐️ его репозиторий на GitHub 🙏.
Продолжить чтение по связанным темам:
- Глубокое распознавание лиц: простой для понимания обзор
- Обнаружение лиц в 2022 году: приложения реального времени с глубоким обучением
- +70 Самые популярные приложения компьютерного зрения в 2022 году
- Самое популярное программное обеспечение для глубокого обучения в 2022 году
15 лучших API распознавания лиц в 2021 году
1900 Февраль 2021
Программное обеспечение для распознавания лиц завоевывает мировой рынок цифровых продуктов. API распознавания лиц используются в различных сферах бизнеса и маркетинговых стратегиях. Анализ лица является неотъемлемой частью систем кибербезопасности. Многие API-интерфейсы обнаружения лиц основаны на машинном обучении и используют нейронную сеть для выполнения задач.
Содержание
15 основных API распознавания лиц
1. Microsoft Computer Vision API — точность 96 %
2. API Lambda Labs — точность 99 %
3. Inferdo — точность 100 %++
— 9 Face 4. Точность
5. EyeRecognize — Точность 99%
6. Kairos — Точность 62%
7. Аниметрика — Точность 100%
8. Macgyver — Точность 74%
9. BetaFace — Точность 81%
10. Luxand.62ud EyeFace
12. Обнаружение и распознавание лиц Skybiometry
13. EmoVu
14. FaceMark
15. Deep Face Detect
Резюме
Весь список API распознавания лиц: почетные упоминания от их целей и бюджета. Инструменты идентификации лиц различаются по своей функциональности, точности и цене. Распознавание изображений, распознавание лиц, защита данных или проверка личности — у каждого API распознавания лиц есть свои ключевые функции. Вот обзор лучших API распознавания лиц в 2021 году.
1. Microsoft Computer Vision API — точность 96 %
Подходит для: обработки контента из изображений
Microsoft Computer Vision API распознавания лиц и изображений предлагает высокоуровневые алгоритмы разработки для обработки изображений и возврата информации. Пользователи могут анализировать изображения и их особенности.
Этот API может маркировать визуальные функции, идентифицировать объекты и бренды, определять лица и типы изображений и даже определять цветовые схемы. Данные ответа OCR включают язык, текст, слова, регионы и другие данные.
В дополнение к бесплатному базовому плану доступно несколько платных планов стоимостью от 19 до 199 долларов.
2. API-интерфейс Lambda Labs — точность 99 %
Лучше всего подходит для: распознавания лиц, пола и идентификации черт лица
API-интерфейс распознавания лиц, разработанный Lambda Labs, позволяет распознавать и классифицировать лица по полу. Он также обеспечивает определенные функции позиционирования глаз, носа и рта.
Пользователи могут создавать фотоальбомы и библиотеки. Приложение для распознавания лиц помогает анализировать и сравнивать новые изображения и их совместимость с существующими изображениями.
Lambda Labs предлагает 1000 бесплатных запросов в месяц с бесплатным планом. Несколько вариантов платного плана варьируются от 149 до 1449 долларов в месяц.
Демо доступно здесь.
3. Inferdo — точность 100 %
Подходит для: распознавания лиц с оценкой возраста
Inferdo Face Detection локализует человеческие лица на изображениях. API хорошо работает для определения лиц и пола, оценки возраста и определения черт лица.
Разработчики обещают простую интеграцию своего алгоритма машинного обучения и вашего приложения.
Inferdo предлагает базовый бесплатный план и различные модели с помесячной оплатой от 10 до 1000 долларов в месяц.
4. Face++ — Точность 99 %
Подходит для: извлечения информации о лицах из изображений
Face++ API распознавания лиц от Megvii обнаруживает и анализирует людей с помощью моделей глубокого обучения. Эти модели обучаются на миллионах изображений, чтобы обеспечить максимальную точность распознавания лиц.
Основные функции Face ++ включают распознавание лиц, идентификацию и сравнение лиц, а также модели распознавания тела с высокой точностью. Однако функции распознавания лиц нет. Вы можете определить возраст, расу и пол.
У Face++ есть бесплатная версия. Платные пакеты доступны от 500 до 10 500 долларов, в зависимости от функций.
5. EyeRecognize — точность 99 %
Подходит для: распознавания лиц по биометрическим данным
EyeRecognize API распознавания лиц предоставляет координаты для определенных черт лица: носа, рта и глаз. Также работает с биометрическими характеристиками: расой, полом и возрастом.
EyeRecognize обеспечивает аналитику на основе соотношения лица и изображения, а также цвета кожи, глаз и волос.
API EyeRecognize Face Detection имеет бесплатный базовый и платный планы в диапазоне от 29 до 249 долларов США в месяц.
6. Kairos — Точность 62 %
Подходит для: поиска лиц и определения функций
API распознавания лиц Kairos очень популярен и предлагает широкий спектр решений для распознавания изображений. API определяет пол и возраст и распознает лица на изображениях, видео и в потоковом режиме в реальном времени. Этот API используется для предотвращения мошенничества с идентификацией и обеспечения безопасной связи с клиентами.
Кайрос славится своим этическим подходом к идентичности. Продукция компании отвечает требованиям самых разных сообществ по всему миру.
Доступен в нескольких платных планах, от 19 до 499 долларов в месяц.
7. Animetrics — 100% точность
Подходит для: распознавания лиц на основе глубокого обучения
API распознавания лиц Animetrics обнаруживает человеческие лица и характерные точки, исправляет изображения под углом и выполняет распознавание лиц. Он обрабатывает информацию о чертах лица, включая брови, нос, уши, подбородок и губы, как координаты на изображении. Он также определяет пол и размещает ориентацию лиц по трем осям.
API Animetrics предоставляет некоторые специальные функции, такие как параметр повторной визуализации SetPose.
Пользователям предлагается бесплатный базовый план и платные планы от 49 до 999 долларов в месяц.
8. Macgyver — Точность 74 %
Подходит для: распознавания лиц и сравнения
API распознавания лиц Macgyver предоставляет набор инструментов для распознавания лиц и изображений. Он может сравнивать два лица, определять наличие лиц на изображении и возвращать координаты (X, Y) людей на изображении.
API использует машинное обучение и высокоточные нейронные сети, встроенные в TensorFlow.
Предлагаются как бесплатные, так и гибкие платные планы в зависимости от использования.
9. BetaFace — Точность 81 %
Лучше всего подходит для: распознавания и преобразования лиц
BetaFace Face Recognition API позволяет легко обнаруживать, анализировать, распознавать и сравнивать лица. Инструмент также определяет пол, возраст, выражение лица, этническую принадлежность и контент NSFW с несколькими ссылками на лица и более чем 40 чертами лица.
API сравнивает лица, создает и ищет лица в ваших базах данных. Он определяет возраст, пол, выражение лица и этническую принадлежность. Он также обрабатывает черты лица, геометрические свойства и цвета, включая цвета одежды и прически. Он используется для обнаружения контента для взрослых.
BetaFace доступен бесплатно и имеет платные тарифные планы от 245 до 1595 долларов США в месяц.
10. Luxand.cloud
Подходит для: обнаружения и сравнения человеческих лиц
API распознавания лиц Luxand.cloud обнаруживает и сравнивает человеческие лица. Он распознает возраст, пол и эмоции на фотографии и идентифицирует ранее отмеченных людей на изображениях.
Этот API позволяет легко находить и проверять людей на фотографиях или фотоколлекциях. Пользователи могут создать галерею в облаке и пометить людей их именами и личностями. Luxand.cloud обеспечивает процесс проверки.
API предлагает бесплатный базовый план и платные планы от 19 до 499 долларов в месяц.
11. EyeFace
Подходит для: распознавания лиц и управления изображениями
EyeFace API, разработанный Eyedea Recognition, обеспечивает обнаружение лиц, анализ лиц и уникальный подсчет людей. Он оценивает возраст и определяет пол, анализируя фото и видео даже в низком разрешении.
Разработчики обещают, что их продукт будет быстрым, оптимизированным, точным и гибким.
Eyedea предлагает три основных пакета для своего API: от 299,00 евро, 499,00 евро и 599,00 евро, а также бесплатную демоверсию.
12. Skybiometry Обнаружение и распознавание лиц
Подходит для: облачного распознавания лиц под сложными углами
Skybiometry Обнаружение и распознавание лиц API обеспечивает обнаружение, распознавание и группировку лиц. Он одновременно распознает несколько лиц под разными углами с любым выражением лица, в очках или без них.
Пользователи могут выбирать между бесплатным планом, 50/100 евро в месяц или пользовательской моделью оплаты.
13. EmoVu
Подходит для: интеллектуальных адаптивных интерфейсов и распознавания эмоций
EmoVu, разработанный Eyeris, распознает эмоции из потоков веб-камеры в реальном времени.
Основные функции включают распознавание лиц и эмоций, а также определение пола и возраста. Это помогает компаниям следить за настроением клиентов и вовлеченностью в продукт. Он возвращает до 20 параметров на каждый обнаруженный объект. Его алгоритм, основанный на глубоком обучении, позволяет анализировать микровыражения человеческих лиц.
Eyeris предлагает своим пользователям либо бесплатную версию, либо индивидуальные платные планы в зависимости от требований.
14. FaceMark
Подходит для: распознавания ориентиров лица
FaceMark — это мощный API для распознавания черт лица. Он обнаруживает до 68 точек-ориентиров (фронтально) и до 35 точек (в профиль).
Базовый план предлагается бесплатно. Пользователи могут выбирать между планами за 18, 65 и 250 долларов.
15. Deep Face Detect
Подходит для: архитектуры глубокой нейронной сети
API Deep Face Detect основан на глубокой нейронной сети и имеет множество функций. Он распознает пол, ориентиры лица, очки, растительность на лице, позы, качество изображения и т. д.
Пользователи могут выбирать между бесплатным базовым планом, планом за 29, 99 и 249 долларов.
Сводка
API | Рефейс Счет | % Точность | Задержка | Лучший для | Цена |
---|---|---|---|---|---|
Кайрос | 8,6 | 62% | 1344 мс | Поиск лиц и обнаружение признаков | Фримиум |
Аниметрикс | 9,7 | 100% | 2688 мс | Распознавание лиц на основе глубокого обучения | Фримиум |
Лямбда Лабс | 9,5 | 99% | 1045 мс | Распознавание лиц, определение пола и признаков | Фримиум |
Инфердо | 9,8 | 100% | 906 мс | Распознавание лиц с оценкой возраста | Фримиум |
Luxand. cloud | 8,8 | 94% | 1301 мс | Обнаружение и сравнение человеческих лиц | Фримиум |
Распознавание глаз | 8,4 | 99% | 4763 мс | Распознавание лиц по биометрии | Фримиум |
Лицо++ | 9,5 | 99% | 147 мс | Извлечение информации о лице из изображений | Фримиум |
Макгайвер | 7,9 | 74% | 7693 мс | Распознавание лиц и сравнение | Бесплатно |
Компьютерное зрение Microsoft | 8,9 | 96% | 889 мс | Обработка содержимого из изображений | Фримиум |
БетаФейс | 9,0 | 81% | 2312 мс | Распознавание лиц и трансформация | Фримиум |
Полный список API распознавания лиц: почетные упоминания
- Facereact извлекает значимые события из видеопотоков в реальном времени;
- Cloud Vision API — Google использует предварительно обученный Vision API для распознавания текста, обнаружения движений и т. д.;
- Facebook Face Recognition API автоматически предлагает идентификационные теги для загруженных фотографий;
- Обнаружение лиц и черты лица обеспечивают точные координаты обнаруженных лиц;
- Классификация изображений NSFW помогает обнаруживать и помечать обнаженный, неприемлемый контент или контент для взрослых;
- AWSRekognition, разработанный Amazon, обеспечивает анализ изображений и видео на основе алгоритмов глубокого обучения;
- Alception — разработчик искусственного интеллекта, специализирующийся на глубоком обучении;
- Face Analysis Cloud Engine распознает лица и позы, оценивает пол, возраст и эмоции на фотографиях;
- IBM Watson Visual Recognition — это инструмент на основе глубокого обучения для обнаружения сцен, анализа объектов и другого содержимого изображений; снято с производства;
- Распознавание лиц — HiBrainy представляет собой набор API-интерфейсов для проверки, распознавания лиц и идентификации;
- Распознавание возраста от Everypixel определяет возраст, используя базу данных из 300 000 изображений;
- Face Match обрабатывает метаданные лица;
- FaceX работает с компаниями, предоставляющими свои инструменты для бизнес-приложений;
- Meerkat Facial Recognition — это точное, быстрое, масштабируемое и гибкое программное обеспечение для обнаружения и распознавания лиц;
- Sparshik FaceAPI предоставляет различные инструменты для проверки лица, безопасности и рекламы.
10 лучших API распознавания лиц
Эта статья подготовлена командой Eden AI . Мы разрешаем вам тестировать и использовать в производстве большое количество движков ИИ от разных поставщиков напрямую через наш API и платформу . Вы являетесь поставщиком решений и хотите интегрировать Eden AI, свяжитесь с нами по телефону: [email protected]
Intro:
В этой статье мы рассмотрим, как легко интегрировать механизм распознавания лиц. в вашем проекте и как выбрать и получить доступ к правильному движку в соответствии с вашими данными.
Определение:
Обнаружение лиц — это компьютерная технология на основе искусственного интеллекта, которая используется для извлечения и идентификации лиц людей из цифровых изображений. Технология обнаружения лиц использует машинное обучение и алгоритмы для извлечения человеческих лиц из больших изображений; такие изображения обычно содержат множество объектов, не являющихся лицами, таких как здания, пейзажи и различные части тела.
История:
Первыми пионерами распознавания лиц были Вуди Бледсо, Хелен Чан Вульф и Чарльз Биссон. В 1964 и 1965 Бледсо вместе с Вольфом и Биссоном начал работу по использованию компьютеров для распознавания человеческого лица.
Только в конце 1980-х мы увидели дальнейший прогресс в разработке программного обеспечения для распознавания лиц как жизнеспособной биометрии для бизнеса. В 1988 году Сирович и Кирби начали применять линейную алгебру к проблеме распознавания лиц.
В 1991 году Терк и Пентланд продолжили работу Сировича и Кирби, обнаружив, как обнаруживать лица на изображении, что привело к первым случаям автоматического распознавания лиц. Гранд-вызов по распознаванию лиц (FRGC) был запущен в 2006 году с целью продвижения и продвижения технологии распознавания лиц, предназначенной для поддержки существующих усилий по распознаванию лиц в правительстве США. По оценкам FRGC, новые алгоритмы были в 10 раз более точными, чем алгоритмы распознавания лиц 2002 года, и в 100 раз более точными, чем алгоритмы 19-го века. 95, демонстрирующий достижения технологии распознавания лиц за последнее десятилетие.
С 2010-х годов Facebook, Apple, Amazon, Google и другие крупные технологические компании разработали свои собственные механизмы обнаружения лиц, и распознавание лиц демократизировано во многих областях.
Варианты использования:
Вы можете использовать распознавание лиц во многих областях, вот несколько примеров распространенных вариантов использования:
- Реклама: распознавание лиц позволяет сделать рекламу более целенаправленной, делая обоснованные предположения о возрасте и пол
- Здравоохранение: распознавание лиц можно использовать для диагностики заболеваний, вызывающих заметные изменения внешности
- Маркетинг: распознавание лиц можно использовать для подсчета количества людей (достатка) и определения того, улыбаются люди или нет, молодые или старые, мужчины или женщина и т. д.
- Другое извлечение лица: анализируйте черты лица толпы, такие как: цвет глаз, носа, рта, цвет кожи, прическа и цвет и т. д.0027
Microsoft Azure —
Доступно по номеру Eden AI
Служба Azure Face предоставляет алгоритмы искусственного интеллекта, которые обнаруживают, распознают и анализируют человеческие лица на изображениях. Программное обеспечение для распознавания лиц важно во многих различных сценариях, таких как проверка личности, бесконтактный контроль доступа и размытие лица для обеспечения конфиденциальности. Распознавание лиц требуется в качестве первого шага во всех остальных сценариях. API обнаружения обнаруживает человеческие лица на изображении и возвращает прямоугольные координаты их местоположения. Он также возвращает уникальный идентификатор, представляющий сохраненные данные о лицах, которые используются в последующих операциях для идентификации или проверки лиц.
Доступен на Eden AI
Imagga
Imagga — компания, занимающаяся искусственным интеллектом в области компьютерного зрения. Imagga Image Recognition API включает автоматическую пометку, автоматическую категоризацию, распознавание лиц, визуальный поиск, модерацию контента, автоматическую обрезку, извлечение цвета, индивидуальное обучение и готовые к использованию модели. Доступно в облаке и локально. В настоящее время он развернут в ведущих решениях по управлению цифровыми активами, персональных облачных платформах и приложениях для потребителей.
Google Cloud —
Доступно на Eden AI
Обнаружение лиц обнаруживает несколько лиц на изображении вместе с соответствующими ключевыми атрибутами лица, такими как эмоциональное состояние или ношение головного убора. Vision API может выполнять обнаружение функций в локальном файле изображения, отправляя содержимое файла изображения в виде строки в кодировке base64 в тексте вашего запроса.
Доступно на Eden AI
Face++
Технология распознавания лиц ++ может автоматически распознавать личности людей по изображениям и видео. Наша технология широко используется в безопасности, распознавании VIP-клиентов, пометке фотографий и входе в систему по лицу. Face++ обнаруживает и находит человеческие лица на изображении и возвращает высокоточные ограничивающие рамки лица. Обнаружение лиц — это первый шаг к анализу и обработке лиц. Face++ также позволяет сохранять метаданные каждого обнаруженного лица для использования в будущем.
AWS —
Доступно на Eden AI
Amazon Rekognition может распознавать лица на изображениях и видео. В этом разделе рассматриваются операции без хранения для анализа лиц. С помощью Amazon Rekognition вы можете получить информацию о том, где на изображении или видео были обнаружены лица, ориентирах лица, например о положении глаз, и об обнаруженных эмоциях (например, о том, выглядите ли вы счастливыми или грустными). Когда вы предоставляете изображение, содержащее лицо, Amazon Rekognition обнаруживает лицо на изображении, анализирует лицевые атрибуты лица, а затем возвращает процент достоверности для лица и атрибутов лица, обнаруженных на изображении.
Доступно по номеру Eden AI
DeepAI
Миссия DeepAI — ускорить переход мира к искусственному интеллекту, предлагая ИИ. агент, которого любой может научить выполнять задачу, а также сделать последние исследования и информацию более доступными с помощью DeepAI. Их API для обнаружения лиц обнаруживает и распознает лица на любом изображении или видеокадре. Используя глубокую нейронную сеть, обученную на маленьких, размытых и затененных лицах всех возрастов, этот сервис может автоматически обнаруживать лица с высоким уровнем точности.
Clarifai
Clarifai — ведущий поставщик искусственного интеллекта для неструктурированных изображений, видео и текстовых данных. Мы помогаем организациям преобразовывать свои изображения, видео и текстовые данные в структурированные данные значительно быстрее и точнее, чем люди могли бы сделать это самостоятельно. Их современная модель распознавания лиц может различать лица на основе лишь небольшого количества образцов изображений. Технология выравнивания и трансформации позволяет автоматически распознавать лица под любым углом.
Доступно по номеру Eden AI
FaceX
FaceX предоставляет компаниям платформу для удобного внедрения распознавания лиц в свои приложения. Его универсальность позволяет разработчикам интегрировать API-интерфейсы высокоточного распознавания лиц и SDK с помощью всего нескольких строк кода. .
Kairos
Kairos предлагает разработчикам и предприятиям по всему миру современное этичное распознавание лиц. Kairos — компания, занимающаяся искусственным интеллектом, специализирующаяся на распознавании лиц. Благодаря компьютерному зрению и машинному обучению Kairos может распознавать лица на видео, фотографиях и в реальном мире, что упрощает преобразование способов взаимодействия вашего бизнеса с людьми.
Sightengine
Sightengine — это компания, занимающаяся искусственным интеллектом, которая расширяет возможности разработчиков и предприятий. Наша мощная технология анализа изображений и видео основана на запатентованных современных системах глубокого обучения и доступна через простые и понятные API. Их конечная точка распознавания лиц обнаруживает и позиционирует лица в режиме реального времени. Эта конечная точка полезна, если вам нужно определить, содержат ли изображения или видео видимые лица людей.
DeepFace (бонус — с открытым исходным кодом)
DeepFace — это система распознавания лиц с глубоким обучением, созданная исследовательской группой Facebook. Он идентифицирует человеческие лица на цифровых изображениях. Программа использует девятислойную нейронную сеть с более чем 120 миллионами весов соединений и была обучена на четырех миллионах изображений, загруженных пользователями Facebook. Deepface — это легкая платформа для распознавания лиц и анализа атрибутов лица (возраст, пол, эмоции и раса) для Python. Это гибридная система распознавания лиц, обертывающая современные модели : VGG-Face, Google FaceNet, OpenFace, Facebook DeepFace, DeepID, ArcFace и Dlib.
Эксперименты показывают, что люди имеют точность 97,53% в задачах распознавания лиц, тогда как эти модели уже достигли и преодолели этот уровень точности.
Мультиоблачный подход
Если вам нужен модуль распознавания лиц, у вас есть 2 варианта:
- Первый вариант: существует несколько механизмов распознавания лиц с открытым исходным кодом, их можно использовать бесплатно. Некоторые из них могут быть эффективными, но их сложно настроить и использовать. Использование библиотеки искусственного интеллекта с открытым исходным кодом требует опыта работы с данными. Кроме того, вам нужно будет настроить внутренний сервер для запуска движков с открытым исходным кодом.
- Второй вариант: вы можете использовать движки вашего облачного провайдера. На самом деле, облачные провайдеры, такие как Google Cloud, AWS, Microsoft Azure, Alibaba Cloud или IBM Watson, предоставляют несколько механизмов искусственного интеллекта, часто включая распознавание лиц. Этот вариант выглядит очень просто, потому что вы можете оставаться в известной среде, где у вас могут быть способности в вашей компании, и движок готов к использованию.
Единственный способ выбрать подходящего провайдера — сравнить механизмы разных провайдеров с вашими данными и выбрать лучший ИЛИ объединить результаты движков разных провайдеров. Вы также можете сравнить цены, если цена является одним из ваших приоритетов, а также вы можете сделать это для скорости.
Этот метод является лучшим с точки зрения производительности и оптимизации, но он представляет много неудобств:
- вы можете не знать всех эффективных провайдеров на рынке
- вам нужно подписаться и заключить договор со всеми провайдерами
- вам нужно освоить каждого документация по API поставщиков
- вам необходимо проверить их цены
- вам необходимо обработать данные в каждом движке, чтобы реализовать эталонный тест
Вот где Eden AI становится очень полезным. Вам просто нужно подписаться и создать учетную запись Eden AI, и у вас есть доступ ко многим механизмам поставщиков для многих технологий, включая распознавание лиц. Платформа позволяет вам сравнивать и визуализировать результаты от разных движков, а также позволяет вам иметь централизованную стоимость использования разных поставщиков.
Eden AI предоставляет один и тот же простой в использовании API с одинаковой документацией для каждой технологии. Вы можете использовать Eden AI API для вызова механизмов распознавания лиц с провайдером в качестве простого параметра. С помощью всего нескольких строк вы можете запустить свой проект в производство:
Тест и API:
Вот код на Python (репозиторий GitHub), который позволяет протестировать Eden AI для распознавания лиц:
Eden AI Python SDK: Обнаружение лиц
Ответ:
Платформа:
Eden AI также позволяет сравнивать эти механизмы непосредственно в веб-интерфейсе без необходимости кодирования:
Платформа Eden AI: Распознавание лиц
Платформа Eden AI: Распознавание лиц ответ
6 90 Вывод:
На рынке представлено множество двигателей NER: невозможно знать их все, знать тех, которые обеспечивают хорошую производительность.