×

7 Апреля 2017 13:08
3058
0

Слушайте подкаст программы:

 

«В 2015 участвовали в чемпионате MegaFace между командами и лабораториями, компаниями, которые занимаются темой распознавания лиц, - в нём участвовало больше 90 компании и научных лабораторий, из самых известных это, наверное, Google, которые несколько лет занимались темой распознавания лиц, выступая на различных конференциях, презентовали свои алгоритмы. Также там был Пекинский университет - в общем, все ведущие, наверное, команды, которые занимаются этой темой в мире. И неожиданно для себя мы победили. Неожиданно, потому что очень многие компании этим занимались 10 лет …».


«Если конкурс MegaFace – это было соревнование команд по базе 1 миллион фотографий, то приложение FindFace у нас работает на базе больше 200 миллионов лиц, то есть в 200 раз больше, чем самый крупный конкурс по распознаванию лиц».

 

«Как только мы победили в конкурсе и запустили FindFace, об этом стали по всему миру говорить. Мы получили, наверное, 2 тысячи запросов от различных компаний со всего мира. Мы выбрали фокус на модель B2B, потому что увидели здесь огромный спрос. Прошлой осенью мы запустили свой первый продукт облако, который позволяет осуществлять распознавание лиц, это такое enterprise решение для крупных заказчиков. Кто эти клиенты? У нас очень широкий разброс. От банков, сферы безопасности, онлайн-бизнеса и ритейла до казино, сферы развлечений и т.д... Мы сейчас довольно активно пилотируем, у нас больше 50 пилотов».

 

«Для нас принципиально важный момент был следующий - мы ребятам дали свободу творчества. Мы не ставили задачу, что нам нужен какой-то конкретный продукт, мы говорили именно про то, что нам нужна революционная технология. Давайте попробуем сделать прорыв, а способ его продать мы найдём уже потом. Икогда мы начинали заниматься распознаванием лица, мы не понимали этого рынка вообще. Сейчас, конечно, мы понимаем и знаем игроков, знаем, какие разные сценарии используются, какой спрос на это. Когда мы это начинали, это было чистое творчество. Я начинал как инвестор, это высокий риск. Мы, конечно, общались с командой, понимали, что они толковые люди, но нам тоже здесь немножко повезло».


Полная расшифровка интервью:

 

JSON.TV: Представьте, что вы пришли в магазин, а информационная система знает уже вас практически все: ваше имя, фамилию, ваши привычки, и может сделать вам предложение, от которого вам сложно отказаться. Либо другая ситуация: произошло преступление, камеры зафиксировали людей, которые находились рядом, и правоохранительные органы тоже получили информацию об этих людях. Правда, здорово? У меня сегодня в гостях находится человек, который понимает, что IT – революция происходит, давайте ее возглавим. Мне очень приятно представить сооснователя компании NtechLab Александра Кабакова. Александр, здравствуйте.


Александр Кабаков: Добрый день.

 

JSON.TV: Вы согласны, что IT революцию лучше возглавить?

 

Александр Кабаков: Да, конечно.

 

JSON.TV: Давайте познакомься с компанией, чем она занимается?

 

Александр Кабаков: Компания NTechLab была основана два года назад моим партнёром Артёмом Кухаренко, который отвечает за техническую часть и является руководителем лаборатории. Мы обсуждали возможности нейронных сетей и пришли к выводу, что есть возможность создать компанию, которая будет заниматься различными алгоритмами. Сейчас тема - то, что называется нейронные сети, deep learning, искусственный интеллект - очень модная в мире, не просто модная, а видно, как она меняет целые индустрии. Как эти новые классы алгоритмов меняют различные отрасли. Выбирали, чем заняться, каким направлениям, думали, может быть, распознаванием товара заняться, чем-то ещё, но, поскольку у Артёма ещё в университете тема диплома была распознавание лиц, решили, что начнём с распознавания лиц, тем более, что такая яркая история может быть. Основали компанию, набрали команду очень талантливых разработчиков. Артём – выпускник МГУ ВМК, все остальные – физтех, ВМК, топовые в российские вузы. Так получилось, что достаточно быстро, в конце позапрошлого года, мы представили первую версию алгоритма FindFace.

 

JSON.TV: То есть, FindFace – это ваш продукт?

 

Александр Кабаков: Да. Мы участвовали в чемпионате MegaFace между командами и лабораториями, компаниями, которые занимаются темой распознавания лиц.

 

JSON.TV: FindFace распознает лица?

 

Александр Кабаков: Да. Собственно, FindFace – это алгоритм и продукт, на основе которого происходит распознавание лиц. Поучаствовали в чемпионате MegaFace, в нём участвовало больше 90 компании и научных лабораторий, из самых известных это, наверное, Google, которые несколько лет занимались темой распознавания лиц, выступая на различных конференциях, презентовали свои алгоритмы. Также там был Пекинский университет - в общем, все ведущие, наверное, команды, которые занимаются этой темой в мире. Неожиданно для себя мы победили. Неожиданно, потому что очень многие компании 10 лет этим занимались…

 

JSON.TV: Обошли Google?

 

Александр Кабаков: Да. А тот же Google покупал там компании по распознаванию лиц в течение нескольких лет.

 

JSON.TV: Александр, я правильно понимаю, что победа в таком конкурсе – это не субъективная какая-то составляющая, а это просто тупая цифра, точность прогноза?


Александр Кабаков: Да. Это конкурс, который проводился Вашингтонским университетом, и, собственно, мерилось сравнение алгоритмов, точность поиска по большим базам. Большие базы в понимании тех людей, которые занимались распознаванием лиц на тот момент – это был миллион человек. Мы сейчас пошли гораздо дальше. Мы практически сразу после конкурса запустили такой демонстратор технологий, приложение FindFace. Если кто не видел – ты можешь сделать фотографию человека, и приложение говорит тебе его аккаунт в социальной сети ВКонтакте. Если конкурс MegaFace – это было соревнование команд по базе 1 миллион фотографий, то приложение FindFace у нас работает на базе больше 200 миллионов лиц, то есть в 200 раз больше, чем самый крупный конкурс по распознаванию лиц. После этого мы начали получать со всего мира огромное количество писем…

 

JSON.TV: Александр, давайте суммируем: ваша заслуга состоит в том, что вы не только создали алгоритм, который распознает лица, но ещё и работает с большим количеством фотографий, так? С большой базой?

 

Александр Кабаков: Да. Вообще, про тему распознавания лиц говорили уже давно, много и так далее. И раньше был такой криминалистический подход: были различные компьютерные программы, которые пытались мерить расстояние между глазами, пытались мерить размер рта, носа и так далее.

 

JSON.TV: Как то описывать объекты, вводить какие-то метрики…

 

Александр Кабаков: Мы, применив нейронную сеть, ушли от этого подхода и, фактически, благодаря этому как раз повысили очень сильно точность. Помимо точности было ещё несколько моментов, которые мешали развитию. Мы сейчас раз общаемся с различными казино, с различными компаниями, которые занимаются решениями по безопасности для ФБР, полиции разных стран и так далее, Interpol, и помимо точности… Ну, условно говоря, ставили какой-то алгоритм, тестировали в казино, и он распознает, в лучшем случае, каждого 20-го. Во-вторых, была скорость работы, то есть они ставили камеру, и сам процесс поиска по базе, например, мошенников, например, 10 тысяч мошенников, осуществлялся часами. Соответственно, человек уже пришел, ушел, а его только распознали.


JSON.TV: Итак, раньше было 20 %, вы сказали, точность…

 

Александр Кабаков: Нет,  20 %, может быть, и меньше,… Второй момент – это время поиска. У нас как раз второй прорыв был в том, что время поиска, в частности, по базе в 10 млн. фотографий, у нас меньше секунды. Это как реактивный самолёт по сравнению с другими алгоритмами. И третий момент – это были вычислительные мощности, которые требовались. Они, как следствие первых двух. У нас нейронная сеть формирует очень компактный вектор признаков лица, то есть алгоритм находит по фотографии лицо и переводит его в числа. У нас лицо описывается 80 числами. Это очень маленький файл. Другие, например, алгоритмы используют 10 тыс. признаков, а у нас набор из 80 чисел. Этот файл меньше килобайта.  Это позволяет делать распознавание лица общедоступным. Это такая революция именно с тем, что не просто мы какой-то точности добились, а с тем, что мы его сделали доступным, таким, который можно поставить в каждую камеру, в каждый смартфон полицейскому, в каждый магазин и так далее.

 

JSON.TV: Александр, я правильно понимаю, что вы инвестируете в этот проект?

 

Александр Кабаков: Я начинал этот проект как инвестор, но потихоньку втянулся, и сейчас активно участвую, являюсь управляющим партнёром.

 

JSON.TV: Поговорим про бизнес составляющую. Кто потенциальные потребители вашего алгоритма? 

 

Александр Кабаков: Как я уже сказал, как только мы победили в конкурсе и запустили FindFace, об этом стали по всему миру говорить. Мы получили, наверное, 2 тысячи запросов от различных компаний со всего мира. Мы как раз выбрали фокус не b2c модели, а модель b2b, потому что увидели, что есть огромный спрос. Прошлой осенью мы запустили свой первый продукт облако, который позволяет осуществлять распознавание лиц, это такое enterprise решение для крупных заказчиков. Кто эти клиенты? У нас очень широкий разброс. От банков, которым это нужно... В банковской сфере огромное количество сценариев, где это может использоваться: подтверждение различных транзакций в мобильном или Интернет-банке, определение VIP-клиентов, например, на входе в отделение, различные дополнения скорингу, проверки, когда человеку выдают кредит, проверяют не только паспортные данные, а проверяют ещё, не вклеил ли он фотографию в чужой паспорт. То есть один человек приходит с разными паспортами. И так далее. Огромное количество.


JSON.TV: Хорошо, финансовая сфера…

 

Александр Кабаков: Дальше. Сфера безопасности. Огромное количество применений. Сейчас основной рынок распознавания лиц в так называемых е-гейтах, то есть системах автоматического прохождения границы. Сейчас по всему миру все биометрическое сообщество, то есть это отпечатки пальцев, радужка и распознавание лиц, оно к биометрии относится, по всему миру занимается лоббированием этих систем автоматического прохождения границы, с обоснованием того, что это более эффективный способ проверки, и с точки зрения логистики тоже более удобный, не надо держать большой штат миграционных офицеров и так далее. В Европе в очень большом количестве стран сейчас эти е-гейты ставятся, в Штатах появляются, во многих странах. Потом используется такой алгоритм: вы кладёте паспорт на этот е-гейт, дальше он сравнивает вашу фотографию в паспорте и вас перед этим е-гейтом и говорит, тот или не тот человек. Если алгоритм уверен, что тот, то пропускает, если не уверен, то отправляет на очный контроль.  Огромный рынок, к 2020-му году он будет больше 1 млрд. $, и софт по распознаванию лиц очень большой кусок занимает. Дальше.

 

JSON.TV: Можно спросить про retail, интересует ли данная тематика его или нет?

 

Александр Кабаков: Да. Следующая тема – это retail, казино и entertaiment. Эти отрасли заинтересованы в том, чтобы собирать данные о покупателях. Сейчас, в эпоху, когда традиционный retail проигрывает e–коммерсу , то есть е-коммерс очень сильно растёт, вытесняет из каких-то сегментов очень сильно, соответственно, становится ключевым быть competitive, конкурентным по сравнению с е-коммерсом. А главное – в чем преимущество Интернет-торговли? Оно не только в удобстве, оно ещё и в том, что Интернет-торговля позволяет эффективно собирать данные о покупателях. Как только человек зашёл на сайт, мы уже о нем очень много знаем. Дальше мы можем вести его историю покупок, что он смотрит, осуществлять ретаргетинг, когда вы зашли на сайт, кроссовки посмотрели, дальше вас с этими кроссовками задолбают просто в течение месяца.

 

Всё это благодаря технологии распознавания лиц можно сделать в оффлайн. Человек заходит, мы его распознали, зафиксировали в базу данных, посмотрели, есть он в базе данных или нет, если есть, то, соответственно, смотрим, какие у него были покупки, если нет, создаем новый профиль. Более того, это решает проблему персональных данных. Нас часто спрашивают, а персональные данные и так далее? Как раз наоборот, с использованием распознавания лиц мы уходим от персональных данных. Вам теперь, чтобы получить скидки, не нужно в магазине заполнять карточки, писать свой номер паспорта, согласие на обработку персональных данных, телефон оставлять. Просто зашли, а у магазина хранится 80 чисел о вашем лице и всё. Их расшифровать просто невозможно, потому что они не связаны никак ни с вашим телефоном, ни с e-mail, а магазин про вас всё знает. Дальше может быть огромное количество сценариев. Рекомендации на кассе. Вы, например, не покупали зубную щетку два месяца, он предложит её купить.


JSON.TV: Создается что-то вроде умного помощника для сотрудников магазина?

 

Александр Кабаков: Или если это какой-то, например, магазин электронной техники, человек покупал iPhone, то сразу предложить ему наушники. Сразу продавцу подсказывается. Когда вы, например, в маленьком каком-то магазине, в который вы ходите каждый день, вас уже знают, вам уже что-то предлагают. Соответственно, мы можем сделать, чтобы каждая retail-сеть будет такой же, как такие магазины у дома, в котором продавец вас лично знает.

 

JSON.TV: Здорово, Александр. Я правильно понимаю, что где-то год прошел с момента запуска FindFace и разработки алгоритма?

 

Александр Кабаков: Да, FindFace как демонстратор технологий, такое игрушечное приложение было запущено в прошлом феврале, основной продукт у нас запустился в ноябре.

 

JSON.TV: Сейчас уже есть какие-то результаты, кейсы, что-то можно озвучить, привести пример?

 

Александр Кабаков: Мы сейчас довольно активно пилотируем, у нас сейчас больше 50 пилотов. И проведено уже тоже порядка 50. Что-то через облако, что-то мы приезжаем на место с камерами и так далее. Сферы применения очень разные, например, мы делаем очень большой проект для международного онлайнового сервиса по верификации фотографий. Для различных сервисов, социальных сетей, сайтов знакомств критично, чтобы люди были со своими фотографиями, чтобы они не использовали чужие, не использовали фотографии звёзд.

 

JSON.TV: А, понятно.

 

Александр Кабаков: Или даже не звёзд, просто каких-то людей. Куча скандалов, когда просто брали аккаунт человека и делали копию, дальше добавляли людей в друзья, просили деньги и так далее. Здесь даже не нужно быть как хакером, просто иметь достаточно смекалки, загрузить чужие фотографии, добавить его друзей себе в друзья и начать просить деньги. Кто-нибудь да пришлёт. Это верификация фотографий, подтверждение, проверка их по базам селебрити и так далее. Это очень критично. С казино довольно активно, мы подписали соглашение с одним из застройщиков приморской игровой зоны компанией Dimond Fortune, буквально вчера мы анонсировали, что подписали соглашение с компанией BSS, это один из лидеров различных IT-решений для банковского сектора. Мы будем делать продукт для систем банковского обслуживания. Это подтверждение различных транзакций, заход в кабинеты клиента и так далее. Мы очень активно двигаемся. У нас сейчас в ритейле несколько пилотов идёт и так далее.

 

JSON.TV: А в целом, какова ситуация в России с этим рынком высокотехнологичных решений, допустим, распознавания лиц?

 

Александр Кабаков: Мы же не только в России, у нас как раз фокус на мир. Опять-таки, то, что я говорил, система прохождения границы автоматически. Мы сейчас работаем с двумя ведущими компаниями в этой отрасли. Провели тестирования, активно двигаемся. У нас очень сильные партнёры в Китае, в Турции. В Турции несколько больших проектов по безопасности. С криминальной полицией обсуждается, с миграционной службой, потому что у них проблема беженцев. Вплоть до австралийских парков различений, которые хотят сделать такое приложение: у них проблема, ходят фотографы, фотографируют людей с Микки Маусом, в кафе и так далее, опять-таки, есть и камеры на аттракционах, и эти фотографии надо продавать. Там же не сразу, фотограф сфотографировал, это как-то не сразу происходит. Поэтому они предложили сделать приложение, если человек зашёл в парк, сделал селфи, и дальше везде, где его сфотографировали, ему приходит в приложение эти фотографии. За 10 $.

 

Кейсов  миллион. Это практически любой бизнес процесс, где задействован человек, может быть использовано распознавание лица. Мы сейчас расширяем функционал, то есть у нас алгоритм развивается не только в сторону улучшения ключевых характеристик, таких как точность, скорость работы и так далее, но он развивается вширь. У нас, например, появляется история, связанная с lifeness. Это очень критично, особенно в области безопасности. Когда вы, например, подтверждаете финансовую транзакцию, алгоритм должен быть уверен, что это живой человек, а не вы поднесли фотографию. Но фотография ещё легко, потому что там мимика есть, а если, например, ты подставляешь видео, это уже сложнее.


JSON.TV: То есть там ещё нужно классифицировать живой – неживой?

 

Александр Кабаков: Да. Потом уже определяем пол, возраст, эмоции. Это тоже очень важно, опять-таки, для ритэйла. Самый простой кейс – это ставится камера на вход, и мы понимаем всю демографию.


JSON.TV: С каким настроением покупатель покинул магазин…

 

Александр Кабаков: Не только. Это точный подсчет покупателей, сколько человек зашло, сколько человек купило, плюс их пол, возраст. У вас уже большая информация, если вы ещё знаете их эмоции – вообще отлично. Для ритэйла это ещё очень большое количество внутренних кейсов. Контроль сотрудников, чтобы они улыбались, когда разговаривают с покупателями. Дальше просто подсчет рабочего времени. Мы не можем раскрывать, к сожалению, но мы с одним международным брендом, у них сеть магазинов одежды по России, у них задача по подсчету рабочего времени сотрудников, сколько кто ходит курить и так далее. Это очень важно. Соответственно, ставится камера, и по распознаванию лица мы смотрим, сколько человек провел конкретно на рабочем месте.

 

JSON.TV: Ваше решение, наверное, помогает идентифицировать человека?

 

Александр Кабаков: Да. 

 

JSON.TV: Александр, а если не секрет, какая точность сегодня, если какие-то рекорды, в вашем случае, распознавания?

 

Александр Кабаков: Зависит от условий. Условно говоря, у нас, например, на базе MegaFace была точность 73 %, сейчас где-то 85 %.

 

JSON.TV: То есть, если взяли 100 фотографий, 85 определили, что это идентифицировано?

 

Александр Кабаков: Да. Здесь зависит от размера базы данных. По базе данных ВКонтакте 200 млн. фотографий мы определяем с точностью 70 %. Это то, что искомый человек будет на первом месте поиска. Надо понимать, что не из десяти семь, а из 10 тысяч 70 % будет распознано наверно. При этом этот показатель растёт постоянно. Конечно, задача, чтобы всех распознавал сразу.

 

JSON.TV: А какой самый большой вызов был при создании этого решения, алгоритма для вас, для компании?


Александр Кабаков: Я думаю, что большой вызов – это то, что мы сделали такую революцию в работе с большими массивами, потому что все, кто… Мы об этом тоже не очень задумывались. Мы с Артемом обсуждали, что, на самом деле, есть такой важный момент, связанный с тем, что то, что мы делаем реально революционно для людей, которые занимаются распознаванием лица. До этого они жили в парадигме использования распознавания лиц по верификации, то есть сравнение двух пар фотографий. Это как раз используется в е-гейтах, ты сравниваешь две фотографии. Человек перед этим е-гейтом и человек внутри. Или, опять же, для фэйс логина и подтверждения финансовых транзакций нужно только сравнение двух пар фотографий.

 

Мы пошли шире. За счет того, что мы начали алгоритм обучать поиску по большим базам данных, мы получили не только большую точность, но и вот в этом сценарии, когда сравниваются две фотографии, у нас тоже очень высокий результат, хотя мы под него не затачивались. Для нас важный момент – это то, что мы ребятам дали свободу творчества. Мы не ставили задачу, что нам нужен какой-то конкретный продукт, мы говорили именно про то, что нам нужна такая революционная технология. Давайте попробуем сделать прорыв. Мы найдём потом способ его продать. Важно, когда мы начинали заниматься распознаванием лица, мы не понимали этого рынка вообще.

 

Сейчас мы понимаем и знаем игроков, знаем, какие разные сценарии используются, какой спрос на это. Когда мы это начинали, это было чистое творчество. Я начинал как инвестор, это высокий риск. Мы, конечно, общались с командой, понимали, что они толковые люди, но нам тоже здесь немножко повезло.

 

JSON.TV: Александр, что вас вдохновляет в этом направлении? Помните тот момент, когда вы решили, что я хочу инвестировать сюда либо часть своей жизни посвятить этому?

 

Александр Кабаков: Я думаю, тот момент, когда мы победили в конкурсе. В этот момент мы поняли, что это не просто какая-то локальная прикольная вещь, не просто какая-то история, на которой можно заработать немного денег. Мы поняли, что это большая ниша, мы там можем быть серьезным игроком в глобальном масштабе. Если мы изначально так к этому относились, что у нас есть Артём, очень талантливый парень, сильная команда, они что-то прикольное делают. Они сейчас что-нибудь сделают, дальше посмотрим, что с этим делать. В момент, когда мы победили Google, победили Пекинский университет, команды, которые годами и десятилетиями занимаются этой темой, мы поняли, что это большая история. У меня, в частности, есть разные бизнесы, и я сейчас ими не занимаюсь практически, сейчас концентрировался на NtechLab, потому что это такой большой международный проект.

 

JSON.TV: Александр, здорово. Спасибо, вам огромное, что нашли время, пришли к нам в студию, поделились потрясающими достижениями. Искренне рад за вашу команду, желаю развития, конечно же, хороших кейсов, продаж.

 

Александр Кабаков: Спасибо.

 

JSON.TV: Мне очень приятно напомнить, что у нас сегодня в гостях был сооснователь компании NtechLab Александр Кабаков. Всего доброго, до свидания.