×

28 Мая 2017 23:44
1648
0

Слушайте подкаст программы:

 

«На протяжении нескольких лет мы делали распознавание фотографий вручную, но затем, накопив огромный набор фотографий,  мы поняли, что технологии двигаются вперёд и пора переходить на новый уровень. Мы разработали систему, в основе которой используются нейронные сети. Мы прогнали весь наш объем фотографий с размеченными на них продуктами через определённую нейронную сеть, обучили её, и сейчас она может сама автоматически определять, какие продукты изображены на фотографиях. Зная это, мы уже можем посчитать наличие товаров на полке в определённый момент времени, долю полки каждого бренда, соответствие выкладки полнограмме...». 

 

«Полевой сотрудник ритейлера или FMCG производителя приходит в магазин, заполняет так называемый дневной отчёт в своем КПК. На дневной отчёт человек тратит около 20 минут. Что представляет собой дневной отчёт? Это ряд вопросов по выполнению стандартов выкладки, а нейронные сети позволяют на эти вопросы отвечать автоматически. Как человек делал раньше? Заходил, заполнял, тратил 20 минут времени. Как это можно делать сейчас? Полевой сотрудник приходит, делает фотографии выкладки, и система буквально за считанные минуты говорит ему, где товар выставлен неправильно, какие критерии не соблюдены, что ему необходимо поправить. И об этом также знает головной офис, потому что информация сразу же централизованно попадает туда со всех торговых точек …»

 

«Любой наш проект начинается с пилота. Пилотный проект, как правило, длится один – два месяца. Во время его мы обучаем нейронную сеть вручную, чтобы она распознавала продукты требуемой категории…Нейронная сеть работает в два этапа. Первый этап – на вход поступают фотографии и нейронная … рисует прямоугольнички на продуктах, определяя, где расположены эти продукты на полке. Второй этап – это image recognition, распознавание продуктов в тех квадратиках, которые нарисовала нейронная сеть. Оба эти этапа достаточно сложны, на обоих этапах необходимо обучать свою нейронную сеть».

 

«Что касается ERP-систем, как правило, мы интегрируемая с SFA системами (Sales Force Automatio), но у нас имеется отдельное мобильное приложение, оно более лёгкое, не такое сложное как SFA, и которое помогает делать фотографии. Далее это поступает к нам на сервер, обрабатывается, и мы уже выдаем результаты в требуемом заказчиком виде. Как правило, самый простой – это Excel, плюс, если необходимо, мы интегрируемся с текущими базами данных. Все зависит от того, какая система стоит у заказчика».

 

«Есть категории, которые поддаются распознаванию. Как правило, легче всего распознаются, поддаются распознаванию продукты в твёрдой упаковке. Есть продукты в мягкой упаковке, такие, как корма, печенье и так далее, они распознаются не так хорошо, но их тоже можно распознавать. Но есть такие категории как, например, колбаса, я сейчас говорю про фудовые категории, про продукты питания, эти категории распознать практически невозможно, потому что колбасы очень много, они лежат всегда по-разному на полке, особенно в традиционной рознице. Сейчас нет алгоритмов, которые их распознают. Что касается одежды, ситуация аналогичная. Из not food хорошо распознается бытовая химия, потому что это твёрдые упаковки, коробки, пузырьки».


Полная расшифровка интервью:

 

JSON.TV: Давайте представим, что вы владеете ритейлерской сетью, и возникает такой вопрос: а вы знаете, что у вас находится на полке? Ну, наверное, знаете, только есть три аспекта: эта информация полностью отражает ситуацию, она поступает к вам своевременно и она объективна? Вот у меня в студии находится человек, который знает ответы на эти три вопроса и обещает, что информация будет вовремя поступать, будет объективной и, соответственно, полной. Давайте знакомиться. Мой собеседник – генеральный директор компании Streetbee Кирилл Непомнящий. Здравствуйте.

 

Кирилл Непомнящий: Геннадий, здравствуйте. Спасибо, что пригласили к вам в офис. Позвольте, наверное, коротко представить, рассказать о компании…

 

JSON.TV: Да,давайте начнём с вашей компании, чем же она занимается?

 

Кирилл Непомнящий: Компания называется Streetbee, мы занимаемся полевыми исследованиями на базе краудсорсинга, это такая достаточно новая тема на нашем рынке. По сути, мы используем простых потребителей, которые через наше мобильное приложение выполняют небольшие задачки, которые представляют из себя, например, проверить наличие на полке, переписать цену, сделать фотографии, выкладки, и за это получать небольшое вознаграждение.

 

JSON.TV: Я правильно понимаю ситуацию: вы говорите, что обычный человек фотографирует полку и что, эти фотографии через приложение отправляются, да?

 

Кирилл Непомнящий: Да.

 

JSON.TV: Что происходит дальше?

 

Кирилл Непомнящий: По сути, FMCG производители дают нам задачи для того, чтобы мы делали различные проверки, проверили наличие товаров на полке, долю их продукции на полке либо соответствие выкладки полнограмме. Мы это формируем в небольшие задачи для наших потребителей, выкладываем это в виде небольших заданий в нашем мобильном приложении. По сути, человек, когда он идёт, например, за хлебом либо за водой в магазин, он видит эти задания в нашем мобильном приложении, выполняет их. Задание занимает, как правило, от 5 до 15 минут, за что получает небольшое вознаграждение. Мы получаем эти данные, агрегируем и предоставляем заказчику.

 

JSON.TV: А вот что происходит дальше, в каком виде вы получаете данные?

 

Кирилл Непомнящий: Как правило, мы просим людей сделать фотографии, чтобы это не занимало много времени, далее мы эти фотографии обрабатываем и, скажем так, отцифровываем, то есть мы по фотографиям посмотрим, есть ли товар на полке, какова доля выкладки производителя против конкурентов, соответствует ли выкладка полнограмме, которую хочет производитель.

 

JSON.TV: А, то есть вы распознаете фотографии, что на них находится…


Кирилл Непомнящий: Правильный вопрос вы задали. На самом деле, на протяжении нескольких лет мы делали распознавание фотографий вручную, но затем, накопив огромный набор фотографий,  плюс эти фотографии уже были размечены, то есть на фотографиях было отмечено, какие SKU (SKU– это продукты) на полке расположены, сколько их и так далее. Мы, по сути, поняли, что технологии двигаются вперёд и пора переходить на новый уровень. Мы разработали систему, в основе которой используются нейронные сети. Мы прогнали весь наш объем фотографий с размеченными на них продуктами через определённую нейронную сеть, обучили её, и сейчас эта нейронная сеть может сама автоматически определять, какие продукты изображены на фотографиях и, зная это, мы уже можем посчитать наличие товаров на полке в определённый момент времени, долю полки каждого бренда, соответствие выкладки полнограмме, что также является очень важным, потому что компания должна быть уверена, что выполняются стандарты.

 

JSON.TV: То есть это практически в мгновение происходит, есть фотографии и есть метрики, показатели, о которых вы сказали?

 

Кирилл Непомнящий: Абсолютно верно. Всё это благодаря, на самом деле, последним технологиям, искусственному интеллекту. Не знаю, может быть, об этом немножечко коротко…

 

JSON.TV: Давайте, да, расскажите.

 

Кирилл Непомнящий: Искусственный интеллект – всем слово, наверное, давно известное. Имеется большой подраздел искусственного интеллекта – это машинное обучение. По сути, машинное обучение использует в своей основе так называемые нейронные сети. Нейронные сети – название и структура, которая была унаследована от человеческого мозга, который также состоит из нейронов. На вход каждого нейрона поступают сигналы, и нейрон на выходе также выдает определённый сигнал. Нейронные сети бывают различных видов, структуры. Бывают одноуровневые, бывают многоуровневые. Многоуровневые системы уже называются, для тех, кто, скажем так, более продвинутый в этом, глубокими нейронными сетями…

 

JSON.TV: Отлично. У нас есть некие исторические данные, и мы обучили алгоритм, дальше начинаем распознавать фотографии, идея понятна. А вот мне, как бизнесмену, к чему нужно быть готовым в общении с вами? Представьте, у меня есть ритейлерская сеть, я говорю: Кирилл, я действительно хочу знать, что у меня происходит на полках, а то знаете, через неделю приходит информация, она устарела уже, товара уже нету, а у меня его покупают…

 

Кирилл Непомнящий: Я начну с того, что расскажу, кому это нужно сейчас. Есть подраздел машинного обучения – это компьютерное зрение, которое сейчас имеет широкое применение как за рубежом, так у нас. А в частности, компьютерное зрение можно применять как для FMCG производителей, так и для ритейлеров. Что касается FMCG производителей, для них очень важно понимать, находится ли товар на полке, какова доля полки их как производителя. Что касается ритейлеров, для них также важно соблюдать стандарты полнограммы и также важно знать, находится ли нужный продукт на полке. Наши заказчики, потребители данной технологии являются ритейлерами и производителями. Для производителей также эта технология может быть использована их полевым персоналом.

 

Как работает это сейчас? Полевой сотрудник приходит в магазин, заполняет так называемый дневной отчёт в своем КПК. На дневной отчёт человек тратит около 20 минут. Что представляет собой дневной отчёт? Это ряд вопросов по выполнению стандартов выкладки, а нейронные сети позволяют на эти вопросы отвечать автоматически. Как человек делал раньше? Заходил, заполнял, тратил 20 минут времени. Как это можно делать сейчас? Полевой сотрудник приходит, делает фотографии выкладки, и система буквально за считанные минуты говорит ему, где товар выставлен неправильно, какие критерии не соблюдены, что ему необходимо поправить.

 

JSON.TV: Самому сотруднику в поле?

 

Кирилл Непомнящий: Абсолютно. И об этом также знает головной офис, потому что информация сразу же централизованно попадает со всех торговых точек в офис. Также очень большим плюсом данной системы является то, что это хорошо дисциплинирует полевой персонал, потому что сотрудник, делая фотографию, знает, что за ним, скажем так, уже приглядывают.

 

JSON.TV: Получается, что у нас есть решение не только для контроля, но ещё как умный помощник, который помогает персоналу в поле выполнять свой функционал?

 

Кирилл Непомнящий: Абсолютно верно. Плюс это значительная экономия времени сотрудника на заполнение данного дневного отчёта. Более того, даже как бы мы не обучали полевых сотрудников, как правило, у крупных FMCG производителей этих сотрудников тысячи, десятки тысяч и, порой, компания делает все, чтобы обучить данных сотрудников стандартам выкладки, но некоторые сотрудники могут понимать это не так, как хотелось бы, а здесь система имеет единую методологию, которая закладывается в голову этой системы, в процессор.

 

JSON.TV: Кирилл, давайте суммируем. Я правильно понимаю, что есть решение для краудсорсинга, когда обычный покупатель может пользоваться этим приложением и выполнять задания, которые он получает. Есть и другое решение именно для бизнеса?

 

Кирилл Непомнящий: Вы правильно понимаете, решений два. Одно – это использование нашего крауда, наших потребителей для того, чтобы они собирали информацию с полок, и плюс к этому мы прикрутили нейронную сеть и машинное обучение. По сути, человек приходит в магазин, делает фотографию, и наша нейронная сеть автоматически обрабатывает эту фотографию, выдает требуемый KPI. Второе решение – когда мы отдаем компании– ритейлеру или FMCG производителю только решение по автоматическому распознаванию изображений или продуктов на полке. Тем самым они снижают время, затрачиваемое персоналом на то, чтобы заполнить дневные отчёты. Второе – они увеличивают свои стандарты выкладки, в частности, решают проблему с отсутствием товаров на полке.

 

JSON.TV: Кирилл, давайте проиграем ситуацию вхождения, как начинается с вами общение, какие-то основные вехи. Представим, что я владелец ритейлерской сети, прихожу и говорю: Кирилл, заинтересовало. Что дальше?

 

Кирилл Непомнящий: На самом деле, любой наш проект начинается с пилотного проекта. Пилотный проект, как правило, длится один – два месяца. Во время данного пилотного проекта мы обучаем нейронную сеть, чтобы она распознавала продукты требуемой категории, потому что мы не можем распознавать сразу же всё, потому что первое обучение мы делаем вручную, то есть люди получают фотографии на вход…

 

JSON.TV: То есть нужно ранжировать эти фотографии?

 

Кирилл Непомнящий: Не ранжировать, скажем так, их нужно помечать, разметить. Как работает нейронная сеть? Она работает в два этапа. Первый этап – на вход поступают фотографии и одна нейронной сети должна локализовать эти продукты, говоря простым человеческим языком, она рисует прямоугольнички на продуктах, то есть она определяет, где расположены эти продукты на полке. Второй этап – это image recognition, распознавание продуктов в тех квадратиках, которые нарисовала нейронная сеть. И оба эти этапа достаточно сложны, и на обоих этапах необходимо обучать свою нейронную сеть. То есть одна нейронная сеть должна а) уметь локализовать продукт, определить на полке и б) нейронная сеть должна определить, что это за продукт в данном выделенном прямоугольнике, и эту нейронную сеть необходимо обучать для каждой категории, для каждого SKU.

 

JSON.TV: Вы говорите, что это где-то месяц уходит?

 

Кирилл Непомнящий: Как правило, в среднем, месяц. Что касается ERP-систем, как правило, мы интегрируемся с SFA системами, это sales force automation системы, но у нас имеется отдельное мобильное приложение, оно более лёгкое, оно не такое сложное, как SFA системы. Это приложение, которое позволяет людям делать фотографии, в данном мобильном приложении есть определённый помощник, который говорит, как необходимо делать фотографии. Человек, например, работая в SFA системе, нажимает на кнопку "сделать фотографию", и система перекидывает его в наше мобильное приложение. Человек делает фотографию или фотографии и нажимает кнопку "отправить". Далее это поступает к нам на сервер, обрабатывается, и мы уже выдаем результаты в требуемом заказчиком виде. Как правило, самый простой – это Excel, плюс, если необходимо, мы интегрируемся с текущими базами данных. Все зависит от того, какая система стоит у заказчика.

 

JSON.TV: Хорошо. Продукты, йогурты научились распознавать, а, не знаю, одежду можно?

 

Кирилл Непомнящий:  Боюсь, что одежды очень много. Есть категории, которые поддаются распознаванию. Как правило, легче всего распознаются, поддаются распознаванию продукты в твёрдой упаковке. Есть продукты в мягкой упаковке, такие, как корма, печенье и так далее, они распознаются не так хорошо, но их тоже можно распознавать. Но есть такие категории как, например, колбаса, я сейчас говорю про фудовые категории, про продукты питания, эти категории распознать практически невозможно, потому что колбасы очень много, они лежат всегда по-разному на полке, особенно в традиционной рознице. Сейчас нет алгоритмов, которые их распознают. Что касается одежды, ситуация аналогичная.

 

JSON.TV: Отлично, есть вызов для математиков, для data scientist'ов, научиться распознавать колбасу на полке.

 

Кирилл Непомнящий:  Согласен. Но вот из not food хорошо распознается бытовая химия, потому что это твёрдые упаковки, коробки, пузырьки.

 

JSON.TV: Кирилл, как дальше будет все развиваться, какие есть идеи в плане вашего бизнеса, может быть, какие-то новые направления, сферы хотите попробовать?

 

Кирилл Непомнящий:  Я думаю, что мы будем продолжать развивать наше направление распознавания изображений, будем накапливать объемы данных, будем обучать нейронные сети, будем увеличивать качество распознавания. Сейчас, на самом деле, оно уже на уровне 95 % и больше.

 

JSON.TV: 95 % – потрясающе!

Кирилл Непомнящий:  Да. Наша специфика в том, что мы объединили автоматику и ручной труд. Всегда, когда происходит распознавание изображений, в этом участвуют оператор, который добивает те 5 %, при этом, со временем, чем больше, дольше мы работаем с категорией, тем меньше работы оператора требуется, потому что нейронная сеть обучается, она начинает работать все лучше и лучше.

 

JSON.TV: То есть вы её как бы дообучаете?

 

Кирилл Непомнящий:  Да, во время пилотного проекта мы обучаем нейронную сеть и доводим качество её распознавания примерно до 95 %. Далее, когда происходит go life или запуск проекта, мы все фотографии, которые получаем от полевого персонала, от наших сотрудников, пропускаем через нас и обязательно проверяем качество распознавания. Присутствует оператор, у которого есть определённый индикатор, допустим, вот этот продукт распознался, вероятность того, что это тот продукт, который нам нужен, 70 %, к примеру, подсвечивается, например, оранжевым цветом. Сидит оператор, который обязательно проверяет такие узкие места, в которых нейронная сеть не уверена. В каких-то продуктах, например, нейронная сеть не уверена на 20 %, следовательно, оператор корректирует и сохраняет это, обратная связь поступает нейронной сети, что это тот продукт, который нужен, и тем самым со временем качество нейронной сети для тех случаев, которые мы не покрыли в пилотном проекте, мы это исправляем, корректируем, и нейронная сеть обучается все лучше и лучше. По сути дела, в конце она должна давать результат 97 – 98 %.

 

JSON.TV: Кирилл, действительно серьезная проблема в том, что, получается, владельцы, руководители не знают, что у них происходит в магазине?

 

Кирилл Непомнящий:  Действительно такая проблема существует. Это связано с тем, что, во-первых, торговых точек очень много, во-вторых, полевой персонал на эти торговые точки приходит один раз в неделю или даже, зачастую, и один раз в две недели. Полевой персонал, как правило, сложно проконтролировать до конца, из-за этого возникает некачественность выкладки, какие-то несоответствия, плюс, как я уже говорил, существует проблема отсутствия товара на полке. Этот товар может быть в запасе, например, в магазине, он может лежать где-то в подсобке, но этот товар просто не был выложен на самой полке. Это приводит к тому, что приходит потребитель за своим любимым йогуртом или водой, а его не оказывается на полке. От этого компания теряет в своих продажах. Это проблема, с которой борются по всему миру. Полка – это конечное звено в этой цепочки. Естественно, наличие продуктов на полке зависит от логистики и других процессов, но полка – это конечное звено, откуда потребитель берет продукты, откуда приходят продажи. Поэтому я считаю, что это одно из наиболее важных звеньев.

 

JSON.TV: Насколько решения, связанные с использованием нейронных сетей, сейчас популярны? Какова ситуация реальная, объективная?

 

Кирилл Непомнящий:  На самом деле, ситуация следующая: нейронные сети существовали уже несколько десятков лет, но совсем недавно, года два назад, появились так называемая сверточные нейронные сети. Они позволили решать поставленные задачи, в том числе, связанные с компьютерным зрением, гораздо быстрее и дешевле. С появлением этих сверточных нейронных сетей технологии сделали значительный скачок. Благодаря этому действительно сейчас различные компании начинают применять все больше, начинает появляться все больше применений, использований нейронных сетей, как для распознавания лиц, распознавания документов, распознавания письменного текста, распознавания продуктов на полке, и не только распознавания.

 

JSON.TV: Как пришли в эту сферу?

 

Кирилл Непомнящий:  Честно говоря, я достаточно много лет я работал в компании Accenture, сам по образованию я инженер, закончил Бауманский университет. Хорошо закончил. После компании Accenture я проработал порядка трёх – четырёх лет компании ВТБ Капитал инвестиционным аналитиком, и в какой-то момент я понял, что есть силы и возможности организовать собственную компанию. Собственно говоря, с этого все началось. Компанию мы запустили в 2013-м году, за три года мы начали работать с большинством крупнейших FMCG производителей, ритейлеров на рынке, таких, как Mars, Unilever, Nestle , RoyalCanin, Henkel и другие, и продолжаем хорошо развиваться, хорошо идти благодаря нашему подходу и инновационным технологиям.

 

JSON.TV: А та идея, которая сейчас вами развивается, она самого начала была такой – придумать решение для того, чтобы…

 

Кирилл Непомнящий:  Изначально решение было просто собирать информацию с использованием краудсорсинга. Эта идея до сих пор развивается, имеет очень большую актуальность за счёт того, что мы работаем с людьми напрямую, и она имеет ряд преимуществ по сравнению с традиционными методами. Естественно, сейчас существуют традиционные агентства, которые занимаются практически тем же, они собирают информацию, но они делают это дольше, не все могут делать это на всей географии. Мы, по сути, за счёт того, что используем потребителей, можем использовать потребителей в любой точке России и стран СНГ и, на самом деле, пока мы не вышли на Запад, но на Западе сможем также аналогично собирать информацию. Эту информацию мы собираем значительно дешевле, потому что мы выкладываем эти задания и, как минимум, экономим на транспортных расходах, потому что люди находятся рядом с теми магазинами, где нам необходимо собирать информацию. Плюс запуск любого проекта требует от нескольких часов до одного дня, потому что достаточно просто публиковать наши задания в мобильном приложении и всё, оповестить людей об этом, люди пойдут выполнять задания.

 

JSON.TV: А что вас привлекает вашей деятельности?


Кирилл Непомнящий: Больше всего, конечно же, мне нравится то, что мы пока небольшая, но быстро растущая компания, и любое решение, любая наша гипотеза может значительно повлиять на ход нашего бизнеса. К сожалению, такого я не смог ощутить, работая в больших компаниях. Там ты являешься маленьким звеном большой цепи. Здесь ты большое звено, пока в небольшой компании, но в быстрорастущей, и это, конечно, привлекает. Другие эмоции, живём ради эмоций, это и нравится.

 

JSON.TV: Хорошо. Кирилл, искренне благодарю вас за то, что нашли время, пришли к нам в студию, рассказали о столь неожиданном использовании нейронных сетей, а именно для задач ритэйла, как получить достоверную, объективную и оперативную информацию о том, какие товары находятся на полках. Всяческого развития, и мне очень приятно напомнить, что у нас сегодня в гостях был генеральный директор компании StreetbeeКирилл Непомнящий. Всего доброго, до свидания.