×
Текущее положение машинного интеллекта (Machine Intelligence Landscape)

Последние три месяца я провела, изучая каждый стартап, посвященный искусственному интеллекту, машинному обучению или обработке данных, который только можно было найти. На данный момент мой список насчитывает 2529 подобных стартапов. Да, мне следовало бы заниматься чем-то более интересным в вечернее время и по выходным, но все же…

 

Зачем это делать?

 

Несколько лет назад инвесторы и стартапы гонялись за big data (я помогала составить ландшафт отрасли). Сейчас мы видим похожий всплеск образования компаний, называющих себя искусственный интеллект, машинное обучение или что-то в этом роде – все вместе я называю это «машинный интеллект» (я поясню значение позже). Наш фонд Bloomberg Beta, который фокусируется на будущем разработок, инвестирует в подобные проекты. Я создала этот ландшафт, чтобы начать добавлять стартапы в контексте их направления – так гораздо проще обнаружить переполненные области и увидеть пробелы.

 

Что все-таки означает «машинный интеллект»?

 

Под машинным интеллектом я имею в виду термин, которым другие называют машинное обучение и искусственный интеллект. (Некоторые уже использовали этот термин прежде, не объясняя его и не понимая, сколько разговоров было о терминологии прежде.)

 

Я бы предпочла избежать новых терминов, но когда я пробовала употреблять «искусственный интеллект» или «машинное обучение», оба оказались слишком узконаправленными. Когда я говорила «искусственный интеллект», многие задавались вопросом, подходит ли эта компания под описание «истинного ИИ», когда я называла «машинное обучение», многие считали, что я несправедлива к большинству «ИИ-подобных» проектов как к разновидностям сферы глубокого изучения (deep learning). Народ сразу придумал «машинный интеллект» – так я и очутилась здесь.

 

Компьютеры обучаются думать, писать и читать. Они также перенимают сенсорные способности человека – возможность видеть и слышать (вероятно, в меньшей степени, осязать, чувствовать запах и вкус). Технологии машинного интеллекта охватывают огромный массив различных видов проблем (от классификации и кластеризации до обработки естественного языка и компьютерного видения) и методов (от машин опорных векторов до deep belief networks). Все эти технологии отражены в ландшафте.

 

Что этот ландшафт не включает, несмотря на всю важность, это технологии big data. Некоторые используют этот термин для обозначения все того же искусственного интеллекта и машинного обучения, но для своего ландшафта я хочу сфокусироваться на интеллектуальных методах, а не на данных, хранении и вычислительных кусочках головоломки (хотя, конечно, искусственный интеллект основан на обработке данных).

 

Текущее положение машинного интеллекта

 

Какие компании составляют ландшафт?

 

Я учитывала тысячи компаний, но хотя график и переполнен, это всего лишь маленькая подгруппа огромной экосистемы. Критерии приема были на уровне тех, что устанавливают в Йельском университете или в Гарварде, и, возможно, настолько же произвольные.

 

Я постаралась включить компании, которые используют методы машинного интеллекта в качестве основной части своих технологий. Многие из этих компаний принадлежат сразу нескольким секторам, но ради упрощения я постаралась сохранить компании в их основной сфере и классифицировать в соответствии с тем, как они сами себя характеризуют (не придираясь к тому, действительно ли компания использует обработку естественного языка в соответствии со своим описанием).

 

Размышления о ландшафте

 

Недавно мы видели несколько отличных статей о том, почему машинный интеллект переживает возрождение, описывающие факторы, которые повлияли на этот процесс. (Кевин Келли, например, ведет подсчет дешевых систем параллельных вычислений, больших наборов данных и лучших алгоритмов). Я сфокусировалась на понимании экосистем на уровне «компания-компания» и составлении выводов из этого.

 

Да, это правда, машинный интеллект меняет корпорации, отрасли и людей в равной степени.

 

На высоком уровне легко понять, почему машинный интеллект так важен, но это не было так, пока я не выяснила, что на самом деле делают эти компании, и я начала обращать внимание на то, насколько они уже изменили мир вокруг нас.

 

Кевин Келли выразил это так: «Бизнес-планы следующих 10 000 стартапов легко предсказуемы: возьмите X и добавьте к нему ИИ».

 

Во многих случаях вам даже не нужно брать X – машинный интеллект непременно изменит существующие отрасли, но также создаст и совершенно новые.

 

Машинный интеллект приводит к созданию приложений, которых мы от него ожидаем, таких как автоматизированные помощники (Siri), восхитительные роботы (Jibo) и идентификация по фото (как высокоэффективное, но, к сожалению, названное DeepFace). Однако он также делает неожиданное: защищает детей от секс-трафика, уменьшает количество химикатов в латуке, который мы едим, помогает заказать через интернет туфли, которые идеально подходят к ступне, и разрушает видеоигры 80-х.

 

Многие компании будут приобретены.

 

Я была удивлена, обнаружив, что более 10 % подходящих (не публичных) компаний на слайде были приобретены. Это был абсолютный контраст со сферой больших данных, которую я исследовала, где в то время было всего несколько приобретений. Никто не удивится, если я раскрою, что главным покупателем стала Google, хотя в общей сложности было более 15 различных покупателей компаний из моего графика. По моим догадкам, к концу 2015 вторые 10 % будут раскуплены почти полностью. За мысли насчет того, какие именно из них будут раскуплены в следующем году, вам придется скрутить мне руку...

 

Но компании имеют непропорциональные преимущества, особенно те, которые изготавливают пользовательские продукты.

 

Гиганты поиска (Google, Baidu), социальные сети (Facebook, LinkedIn, Pinterest), контент (Netflix, Yahoo), мобильные устройства (Apple) и электронная коммерция (Amazon) находятся на невероятных позициях. В их распоряжении огромные наборы данных и постоянное взаимодействие с пользователями, что дает доступ к отзывам пользователей для усовершенствования их алгоритмов (и вместе эти факторы создают мощную сеть) – и им есть для чего использовать возможности, которые дает искусственный интеллект.

 

Лучшие в своем классе алгоритмы персонализации и рекомендации позволили этим компаниям достичь успеха (это одновременно впечатляет и обескураживает, когда Facebook предлагает добавить в друзья человека, в которого вы когда-то были влюблены в колледже, а Netflix подсовывает рекламу того самого идеального ситкома для вас). Сейчас они все сошлись в битве на новом поприще: переход на мобильные устройства. Завоевание этого сектора требует огромных ресурсов в области ИИ: высококлассный голосовой интерфейс (как Siri от Apple), визуальный поиск (FireFly от Amazon) и динамическая вопросно-ответная технология, которая предлагает вам правильные ответы вместо многочисленного набора ссылок (все поисковые компании стараются этого избежать). Крупные корпорации (IBM, Microsoft) также добились удивительных результатов в этой области, хоть у них и нет таких требований по взаимодействию с людьми, но они акцентируют свое внимание на областях предоставления знаний в больших отраслевых наборах данных, таких как приложение IBMWatson для помощи в диагностике больных.

 

Таланты в новой лиге ИИ.

 

Последние 20 лет большинство умов в области машинного интеллекта работали в научно-исследовательских институтах (особенно это касается продвинутых типов ИИ). Они разрабатывали новые виды машинного интеллекта, но всего лишь несколько из них получили применение в реальных условиях и имели практическую ценность.

 

Сейчас же приложения, использующие продвинутые методы машинного интеллекта, такие как deep belief networks и иерархические нейронные сети, начинают решать реальные мировые проблемы, и мы видим, как талантливые исследователи из академического мира перебираются в корпорации. Facebook наняла профессора из Нью-Йоркского университета Яна Лекуна (Yann LeCun)  и Роба Фергюса (Rob Fergus) для работы в своей ИИ-лаборатории, Google наняла Джеффри Хинтона (Geoffrey Hinton) из университета Торонто, а Baidu переманила к себе Эндрю Ын (Andrew Ng). Важно знать, что они продолжают работать на академическое сообщество (одно из условий лаборатории Лекуна – продолжать работу над ключевыми исследованиями для сообщества, Хинтон тратит половину рабочего времени на преподавание, Ын сделал машинный интеллект более доступным с помощью Coursera). Но становится ясно, что большинство тяжеловесов постепенно покидают научно-исследовательский мир.

 

Для выдающихся умов области лаборатории корпораций предлагают не только хорошие зарплаты и доступ к «крестным отцам» отрасли, но и, что самое важное, доступ к данным. Эти лаборатории предоставляют ученым доступ к таким наборам данных, которых они ни за что не увидели бы в других местах (наборы данных ImageNet фантастические, но не сравнятся с тем, чем располагают Facebook, Google и Baidu).

 

В результате мы скоро станем свидетелями того, как корпорации становятся источником инноваций в области машинного интеллекта и нанимают все больше аспирантов и докторов наук, которые иначе остались бы в академическом мире.

 

Дивиденды мира.

 

Большие компании имеют неотъемлемое преимущество, и похоже, что те из них, кому удастся выиграть гонку машинного интеллекта, станут еще более могущественными. Однако хорошая новость для всего остального мира заключается в том, что ключевые технологии, которые они разработают, быстро распространятся на другие области благодаря уходу некоторых талантов и публикуемым исследованиям.

 

Аналогично с революцией в области big data, которая была вызвана выходом работ Google BigTable и BigQuery, мы увидим, как корпорации выпускают настолько же новаторские технологии в общество. Эти инновации будут адаптированы в новых отраслях и сферах применения, которые компании вроде Google не замечают или не хотят замечать.

 

Возможности для предпринимателей

 

«Моя компания занимается глубоким изучением в области X».

 

Эти несколько слов сделают вас более популярными в 2015. Конечно, в случае, если они будут достоверны. Глубокое изучение – золотая жила в области машинного интеллекта, которой уделяется больше всего внимания. Google, Facebook и Baidu достигли потрясающих результатов с методами решения задач визуального и голосового восприятия, как и стартапы вроде Enlitic, которые также показали многообещающие результаты.

 

Возможно, это станет затасканной фразочкой, вызывающей волнение от ожидаемых результатов и бизнес-моделей, но в отличие от большинства компаний, утверждающих, что они занимаются «big data», гораздо проще будет указать на суть, применив эту терминологию, если вы этим действительно занимаетесь. Наиболее впечатляющим в методах глубокого изучения является то, что, применяя их с должным уровнем  осторожности, они могут заменить то, что называется интуицией, которая приходит из опыта применения функций автоматического обучения.

 

Как инвестор, который интересуется возможностями наискорейшего применения методов обработки данных и машинного обучения, я не имею времени ждать, чтобы увидеть, какие творческие проблемы пытаются решить практики глубокого изучения. Я полностью согласна с Джеффом Хоукинсом (Jeff Hawkins), когда он говорит, что большинство убойных приложений (killer applications), использующих эти технологии, подкрадутся незаметно. Я намереваюсь в полной мере сохранять разум открытым.

 

Acqui-hiring (поглощение ради найма сотрудников) как бизнес-модель.

 

Говорят, что ученые в сфере обработки данных являются единорогами из-за их нехватки. Однако на фоне нехватки талантов в области машинного интеллекта может показаться, что таких ученых в избытке. В области обработки данных у многих специалистов опыт работы в индустрии насчитывает десятки лет. Наиболее мощные работы в сфере машинного интеллекта проводились только в научно-исследовательских институтах. Такие таланты невозможно вырастить за одну ночь.

 

Такая нехватка талантов является благом для родоначальников индустрии, которые на самом деле понимают машинное обучение. Многие компании в сфере получат раннее финансирование, потому что уже есть признаки того, что эксперты в области машинного интеллекта обойдутся в пять раз дороже экспертов в других областях (возьмите, к примеру, Deep Mind, где цены за голову эксперта варьировались от $5 до $10 млн, если рассмотреть его в контексте acqui-hiring’а).

 

Многие друзья в шутку спрашивали меня: «Шивон, скажи, я должен просто собрать всех своих умных друзей в сфере ИИ и назвать это компанией?»

 

Если честно, я не знаю, что им на это ответить. (В Bloomberg Beta мы скорее станем поддерживать компании, строящиеся с долгосрочной перспективой, но это не значит, что это не станет прибыльной стратегией для многих предприимчивых основателей.)

 

Хороший демообразец представляет несоразмерно большую ценность в машинном интеллекте.

 

Я помню, как наблюдала за Watson, играющим в Jeopardy (телевизионная викторина). Когда он боролся в начале, я чувствовала искреннее сожаление. Когда он начал обыгрывать своих конкурентов, я заулыбалась, как будто это были Toronto Maple Leafs (хоккейный клуб НХЛ) в финале Кубка Стэнли. (Пояснение: 1) в то время я работала в IBM и испытывала склонность к своей команде; 2) Maple Leafs за всю мою жизнь ни разу не вышли в финал – пока – так что это было чисто гипотетически.)

 

Какое значение имеют все эти внушительные демонстрации? Последняя волна технологических компаний до первичного размещения (IPO) не имела демо, которые кто-нибудь мог бы оценить, так зачем они нужны компаниям в сфере машинного интеллекта? Последняя волна компаний была компьютероподобной: базы данных, корпоративные приложения и тому подобные. Конечно, я бы хотела видеть в 10 раз более производительные базы данных, но большинству все равно. Машинный интеллект выигрывает и проигрывает на демо вот почему: 1) технология очень человечна, чтобы вдохновить, вызвать шок или трепет; 2) бизнес-модели, как правило, требуют какое-то время, чтобы сформироваться, так что им нужно больше финансирования на долгосрочной основе, чтобы позволить определить свое направление; 3) они являются фантастическими приманками для поглощения. Watson побеждает лучших в своем деле людей в пустяках, несмотря на то что он думал, будто Торонто – это город в США. DeepMind отодвинул людей на задний план в состязаниях по видеоиграм, Vicarious распознал CAPTCHA. Есть еще несколько компаний, пока незаметных, которые обещают впечатлить еще больше, и я не могу дождаться, чтобы это увидеть.

 

Автор: Shivon Zilis

 

Перевод: Ксения Манасова

 

Оригинал фото: shivonzilis