×

27 Июля 2015 10:25
5230
0

«У всякого поисковика есть специфические методы привлечения аудитории и передачи её бизнес-игрокам. Набор методов постоянно меняется, поэтому, чтобы продвигаться на поисковой платформе, надо иметь специалиста, знакомого с комбинацией методов, которые использует именно она. Бизнес-процесс слежения за поисковиками хозяин сайта может построить сам, взяв в штат оптимизатора. Как-то мы довольно долго вели клиента, захватили для него все десятки Google, а потом обучили его людей, и он продолжил сам», — Игорь Ашманов поделился секретами превращения поисковика в бизнес-инструмент.

 

«В социальных сетях нет поиска. Решая эту проблему, мы, сделали «Крибрум» — поисковик по блогам и записям в сетях, позволяющий анализировать их довольно глубоко. Это корпоративный продукт — В2В. Крупные и средние компании наблюдают за упоминаемостью своих брендов, продуктов, председателей правления, а мы вычисляем тональность отзывов о них».

 

«Большие данные», собираемые в Интернете или мобильными операторами, нельзя обработать вручную и одномоментно просмотреть: они необозримы. Для понимания big data взгляд на целое гораздо важнее, чем на части. Например, сидя в своём аккаунте в Facebook, вы видите написанный кем-то комментарий, но не знаете, что он одновременно вброшен ещё в 30 тысяч мест. А если смотришь с высоты птичьего полёта, вооружившись механизмом определения дублей, сразу ясно: это вброс. Если аккаунт участвует в информационной атаке, распространяя какую-то фальшивку, то можно, конечно, предположить, что человеку просто интересно. Но если знаешь, что он задействован в 95-ти из 100 исследованных тобой атак, значит, это, скорее всего, бот или тролль».

 

«Большие данные» о людях накапливаются в социальных сетях, где можно не только вычислить ботов и троллей, но и узнать всё и о каждом. Сейчас за каким-то студентом нет никакого смысла следить, а через 15 лет он будет управлять страной. Тогда можно, условно говоря, посадить команду из 30-ти человек, которая поднимет все сведения о нём и превратит в рапорт куда надо… Пора привыкать вести себя по-другому».

 

«Рейтинг — это идеологическое оружие», «нам лингвистика ни для чего не нужна — всё решает вычислительная мощь», «кто-то эксплуатировал родную компанию в своих политических целях» — об этом и многом другом в полной версии видеоинтервью Игоря Ашманова.

 

Ведущий — Сергей Корзун

 

Справка JSON.TV

Персональный профайл

 

Ашманов, Игорь Станиславович.

Родился в Москве 9 января 1962 года.

В 1983 году окончил механико-математический факультет МГУ. Имеет степень кандидата технических наук. Предметная область диссертации — прикладная лингвистика.

С 1985 года сотрудник Отдела искусственного интеллекта ВЦ АН СССР.

С 1987 разрабатывал систему проверки правописания ОРФО в компании «Информатик», а с 1991 руководил разработкой.

С 1995 года — совладелец и генеральный директор компании «МедиаЛингва».

С 1999 года директор по разработке и исследованиям, а затем исполнительный директор интернет-холдинга «Рамблер».

В 2001 году создал и возглавил компанию «Ашманов и партнёры».

В 2004 году совместно с партнёрами открыл компании «Поисковые технологии» и «Наносемантика»,  а в 2010 — компанию "Крибрум".

 

Полная расшифровка видеоинтервью:

 

JSON.TV: Всех приветствую! Это JSON.TV. Я Сергей Корзун. Сегодня в гостях у нас культовый персонаж российской интернет-действительности Игорь Ашманов. Здравствуйте, Игорь Станиславович!

 

Игорь Ашманов: Здравствуйте!

 

JSON.TV: Много чего было в Вашей жизни, но база — математическая. Более того, семейная база: и бабушка, и мама, и папа, по преданию, — все мехматовцы.

 

Игорь Ашманов: И сын только что окончил мехмат. Четвертое поколение. У меня был один однокурсник, гораздо круче. У него родители были с мехмата, но он еще и родился прямо на мехмате, в санчасти. Точнее, начал рождаться на мехмате, потом его подняли в санчасть на геологическом факультете.

 

JSON.TV: Не удержусь: сегодня мехмат — это тот же мехмат, та же фирма, или фирмá, как говорили, что и в советское время?

 

Игорь Ашманов: Есть разные мнения. Есть мнение, что мехмат уже не тот. Это мнение распространяют люди, которые превозносят матфак во ВШЭ«Высшей школе экономики»). Я считаю, что примерно тот же. Там был разрыв между поколениями, когда 30-летних, 40-летних почти не было — в 1990-е и в начале 2000-х. Сейчас он постепенно заклеивается. Там уже довольно много сильных преподавателей среднего возраста. А легендарные старики там есть до сих пор. Многие, кто учил меня 35 лет назад, учили и моего сына.

 

JSON.TV: Не устаревают знания, кстати говоря, в математике?

 

Игорь Ашманов: База в математике не может устареть. Есть такой известный анекдот: «Мехмат отзывает 10 тысяч своих выпускников с 1983-го по 1993-й год в связи с тем, что в учебнике Фихтенгольца на сотой странице обнаружена ошибка в формуле, в ряде Лоренца». База не устаревает. Есть довольно много попыток преподавать математику по-новому, более круто. Но в реальности что там можно преподавать по-другому? Куда денется дифференциальное исчисление? И потом там сейчас много молодых преподавателей. На мой взгляд, там всё хорошо. Я наблюдал сейчас, как заканчивал сын. Там много очень умной, талантливой молодежи, они гораздо лучше нас. Потому что они более энергичные, более раскованные, более добрые. Они мне больше нравятся, чем мои сокурсники и я сам в те годы. Хотя надо понимать, что мехмат – это довольно специфическое место. Там, наверное, каждый второй или каждый третий странный, аутичный, с придурью. Я и сам такой, и друзья мои все такие. Это нормально для математика.

 

JSON.TV: А в мире тот же мехмат? Можно сравнить в России и в мире? МГУ где-то в районе сотого места, плюс-минус, в этих рейтингах.

 

Игорь Ашманов: Я потратил время и прошел по многим страницам, ссылкам, пока не добрался до методики одного такого рейтинга, когда МГУ был на 186-м месте. Рейтинг – это, конечно, идеологическое оружие. И методика, которая там была использована, далеко не легкодоступна, хотя она не секретная, просто была глубоко закопана. В этом рейтинге, во-первых, довольно большой вес имел индекс Хирша или какой-то другой индекс цитирования. Этого достаточно, чтобы наши университеты не могли занять там никакого места, потому что на Западе университеты заняты научной деятельностью, а у нас, как правило, наука вынесена в академии наук, а университет в гораздо большей степени просто образовательное учреждение. В наших университетах ученые, конечно, занимаются наукой, но такого количества публикаций в принципе не может быть. Во-вторых, большой вес имели такие странные факторы, как большое количество иностранцев среди преподавателей, наличие выпускников университета в менеджменте транснациональных корпораций, которые, как мы знаем, концентрируются в совершенно других местах планеты, и еще 40% — просто экспертная оценка. А поскольку эксперты там понятно какие, я даже потом взял этот самый индекс цитирования, походил по таблицам и обнаружил, что он на самом деле распадается на несколько почти не связанных между собой компонентов. Наивысший индекс цитирования — у американцев, потом есть небольшая ступенька — европейская наука, причем там довольно большая ступенька к Восточной Европе, еще ниже находятся корейцы, китайцы, японцы, которых цитируют еще меньше, и совершенно черная дыра в России. На самом деле это указывает не на количество публикаций, а на склонность цитировать тех, кого ты понимаешь и с кем у тебя отношения. У этого я учился, у того был аспирантом, этот — аспирант такого-то и так далее. Просто нет связанности. Это примерно так же, как в корпоративном бизнесе: ты не можешь продавать в разных сегментах, если не получаешь ссылок на тебя, то есть если тебя не рекомендуют. Между континентами и между отдельными странами или сегментами рынка всегда есть эта стена.

 

JSON.TV: Что, на Ваш взгляд, было бы справедливым критерием оценки работы математиков? Премии международные, Филдсовская, ещё какая-то?

 

Игорь Ашманов: Филдсовскую дают. Я думаю, там ее дают более-менее честно. Хотя Перельман ругался и не взял. Точнее, он-то брал другую премию за решение проблемы Пуанкаре. Я не знаю, я не специалист в образовании. Я только знаю, что сейчас эти рейтинги начинают нашим чиновникам навязывать. А такие рейтинги вообще лукавые, потому что, конечно, МГУ не может быть на 186-ом месте или на 100-ом. Если взять рейтинг, например, востребованности выпускников у отделов кадров крупных компаний, МГУ оказывается на 5-ом месте в мире. Это совершенно понятно. В Google отлично знают, что такое мехмат или физтех, прекрасно знают и берут не рассуждая. Страсть быть оцененными иностранцами приводит к тому, что сейчас у нас распространяется какой-то рейтинг типа Web of Science, который не только зарубежный, но это ещё и частная компания, не раскрывающая методику. И согласно их рейтингу у нас начинают присваивать степени, начислять гранты, премии и так далее. Это просто нонсенс.

 

JSON.TV: То есть по субъективным ощущениям, например, Вашего сына всё более-менее прилично?

 

Игорь Ашманов: По моим, скорее. Я расспрашивал, у кого он учится, что там делает. Там довольно много жизни, там хорошо учат. Студенты почти все работают курса со 2-го, с 3-го, как правило, программируют или, как ребята вокруг моего сына, роботов паяют. Там движуха. С моей точки зрения, всё нормально.

 

JSON.TV: Два слова о Вашем личном профессиональном прошлом. Проверим информацию, которая есть. Родились Вы 9-го января 1962-го года, было это в Москве.

 

Игорь Ашманов: Это верно, а все остальное я буду отрицать, это неправда, это клевета.

 

JSON.TV: Ну, мехмат — это же правда?

 

Игорь Ашманов: Правда.

 

JSON.TV: Школа тоже была математическая?

 

Игорь Ашманов: Нет, там был математический класс, но школа была более-менее обычная, районная. Я ходил во всякие кружки при университете, в 57-й школе.

 

JSON.TV: И дальше после университета сразу взялись за дело? «Вычислительный центр»?

 

Игорь Ашманов: Нет. Во-первых, я еще в художественной школе учился. Я думаю, что лет до 25-ти я был абсолютный балбес, ничем толком не занимался, никакого специального дела у меня не было. В «ВЦ академии наук» можно было попасть после мехмата, только принеся заявку. Тогда было распределение. Может быть, не все знают, что это такое. Выпускник должен был 2-3 года минимум отработать там, куда его распределили.

 

JSON.TV: И тогда оттуда, соответственно, запрашивал отдел кадров?

 

Игорь Ашманов: Сначала на мехмате появлялись вербовщики из КГБ, из армии. И ещё один вариант был — пойти преподавать в школу.

 

JSON.TV: Почему Вы не пошли в КГБ?

 

Игорь Ашманов: КГБ тогда имело очень плохой имидж, а я был очень либеральный по своим взглядам, тусовался в основном с либеральной молодежью на мехмате. Часть из них были просто евреи, собирающиеся уехать прямо сразу, как только закончат. В КГБ было немодно. В армию не хотелось, хотя армия тоже была бы закрытым ящиком в Москве. Была такая тема, что все бегали и пытались найти заявку из академического института, потому что это было самое интересное: пойти куда-то, где занимаются наукой. Мне такую заявку просто сделал отец, который с «ВЦ академии наук» много сотрудничал, преподавал и так далее. То есть по блату. Мне принесли такую заявку, там была ставка. Оно так: «Тебе нужен парень с мехмата?» — «Конечно, нужен». Я нормально учился. Я попал в «ВЦ академии наук» сразу в отдел искусственного интеллекта. Считаю, что очень повезло.

 

JSON.TV: То есть не то что до этого занимались, а просто попали на искусственный интеллект?

 

Игорь Ашманов: Нет. Я готовил абитуриентов, чтобы заработать, работал ретушёром во «Внешторгрекламе», форточки вставлял. С середины университета я зарабатывал серьезные деньги, 200 рублей в месяц. С этим проблем не видел. Попал на ВЦ, потому что там интересно. Меня там заставили считать какие-то большие экономические разреженные матрицы, это было скучно. А потом на меня набежал аспирант Олег Григорьев, сын довольно известной Татьяны Григорьевой, японистки. Он был аспирант на ВЦ. И он придумал делать систему проверки правописания, для русского языка. Меня он втянул не потому, что хотел, чтобы я ему что-то сделал. Он ко мне относился немножко пренебрежительно сначала. Он хотел мою первую жену Нину, которая была лингвистка, втянуть через меня. Ему это удалось, мы пришли в проект вдвоём, году в 1987-ом, и начали делать проверку правописания.

 

JSON.TV: Он получил 2 в 1. Сейчас пишут, что проверка правописания вообще Microsoft. С тех пор как он её купил, он её целиком и использует практически во всех своих продуктах.

 

Игорь Ашманов: Мы её продали Microsoft в 1994-м году, там был довольно серьёзный закрытый тендер. Некий чёрный оппонент сделал кучу тестов. Я подозреваю, что это была женщина-лингвистка, но нам так и не сказали кто. Microsoft нанял. Мы по всем параметрам с большим отрывом победили его придворного поставщика, который уже продал в MicrosoftOffice30 spelling checker-ов, и пару российских компаний, наших конкурентов. Потому что мы очень серьёзно вложились. Я лично вложился в словарь и в лингвистические алгоритмы. Там дело было не в функциональности, потому что мы продавали библиотеку для встройки. Продукта не было, мы продавали технологию. С тех пор оно там и стоит, просто лет 5 назад владельцы этого кооператива «Информатик» продали Microsoft для очередной версии уже просто словарь, а не программу. На этом сотрудничество прекратилось, потому что Microsoft написал свою программу, оживляющую этот словарь. Ухудшил качество раз, наверное, в 100, потому что проверка правописания – это во многом алгоритмы, а не словарь. Эти алгоритмы они все забыли. Я приведу пример: есть огромная проблема в русском языке — слитно писать или раздельно. Её нужно детальнейшим образом описывать в виде алгоритмов. Например, частица «таки» может писаться через дефис с глаголом, а с существительными не может. А в Microsoft-овском spelling checker-е просто любые 2 правильных слова через дефис разрешаются. Они просто решили в этом месте не проверять.

 

JSON.TV: Просто упростили программу?

 

Игорь Ашманов: Да. И там таких вещей много. Там, с моей точки зрения, плохая проверка правописания. Я там проработал до 1994-го года. Сначала я был главным по лингвистике. Потом Олег Григорьев, лидер проекта, увёз всю команду в Штаты. Я не поехал. Я съездил, посмотрел, мне не очень понравилось. И потом у меня жена была беременна, пасынок провалился при поступлении на ВМК: ему поставили за русский «двойку».

 

JSON.TV: За русский на ВМК!

 

Игорь Ашманов: Да. В этот момент как раз произошёл путч, подул ветер свободы. Все наши тогда уезжали в Штаты, виляя между танками. Они уезжали 21-го августа. Вся команда туда уехала, плюхнулась в некую компанию. На меня тоже был билет, и на жену билет, и место для работы. Ко мне пришёл хозяин компании «Информатик» Илья Ставиский, сказал: «Слушай, если ты уедешь, мне придётся закрыть проект. Я понимаю, что ты очень хочешь в США, но я тебя попрошу остаться хотя бы на полгода и заново построить команду». Я страшно обрадовался, сдал билеты, потому что понял, что я-то ехать не хотел. Все остальные продавали квартиры, машины, устраивали как-то свою жизнь, а я ничего этого не делал.

 

JSON.TV: Сейчас не пожалели?

 

Игорь Ашманов: Нет. Я был тогда в США, посмотрел. Ребята ведь планировали, что они будут жить бригадой, коммуной, делать большие проекты. Они тут же разругались, немедленно, в первые же месяцы. Их разнесло жизнью. Многие из них занимались совершенно не тем, чем хотелось. Кто-то стал компьютерами торговать, гнать их сюда, в Россию. Дети выросли уже американцами. И мне эти наши ребята говорили: «Да, мы живём для детей. Ну и пусть они нас забудут или будут одергивать на улице, чтобы мы не говорили на тарабарском наречии, но зато им будет лучше». Я посмотрел, как они приезжали сюда. Они все или почти все приехали на могилы. Они не могли уехать оттуда, боялись первые лет 7-8, пока не получили вид на жительство. А здесь начали умирать родственники. Это же, на самом деле, моральный выбор, это не просто. Когда, например, уезжает студент — закончил, уехал поработать, — в этом морального выбора нет. Он молодой, родители молодые, друзья еще восстановятся. А когда ребята уезжали в 30, 35 лет, в 40, когда родителям уже за 60, то я видел, как кто-то из них приезжал уже…

 

JSON.TV: И здесь для Вас были возможности приложить свои силы и интеллектуальный труд. «МедиаЛингва» в каком году уже была?

 

Игорь Ашманов: Я ушел из «Информатика», в 1995-м году открыл свою компанию с неким партнером-инвестором, 5 лет мы там разрабатывали всякие словари и так далее. А потом мы с ним разругались, разошлись во взглядах, что делать дальше, потому что мы сделали, как я считаю, совершенно блестящий англо-русский переводчик, который работал не хуже, чем делала тогда компания PROMT, и гораздо лучше, чем до сих пор работает.

 

JSON.TV: Автоматический машинный переводчик?

 

Игорь Ашманов: Да.

 

JSON.TV: То есть не просто помощь переводчику?

 

Игорь Ашманов: Нет. Мы ещё делали систему помощи переводчикам по заказу одного немца из Гамбурга, но мы сделали машинный переводчик, самообучающийся, на параллельных текстах, очень умный. И мой партнёр Олег сказал, что не хочет дальше его финансировать, закроет. Для нас это было довольно сильное разочарование, потому что мы реально сделали очень крутую штуку. У всех был огромный энтузиазм.

 

JSON.TV: В 1990 каком-то лохматом году…

 

Игорь Ашманов: В 1999-м.

 

JSON.TV: Чуть меньше 20-ти лет прошло с тех пор, и до сих пор эти самообучающиеся алгоритмы так ничему и не самообучились? Без слезы до сих пор на машинный вариант перевода не взглянешь.

 

Игорь Ашманов: У нас он был довольно сложный. Googleсделал сугубо статистический переводчик. Я даже помню, у них был какой-то китаец сначала, который отвечал за этот проект. Он в интервью сказал: нам лингвистика ни для чего не нужна — всё решает вычислительная мощь. В таких случаях я часто думаю: может быть, я чего-то не понимаю, просто дурак, и, наверное, он знает, что говорит. Это, конечно, моя профессия, но вдруг там ребята действительно настолько гениальные?.. И потом, бывает, смотрю я на то, что получилось, и думаю: «Нет, дурак всё-таки не я, потому что так он у них нормально и не заработал».

 

JSON.TV: То есть это два разных подхода, для того чтобы понятно было? Один, который пытается находить, имитировать, раскладывать законы каждого конкретного языка, другой — частотность употребления. Причем можно сравнивать не только слова, но и огромные языковые массивы и переводить сразу массивами?

 

Игорь Ашманов: Да, это два конца шкалы. На одном конце шкалы — то, что называется rulebased, то есть основанный на правилах машинный перевод, который разбирает синтаксис языка, выясняет роли слов в предложении и так далее. Такой переводчик обречен, потому что язык слишком сложен, чтобы ты выписал все правила. На другом конце, наоборот, статистический переводчик. Он просто берет параллельные тексты, вырезает из них кусочки, параллельные друг другу, запоминает их: слова, словосочетания, длинные куски, синтагмы, обособленные части предложений, целые фразы — и потом, когда встречает фразу, он пытается ее покрыть имеющимися у него образцами как можно лучше. Чем длиннее кусочки, тем лучше. Потом склеивает соответствующие им переводы. Он держит базу разных кусочков с переводами параллельно.

 

JSON.TV: То есть там не 100, не 200 тыс. слов, а уже некое количество — десятки миллионов — словосочетаний?

 

Игорь Ашманов: Да, а то и сотни миллионов этих кусочков, энграмм, как они называют. Диграмм, триграмм, тетраграмм из слов.

 

JSON.TV: Так что более перспективно в итоге?

 

Игорь Ашманов: Мы делали гибридный переводчик. Фразы, которых может не быть вообще, надо было переводить согласно правилам. Но эта штука обучалась, она у нас не энграммы запоминала, а формировала правила перевода по параллельным текстам. То есть она была гибридная, переводила очень хорошо, с моей точки зрения, потому что она, условно говоря, догнала тогдашнего лидера, PROMT, примерно за полгода разработки. У нас впереди было сияющее будущее, и тут мой партнер-инвестор сказал: «Нет, этот проект мне не нравится, он что-то плохо переводит». Мы на этом разругались, и я с командой ушел в Rambler. Там был еще один эпизод, мы разошлись с ним на двух точках. Мы сделали по его просьбе проект, который позволял искать сайты, просто введя название фирмы и так далее, прямо в адресную строку. Это то, что сейчас есть в любом браузере, и то, что «Яндекс» преобразовывает в поисковик. А мы тогда сделали просто базу, каталог всех более-менее известных сайтов с их наименованиями на естественном языке. И подменяли это в адресной строке браузера. Чуть позже нас в Калифорнии запустился проект Real Names — «реальные имена», — который делал то же самое. И Microsoft включил его в свой браузер. Я позвонил Ольге Дергуновой (она тогда была главой российского Microsoft) и сказал: «Ольга, вы нарушаете наш патент. На территории России эту штуку делаем мы». Она говорит: «Знаешь что, давай мы до юристов дело доводить не будем, а решим на маркетинговом уровне так. На территории России, то есть если russianregionalsettings русский, взлетать будет твоя служба. А везде вокруг… Я это протолкну, и нам не нужно будет 12 месяцев судиться». Я говорю: «Меня это полностью устраивает». Ко мне приехал договор, страниц, наверное, на 40 юридического английского — я замахнулся его подписать, а мой партнер схватил меня за руку и сказал: «Ты что, мы их засудим, они должны нам гору бабок!» У него всегда был такой азарт: он любил казаки-разбойники всякие, судиться. Я понял, что мы вместе каши не сварим, потому что нам, условно говоря, фактически отдавали ошибку 404 в масштабах всей страны. Сейчас это был бы гигантский поисковик с огромным трафиком. Потому что тогда, в 1999-м году,InternetExplorerзанимал чуть ли не 90% рынка.

 

JSON.TV: Да, было такое время.

 

Игорь Ашманов: Мы с ним разошлись. Я ушёл, и команда ушла за мной. Я попал в Rambler. Там мы проработали полтора года. По договорённости с основателями Rambler я пришел как технический директор, привел своих людей. Мы сделали новый поисковик, новый рейтинг топ-100 — тогда он тоже был абсолютным лидером, — разные контентные проекты. Много чего сделали, но основатели ещё раз перепродали Rambler. То есть они нас нанимали таким образом: они продали Rambler инвесторам, компании «Русские Фонды», — им нужно было показать какую-то команду. Я за ночь написал план, что-то около 60 страниц, как мы все будем делать. Мы поехали к инвесторам, нас предъявили, меня в частности, и дали денег. А дальше произошёл взрыв пузыря доткомов, лопнул пузырь интернет-компаний в Штатах. Здесь тоже все струхнули, правда, с задержкой на полгода примерно. Перепродали раз, перепродали два. Потом я понял, что добра не жди в таких условиях, уволился и открыл новую компанию.

 

JSON.TV: Чем сердце успокоилось? «Ашманов и партнёры»?

 

Игорь Ашманов: Особо не успокоилось. «Ашманов и партнёры» занимается в основном интернет-маркетингом. Я совершенно не собирался этим заниматься, у меня мыслей таких даже не было. Я собирался делать спам-фильтр для борьбы с почтовым спамом, когда открыл компанию. Я её назвал «Ашманов и партнёры», чтобы дать понять своим ребятам, которые ещё оставались в Rambler, что я намерен делиться акциями. Но как только я создал компанию, она стала видна в сети, мне начали названивать знакомые и говорить: «Когда ты был исполнительным директором в Rambler, мы же не могли к тебе прийти за советом, как продвигаться в поисковике». А когда я уволился, Rambler был по-прежнему гораздо больше Яндекса, был абсолютным лидером с трафиком всё ещё больше процентов на 30. Но Яндекс довольно быстро догонял. Дело в том, что, когда наши инвесторы пали духом и продавали Ramblerкаждый раз всё дешевле, в Яндекс, наоборот, пришли Baring Vostok, Леонид Богуславский, и наоборот дали денег. Яндекс рекламировался, развивался, покупал железо, а мне этого ничего не давали. Я не мог ни серверов купить, ни рекламировать сервис, поэтому я и ушёл. Стали звонить знакомые и говорить: «Так расскажи, как продвигаться?» Я съездил на одну встречу, в ресторан — угощали, уговаривали: «У тебя же нет конфликта интересов — расскажи!» Я понял, что на этом деле надо создать бизнес. Вызвал из Казани одного гениального парня, Андрея Иванова — он в своё время мне загадил весь Rambler, а также и Яндекс своими страничками, — и мы буквально за неделю заложили основу этой индустрии. Мы написали тезаурус, глоссарий предметной области, несколько основополагающих статей о том, что такое продвижение в поисковиках, и методику работы с клиентом: как продвигать и так далее. И начали брать заказы. Дело пошло очень быстро. Для людей это был просто шок. Если я произносил в РОЦИТе (Российский Центр Интернет-технологий) доклад о том, что в поисковиках можно продвигаться, в зале начиналась просто какая-то вакханалия, как на сеансах Кашпировского. Люди мотали головой, плакали, смеялись, потому что все знали уже, что какая-то мощь в поисковиках есть, а что с ней делать? Понимали, что это очень сильно влияет на бизнес, а как заставить поисковик влиять в нужную сторону, никто не знал. Всё было мутно. Я начал наводить резкость, протирать запотевшее стекло. Этот рынок рос очень быстро, поэтому мы стали продвигать себя как главного эксперта на рынке — такими мы и были. Я всё-таки был техническим директором поисковика. Точнее, я уже был исполнительный директор с командой: у меня был ещё технический директор, контентный, автор поисковика, разработчик рейтинга топ-100 и так далее. Мы всё об этом знали. А другие маленькие оптимизаторские компании или отдельные люди, вообще говоря, о поисковиках слышали с пятого на десятое.

 

JSON.TV: Продвижение, по сути, это как расталкивание локтями стоящих в очереди? Либо и сама очередь организована поисковиками не очень логично? Цель — оказаться выше в результатах поиска, если я правильно понимаю?

 

Игорь Ашманов: Задумайтесь вот над чем: в какой-нибудь предметной области — пластиковые окна (это притча во языцех), или продажа газовых систем для автомобилей, или недвижка какая-то — верхняя десятка собирает, условно говоря, весь трафик. За пределами верхней десятки жизни нет. Может быть, вторая десятка ещё как-то собирает, но уже в полтора-два раза меньше трафика, а тридцатка ещё хуже. Эта десятка всегда кем-то заполнена. Поисковик просто транслирует трафик на эти сайты, с этого трафика он не зарабатывает. Легенд вроде «Наша служба безопасности съездила в «Яндекс», договорилась, и мы теперь на первом месте» можно слышать сколько угодно — это всё лажа. Поисковик на этом не зарабатывает, и он не компрометирует себя таким образом. Поисковик нельзя заставить поставить тебя на первое место ни деньгами, ни угрозами — никак. Но кто-то в любом случае будет на первых местах. С точки зрения «Яндекса», если первая десятка состоит из релевантных сайтов, которые соответствуют запросу, ему вообще всё равно, кто стоит на первом месте. Он их может вообще ротировать каждый день, если бы он хотел бороться с оптимизаторами. Эти деньги, то есть этот трафик, кто-то всё равно заберёт. У поисковика, как и у любой другой платформы… Платформой я называю место, где есть большая аудитория, к которой можно дать доступ третьим лицам. Телевидение — это платформа, радио — это платформа, билборды на улицах, социальные сети. Все эти платформы имеют свои, абсолютно специфические способы привлечения аудитории, способы передачи этой аудитории третьим лицам, игрокам. Обычно есть авторизованный метод — это реклама. В «Яндексе» это контекстная реклама и медийная, контекстно-медийная с баннером. В социальных сетях тоже. Есть, как правило, серая зона, в которой третьи лица сами как-то получают доступ к аудитории, а платформа смотрит на это сквозь пальцы. Есть чёрные, запрещённые. Набор этих методов постоянно живёт, дрожит, меняется. Сегодня этот метод считался чёрным, а завтра почему-то за него не наказывают. Для того чтобы продвигаться на каждой из платформ, вы должны иметь специалиста по этой платформе, который понимает, каково соотношение методов. Там есть авторизованные методы, а также среди них есть белые, чёрные и серые. Белые методы для поисковика — это сделать очень релевантный сайт, поместить в правильное место картинки, сделать крупно телефон. «Яндекс» сейчас всё это учитывает. Это то, о чём они говорят: «Делайте сайты для людей!» Белый метод – это и есть сделать сайт для людей. Серый — это, например, смекнуть, что у «Яндекса» есть, как на той рассохшейся рулетке, некие пока не признаваемые дефекты, и ими воспользоваться. Или просто закупить много ссылок, потому что «Яндекс» их любит и пока ещё за такие действия не наказывает — хотя сейчас уже наказывает — и так далее. Эту комбинацию методов может знать только специалист, потому что нужно следить за этим каждый день. Продвижение в Appstore мобильных приложений — это такое же искусство. И там свои правила и свой набор чёрных, белых и так далее методов.

 

JSON.TV: То есть платформы, никому не сообщая об этом, меняют некий набор своих критериев? И должен быть аналитик, который поймёт, что изменилось в этот момент?

 

Игорь Ашманов: Конечно. Каждый день за этим наблюдает, потому что перемены происходят ежедневно. Выкатили новый проект на «Яндексе» — всё поменялось. Или «Яндекс» начал учитывать ещё один фактор ранжирования. Там сейчас 800 факторов используется в их машинном обучении. Во-первых, после того как они машинно обучились, ты вообще не можешь сказать, какая там формула релевантности, — машина сама решает. И разработчик «Яндекса» не может сказать — для него это тоже чёрный ящик. Во-вторых, если они добавляют новые факторы, то ландшафт меняется, и надо вовремя сообразить, как на это реагировать. Кто не сообразил, те уезжают во вторую десятку или во вторую сотню. Поэтому ситуация такова: есть совершенно чёрные оптимизаторы, есть всякие легенды о том, что существуют, например, какие-нибудь токсические ссылки, которые позволяют опустить конкурента. Но это в основном страшилки, которые пересказывают друг другу дети. Короче говоря, существует некий бизнес-процесс слежения за поисковиком, который, в принципе, хозяин сайта, клиент может построить и сам: он может нанять оптимизатора в штат. У нас были такие случаи, когда мы довольно долго вели клиента, захватили все десятки Google, там было по 6 сайтов нашего клиента на 10 результатов. Мы даже боялись, что Google это заметит, хотя мы ничего противозаконного не делали. А потом, спустя 2 года, в течение которых он нам хорошо платил, мы по уговору просто обучили его людей: он нанял 4-х человек и продолжал уже сам.

 

JSON.TV: Кстати, «Яндекс», Google, Mail.Ru-поиск, какие есть еще, они отличаются в оптимизации?

 

Игорь Ашманов: Конечно. Это разные платформы, у каждого свои правила, свой способ. Например, те, кто работает по Google в западном Интернете или на Украине, могут совершенно не уметь работать с «Яндексом». Там что-то пересекается. Условно говоря, у тебя должен быть релевантный текст и не должно быть вирусов на странице. Или, если у тебя сайт часто лежит, все поисковики перестанут тебя любить: их робот заходит тебя проиндексировать, а сайт не работает… В общем, у всех поисковиков много специфических правил.

 

JSON.TV: Сейчас продвижение компаний смещается, наверное. По крайней мере, доля продвижения на площадках под названием «социальные сети» растёт. В чем специфика? Сегодня мы и предполагали поговорить большую часть времени о социальных сетях. Время идёт, и пора как раз о них и поговорить. Насколько важна оптимизация под соцсети?

 

Игорь Ашманов: Не оптимизация — продвижение скорее. У них же нет ранжирования. Трафик-то у них есть, а результатов поиска нет. Кстати, если Вы заметили, по странной причине в социальных сетях нет поиска. Вы не можете поискать тексты в Facebook. В «ВКонтакте» тоже полноценного поиска нет. Возможно, это просто другой бизнес или очень тяжело свой поисковик разработать, но могли бы договориться. Тем не менее, Facebook не впускает к себеGoogle, «ВКонтакте» не впускает «Яндекс» для поиска.

 

JSON.TV: Есть люди, которые работают с разными платформами. Тот же Герман Клименко и MediaMetrics или что?

 

Игорь Ашманов: Он не работает с платформами.

 

JSON.TV: Он считает переходы из социальных сетей.

 

Игорь Ашманов: Да, но он их считает на сайтах. У него на сайтах СМИ стоит его счетчик, LiveInternet.

 

JSON.TV: То есть он не внутри соцсетей?

 

Игорь Ашманов: Ни в коем случае. Он поставил счётчики на очень многие СМИ. Когда-то LiveInternet видел почти весь Рунет. Сейчас другая эпоха, сейчас счётчики постепенно умирают. Почему? Потому что наступила эпоха Яндекс. Метрики и Google Analytics — специальных сервисов для веб-мастеров. Эти сервисы можно поставить к себе и получить статистику, аналитику по своему сайту. Они гораздо более развиты, чем такой вот счётчик, который появляется откуда-то из облака. Постепенно хозяева сайтов сносят эти счётчики. Сменился дизайн, сменился маркетинговый директор, сменился веб-мастер: «А будем ставить снова LiveInternet или ещё что-то?» Openstat там ещё есть. «А зачем? У нас же Google Analytics есть». То есть постепенно происходит размывание этих счётчиков. Эпоха счётчиков, начавшаяся с появления рамблеровского топ-100 в 1998-м году, сейчас постепенно уходит. Но Герман Клименко сделал могучее усилие. Он видит, откуда пришёл пользователь. И он начал показывать ссылки на статьи, по которым приходит больше всего пользователей социальных сетей. Это живые пользователи, которым кто-то дал в социальной сети ссылку, и они по ней щёлкнули и пришли на страницу СМИ, а там их посчитал счётчик Клименко. И он стал это показывать. В социальных сетях у него ничего нет — он просто видит этот поток. Поскольку дальше довольно многие люди стали смотреть его сервис заголовков, рейтинг заголовков статей, то он стал проецировать через MediaMetrics трафик на эти самые СМИ. То есть люди, которые читают MediaMetrics, потом переходят на эти статьи.

 

JSON.TV: С его уже сайта.

 

Игорь Ашманов: С его сайта. То есть он стал генератором трафика. А раз так, СМИ в здравом уме не будут сносить счётчик: он же им приводит людей. Здесь возник обратный ход. Наоборот, СМИ теперь считает правильным поставить счетчик MediaMetrics. Насколько это задержит размывание счётчиков и их уход со сцены, не знаю, но пока проект мне нравится: он хороший, живой, его многие смотрят.

 

JSON.TV: Интересно. Я даже не задумывался на эту тему. Вернее, задумывался, но дальше не шёл… Над тем, что нельзя осуществить поиск по соцсетям.

 

Игорь Ашманов: Мы это делаем. У нас есть компания «Крибрум», которая как раз является поисковиком по социальным сетям. Точнее, первый поисковик по блогам и соцсетям сделал Яндекс. Называется Яндекс. Блоги. Но, во-первых, он по какой-то неизвестной мне причине практически не развивается. Были разные сведения от людей из «Яндекса», что там до сих пор стоит поисковый движок 2004-го года, то есть его 10 лет никто не обновлял.

 

JSON.TV: Может быть, в связи с проблемой блогеров-трёхтысячников? Яндекс что-то заявлял по этому поводу.

 

Игорь Ашманов: Нет, у Яндекса проблемы с блогами начались гораздо раньше. Я, например, не могу с уверенностью сказать, проблемы ли это с тем, что у нас такая плохая власть, или с тем, что Яндекс такой плохой. У Яндекса сначала был рейтинг записи, рейтинг блогеров плюс поиск по блогам. Но дальше с рейтингом блогеров и рейтингом записей начались неприятности, потому что, с точки зрения тех, кто у нас отвечает за идеологию, за медийное поле, — в Яндексе абсолютно очевидный либеральный уклон. Самая вопиющая история была, когда 8 мая Яндекс поставил чуть ли не на первое место в рейтинге запись о том, что Красная Армия была армией насильников и изнасиловала 2 млн. немок. Притом что у записи в тот момент всех метрик не хватало, чтобы даже в десятку попасть. Кто-то руками, как считали люди наверху — у Суркова, ещё где-то, — сделал такую перестановку, потому что эксплуатировал родную компанию в своих политических целях. Возникла коллизия, возникли претензии к Яндексу. Следующая претензия была в 2008-м году в связи с тем, что они якобы, со слов тех, кто за этим наблюдал, наливали трафик на прогрузинские СМИ во время войны. Яндекс последовательно убрал сначала рейтинг блогозаписей, потом, чтобы не связываться, рейтинг блогов. Довольно долго договаривались, ходили во власть и зимой 2009-го года наконец договорились о продаже золотой акции Сбербанку, которая не даёт права на управление и доходы, но может позволить не продать Яндекс зарубежным игрокам. Как бы поставили печать: это наш поисковик. Тем не менее, параллельно в государстве запустился проект национального поисковика, который потом стал Спутником. Это тоже произошло из-за этой же истории. Соответственно, Яндекс. Блоги всё время ужимал функциональность поиска по блогам, а не развивал, потому что посещаемость у него в общем ничтожная по сравнению с большим Яндексом. Пользы от него нет, сделан он был из соображений создать полную линейку продуктов. Причём он приносит огромные неприятности, с ним постоянные проблемы, потому что это дело политическое. Такие же проблемы были с агрегатором новостей, с Яндекс. Новостями. Но он хотя бы очень посещаемый. Это одно из главных СМИ в нашей стране, как-то оправдывающее себя рекламой, поэтому им занимаются. А рейтинг блогов все усыхал в функциональности. И мы тоже сделали поисковик по блогам, позволяющий анализировать их довольно глубоко. Блоги, записи в социальных сетях и так далее. Называется «Крибрум».

 

JSON.TV: Можно просто зайти и отправиться в поиск? Или как вы работаете?

 

Игорь Ашманов: Нельзя, это корпоративный продукт — то, что называется В2В. Понимаете, какая история. Что такое поисковик вообще? Поисковик при росте Интернета растёт как квадрат скорости. Почему? Если, допустим, — а такое время было — количество сайтов в Интернете увеличивается в 2 раза, то одновременно и аудитория увеличивается в 2 раза. То есть ты должен показать вдвое большей аудитории поиск по вдвое большей базе. Тебе нужно железа в 4 раза больше, людей в 4 раза больше. И так каждый год. Это очень трудно выдержать. Google стал таким великим, потому что он выдержал рост — не потому, что он чудовищно релевантный. Он смог выдержать рост Интернета в 1990-х годах. Кроме Брина с Пейджем, там были очень сильные люди, которые сумели побороть эту высокую нагрузку. У меня не хватает ресурсов, чтобы сделать поисковик, который я мог бы открыть всем, чтобы туда ломанулись миллионы людей, которых я мог бы обслужить. Обрабатывать огромную базу — 200 млн. аккаунтов, 50 млн. записей в день — мы можем. Но, чтобы все могли искать, у нас железа не хватит. Так как мы делаем проект на свои средства, никаких инвестиций под него пока не привлекали, это корпоративный сервис. У нас крупные и средние компании наблюдают за упоминаемостью своих брендов, продуктов, председателей правления и так далее. Мы вычисляем тональность отзывов: плохо или хорошо говорят о компании — и так далее.

 

JSON.TV: Теоретически, если деньги вкинуть, железа подкинуть, можно сделать?

 

Игорь Ашманов: Конечно. Вопрос только в том, будут ли искать, нужно ли это людям настолько, чтобы все как один пошли? Поиск вообще нужен. Это всё-таки довольно специализированная вещь и непонятная. А заказчикам из сектора крупной или средней экономики он точно нужен: они за него платят. Поэтому сейчас это В2В сервис. Я иногда рассказываю про политическую борьбу в социальных сетях и другое в том же роде, но это всё просто наши наблюдения, мы так развлекаемся. Я не получал заказа всё это исследовать. Но, когда есть свободное время, мы следим, что там ещё происходит: вбросы, атаки и так далее. Но работаем в основном для коммерческого заказчика.

 

JSON.TV: Тогда об этом ещё и поговорим, чуть-чуть времени у нас осталось. Фабрики троллей так называемых есть? Они вычисляются математически?

 

Игорь Ашманов: Да. Троллей видно. Я скажу общую вещь, она, может быть, будет полезна зрителям. Сейчас очень модно словосочетание big data — «большие данные». Что это такое? Поскольку его используют как buzzword, то есть для маркетинга, и все понимают под этим сочетанием разное или не понимают его совсем, я дам короткое определение. Большие данные — это данные, собираемые, в частности, в Интернете или мобильными операторами. Они, во-первых, реально большие: их нельзя обработать вручную, одномоментно просмотреть, охватить умом. Они как бы необозримы. Во-вторых, в них сумма частей меньше, чем целое, — целое больше суммы частей. При взгляде на big data с высоты птичьего полета вы узнаете такое, чего не могли бы увидеть ни в одном фрагменте этого целого. Самый простой пример: вы сидите в своем аккаунте в Facebook и видите, что кто-то написал комментарий. Поскольку ваш взгляд локализован, вы не знаете, что этот же комментарий одновременно вброшен ещё в 30 тысяч мест. А когда ты смотришь сверху и у тебя есть механизм определения дублей, сразу ясно: это вброс. Рассматривая части, этого не определишь. То есть «большие данные» — необозримые данные, для понимания которых взгляд на целое гораздо важнее, чем взгляд на части. И это данные о людях, потому что только о людях интересно. Наверное, бывают интересные «большие данные» у гляциологов про ледники, но про это нам не интересно говорить. На самом деле, весь интерес всегда к людям. Это данные о людях, полученные из разных источников. Как правило, они мультимедийные: тексты, видео, данные по географии, данные о передвижениях с мобильных телефонов и так далее. И это данные с ретроспективой. То есть всегда интересны данные, которые уходят вглубь времён. Почему? Если какой-то аккаунт сейчас участвует в информационной атаке, например, распространяет какую-то фальшивку, то можно, конечно, предположить, что человеку просто интересно. Но если ты знаешь, что из 100% исследованных тобой атак он в 95-ти процентах задействован, значит, скорее всего, это бот или тролль.

 

JSON.TV: Член команды.

 

Игорь Ашманов: Член команды какой-то. «Большие данные» накапливаются в социальных сетях, и там можно всё это вычислять: дубли, ботов, троллей, можно видеть, у кого какие друзья, про каждого человека можно сказать, какие у него политические пристрастия. Люди выкладывают всё, они ни о чём не думают. Программа сейчас спокойно собирает и может продавать, предъявлять и так далее тематические пристрастия, политические, на чём ездит, где отдыхает, что покупает, о чём разговаривает с друзьями, кто друзья и так далее.

 

JSON.TV: Миллион тем есть для разговора в следующий раз. Напоследок спрошу одно: Ваша супруга, Наталья Касперская, сказала, что соцсети — никогда в жизни, это как раздеться на публике или что-то в этом роде. Вы сами тоже так думаете? Это беда наша, если философски поговорить?

 

Игорь Ашманов: Зависит от степени болезни, от уровня зависимости. Очень многие люди совершенно без этого не могут. Соцсети — это пожиратель времени. Самое главное, что они довольно сильно меняют мозг: люди привыкают к клиповому мышлению, к необязательному общению, к слабым связям. Жена меня всё время побуждает бросить писать в Facebook, говорит, что от этого только вред: «Ты ссоришься с людьми».

 

JSON.TV: Там другая мысль была: все под колпаком у Мюллера, у Цукерберга, у кого угодно.

 

Игорь Ашманов: Это само собой. Но дело в том, что вы под колпаком у Мюллера, если просто используете смартфон, а также если вы вышли, а вас увидела камера. Я читал, что в Лондоне человек, который просто вышел на работу, за день попадает в поле зрения 400 камер. Весь ваш путь можно проследить. На самом деле, смотрящих отовсюду сейчас очень много. В этом смысле социальных сетей можно не бояться, хотя надо понимать, что это, пожалуй, единственное место, где вы не просто перемещаетесь, а высказываете своё мнение. А поскольку в языке миллионы слов и десятки миллионов словосочетаний, то их выбором вы себя полностью разоблачаете. И про вас можно делать выводы. Другое дело, что вроде бы никто их не делает, пока просто накапливают. Но, как я говорил уже не раз, если сейчас за каким-то студентом вроде бы нет никакого смысла следить, то через 15 лет он, возможно, будет управлять страной. А если есть ретроспектива, о которой я говорил, то можно, условно говоря, посадить команду из 30-ти человек, которая все это поднимет, превратит в рапорт куда надо и так далее.

 

JSON.TV: Самое последнее: обезличивание данных, которые получены мобильными операторами, вендорами и так далее — это всё фигня? По геолокации можно восстановить данные о конкретном человеке?

 

Игорь Ашманов: Представьте себе: вы заходите анонимно в сеть. У вас, во-первых, какой-то анонимный, не ваш ник в Facebook или в «ВКонтакте». Во-вторых, у них же соединения шифрованные по HTTPS. Вы заходите по шифрованному соединению, так что никакой «человек посередине», так называемый Maninthemiddle (это выражение из сферы информационной безопасности) не может посмотреть, что вы пишете. Но представьте себе, что у кого-то есть система типа «Крибрум» и данные провайдера. Достаточно цепочки, скажем, в 10 дней, позволяющей сопоставить, когда вы выходили в сеть и когда в этот аккаунт писали, чтобы вас полностью идентифицировать. Это будет зависеть только от длины цепочки. Пусть за 10 дней нельзя, но за 15 можно. А вы всё равно уже год пишете. Я думаю, что восстановить можно всё про всех. В этом смысле надо просто по-другому себя вести.

 

JSON.TV: Жить, как в квартире без штор?

 

Игорь Ашманов: Да, к этому, к сожалению, придётся привыкать.

 

JSON.TV: Спасибо Вам огромное за этот разговор. Напомню, Игорь Ашманов был гостем студии JSON.TV. Счастливо всем!