×

21 Июля 2014 10:45
3672
0

Основные темы:

 

— Что дало получение образования в МФТИ и научная работа в центре волоконной оптики? Почему младший научный сотрудник поменял науку на бизнес? Как в голову пришла идея заняться автоматизацией переводческой работы?

— Как образовался сервис perevedem.ru? Зачем потребовалось сотрудничество с ABBYY? Стала ли группа компаний ABBYY инвестором в чистом виде или стратегическим партнёром? Какова доля в бизнесе основателей компании perevedem.ru?

— Почему dial-up тормозил развитие переводческих технологий? Как широкополосный доступ и облачные технологии позволяют решать любые сложные проблемы перевода?

— Почему ещё 15 лет назад отредактировать машинный перевод было сложнее, чем сделать его заново? Почему варианты машинного перевода часто кажутся смешными и убогими? Частотный и семантический подходы к решению проблемы машинного перевода. Где готовят специалистов для создания алгоритмов автоматического перевода?

— Как на качество перевода влияет типовая структура технической документации? Во сколько раз ускоряет работу переводчиков комплект соответствующих программных решений?

— Почему для универсального общения недостаточно документации на одном человеческом языке, например, английском? Во сколько раз возрастают продажи, если текст написан на языке потребителя? Как различаются эти цифры в зависимости от страны?

— Как аналитики оценивают объем мирового рынка переводческих услуг? Много это или мало - 5-6 миллиардов страниц, миллион-полтора переводчиков в 30-50 тысячах компаний, 33-35 миллиардов долларов мирового оборота в год? Можно ли в этом объеме выделить долю чисто машинного перевода?

— Главные решения, которые разрабатывает сегодня ABBYY Language Services. Почему компания предоставляет их индивидуальным переводчикам бесплатно, в обмен на регистрацию? На каких продуктах компания зарабатывает?

— Какова структура рынка машинного перевода? ABBYY Language Services и её место в России, Восточной Европе и в мире. С чем связана высокая фрагментированность рынка? Почему ни одна компания в мире не занимает более 2 процентов на рынке?

 

Полная расшифровка интервью:

 

JSONTV: Всех приветствую! Это JSON TV и я, ваш ведущий, Сергей Корзун. Сегодня мы в гостях у Ивана Смольникова. Здравствуйте, Иван!

 

Иван Смольников: Здравствуйте!

 

JSON TV: Генеральныйдиректор ABBYY Language Services. Так называется эта организация на английском языке

 

Иван Смольников: Все правильно.

 

JSONTV: По-русски, наверное, по-разному называют. Уже смирились с этим?

 

Иван Смольников: Мы предпочитаем произносить «Аби» (ABBYY Language Services). Не «Эби», а «Аби», но это не принципиально. Так исторически сложилось, что имя длинное. Очень долго думали как укоротить – пока не получается, но есть идеи.

 

JSONTV: Давайте сначала некую объективную информацию о вас обновим. Родились в 1982-м году.

 

Иван Смольников: Все верно.

 

JSONTV: Дату точную скрываете?

 

Иван Смольников: Нет. 22-е января.

 

JSONTV: 22-е января, в городе Свободное. Это Амурская область, если я не ошибаюсь.

 

Иван Смольников: Не ошибаетесь.

 

JSONTV: Дальневосточник. Долго там жили?

 

Иван Смольников: До 1998-го года.

 

JSONTV: Про образование расскажите. Про МФТИ с отличием знаем (написано). Еще что было?

 

Иван Смольников: Даже не знаю, где написано! Больше ничего не было. Хватило пока. МФТИ был очень интенсивным периодом жизни. Там шесть лет обучение продолжается. Первая защита была в 2002-м году: бакалаврская диссертация. Назовем ее просто дипломом. Потом два года еще на магистерскую степень. Потом поступил в аспирантуру. Пытался упорно, почти до конца, учиться, но к защите не пришел, потому что в этот момент бизнес уже набрал обороты. В общем, не дошло пока.

 

Долгое время преподаватели и научные руководители, которые были, звали вернуться, дописать, потому что уже было написано очень много. Но пока что-то не вижу в себе сил и времени.

 

JSONTV: Какая-то серьезная и явно не лингвистическая тема была в то время, наверное.

 

Иван Смольников: В основное время обучения на Физтехе была, конечно, физика. Физика вообще была и остается для меня самой интересной областью знаний, если брать естественные дисциплины. Занимался волоконной оптикой. В Российской академии наук (в Институте общей физики Российской академии наук) занимался исследованием всяких световодов определенного типа, их спектроскопических и волновых свойств и прочее. Ну, это долгий рассказ.

 

Писал даже разные статьи. Всякие стажировки у нас были: в Южной Корее, в Канаде и так далее. В общем, степень погружения в науку была очень высокой. Серьезно, целенаправленно и по-взрослому занимались до 2003-го – 2004-го года.

 

JSONTV: Интересы бизнеса подвигли вас дойти до…

 

Иван Смольников: Этой жизни!

 

JSONTV: До почти гуманитарной работы.

 

Иван Смольников: В плане бизнеса я себя ощутил предпринимателем году в 2003 – 2004-м, нежели ученым. В целом, в физике получалось, и получалось, на мой взгляд, неплохо.

 

Наверное, было несколько факторов. Есть банальный фактор, состоящий в том, что наука была все-таки  не в лучшей форме.

 

Но это не основной мотиватор, потому что всегда есть возможность работать за границей, какие-то гранты и так далее. Я эти возможности тоже прошел.

 

В Институте общей физики был Центр волоконной оптики, который возглавлял в то время академик Дианов, человек сильный. Хотя ему в то время было уже за 70 лет, он умудрялся зарабатывать деньги для своих подопечных.

 

В целом, более-менее жили. Плюс стажировки заграничные, но как-то все равно я ощутил, что это не совсем мое. Может быть, почувствовал, что тяжело добиться очень больших высот. То есть не ощутил я быстрого и эффективного продвижения.

 

Средний возраст людей все-таки был совсем другой. Я, наверное, был самым молодым научным сотрудником в Центре волоконной оптики в то время  (младшим научным сотрудником). Динамика немножко другая, хотя было очень интересно, классно.

 

Вторая часть вопроса была про то, что область гуманитарная. Не совсем соглашусь. Интерес возник как раз в тот момент, когда ощутили, что область гуманитарная с одной стороны. Кстати, лингвистика – это одна из тех областей, которая мне тоже была всегда интересна, но я не пошел в эту сторону в плане профессионального образования. В этой области очень большую роль играют технологии: автоматизация перевода, безусловно, очень важна.

 

В тот момент (10 – 11 лет назад) была твердая уверенность, что стык информационных технологий, автоматизации, алгоритмов каких-то программных, которые могут позволить переводчику работать эффективнее с вроде бы гуманитарной областью (переводческой) очень интересен и востребован. Нам, молодым выпускникам Физтеха, вдруг показалось, что мы можем тут сказать новое слово. Ну, вот до сих пор говорим это слово. (Смеется). Стало понятно, что за день его не сказать.

 

JSONTV: Точка входа в бизнес и в IT-бизнес – это 2002-й, 2003-й год?

 

Иван Смольников: Скорее 2003-й, 2004-й год. По серьезному – это уже 2004-й год, когда диплом был окончательно закончен, защищен.

 

Как я уже сказал, несмотря на кандидатскую (некоторую попытку написать кандидатскую), вроде бы уже такого фокуса на учебе, как он был до этого, не было, поэтому начали более серьезно заниматься. Сервис, который мы тогда сделали, назывался «Переведем.ру». Мы с этого начинали. Он был запущен в самом конце 2003 – начале 2004-го. Буквально чуть ли не под Новый год мы это запустили.

 

JSONTV: Этим сервисом, его развитием вы фактически занимаетесь. В последнее время, когда произошел стык с ABBYY… В 2007-м году?

 

Иван Смольников: Да, в 2007-м году.

 

JSONTV: Вам потребовался инвестор, либо было удачное предложение от крупной компании?

 

Иван Смольников: Знаете, тут был стык вещей. Мы тогда не понимали для чего инвестор. Интересное время было. Я сейчас вспоминаю, глядя на то, что происходит на рынке инвестиций. Появление такого, скажем так, кластера людей среди стартаперов, основным навыком которых является поиск инвестиций.

 

Это даже стало модной шуткой: люди с основным навыком «питчинга», что называется. Не люблю англицизмы, но здесь, наверное, сходу не подбирается русское слово: то есть с навыком продажи себя инвестору. Сейчас это превалирует как основное.

 

В то время не было еще институционально развитых венчурных инвестиций в стране. У меня тогда не было понимания, что можно у кого-то попросить денег на бизнес, под какой-то бизнес-план, кроме как у банка. Наверное, это ошибочно. Если бы это было, наверное, мы бы быстрее двигались. ABBYY привлекли не как денежного инвестора, а как стратегического партнера.

 

Возникло ощущение, что технологии и сервисы автоматизации, которые мы сделали в тот момент… Чтобы их более успешно эволюционировать и развивать дальше, очень бы не помешал крупный международный партнер, который при этом занимается технологиями, искусственным интеллектом в области лингвистики.

 

Это было просто очень удачное совпадение. Мы в тот момент посмотрели рынок и поняли, что три компании, которые так или иначе могли бы быть стратегически интересны в этой области, помимо ABBYY, это еще, наверное, Яндекс и PROMT.  В общем, поговорили с ABBYY и Яндексом, поняв по некоторым причинам, так сказать, что тут надо разговаривать.

 

Яндекс в тот момент еще только замышлял, что он когда-нибудь, может быть, что-то в этой области будет делать. Я думаю, еще долго не сделал, если бы Google не дал хорошего «пинка», так сказать, сделав Google Translate.  ABBYY уже двигалась на вполне себе хорошей скорости.

 

JSONTV: Кто кому предложил сотрудничество?

 

Иван Смольников: Предложили, конечно, мы, потому что вряд ли бы компания ABBYY, разглядев под лупой маленькую компанию под названием «Переведем.ру», пришла что-то предлагать. Было достаточно банально. Написали Давиду письмо: «Давид, привет. Есть такая идея, давай поговорим». Он говорит: «Ну, давай». Ну и поговорили. Дальше поговорили полгода примерно уже с другими основателями и руководителями компании. Оказалось, что это очень комплементарно (совпадает в каком-то смысле).

 

JSONTV: Иван, ваша нынешняя должность – генеральный директор ABBYY Language Services. Два слова о структуре компании. Какое место вы занимаете в компании  ABBYY, за что отвечаете.

 

Иван Смольников: Про «Переведем.ру» хочу сказать. Получилось очень интересно. Когда мы сделали первую версию этого сервиса… По сути, сервис позволяет в онлайне провести все процессы, автоматизируя весь цикл  до работы непосредственно переводчика. В детали уходить не буду, но это автоматизация в онлайне процесса заказа и всего workflow (рабочего процесса переводчика). Мы тогда немножко опередили время, как оказалось. Мы это сделали в тот момент, когда у переводчиков в регионах только появлялся ADSL-интернет. Когда мы выпустили первую версию, большинство людей еще на dial-upсидели. Может быть, вы помните, что это такое.

 

JSONTV: Помним, конечно.

 

Иван Смольников: Все сталкивались с этим 10 – 15 лет назад. Человеку невозможно работать в онлайне в браузере, когда у него скорость работы в интернете та, что была 12 лет назад в регионах.

 

Понятия «облачные технологии» тогда еще просто отсутствовало. Оно появилось 5 – 7 лет назад, наверное. Понятно стало, что штука не полетит. Тогда только учились продавать в интернете товары, а мы решили продавать услуги, причем с полным циклом оказания этой услуги в онлайне. Проинтегрировав ее с некоторыми продуктами компании ABBYY, стало понятно, что пока это преждевременно.

 

Дальше, собственно, стояло несколько вполне естественных, как нам сейчас уже кажется выборов. Либо пытаться жить на какие-то инвестиционные деньги, либо все-таки научиться зарабатывать деньги в более классическом сегменте рынка. Это мы и сделали. Мы стали бизнесом в области корпоративных лингвистических услуг: это технический перевод, перевод всяких чертежей, инструкций, программного обеспечения.

 

Такой классический сегмент переводческого бизнеса, который тогда был большим рынком: уже многомиллиардным в мировых масштабах. Сейчас это тридцатимиллиардный мировой рынок. С 2006-го года по текущий момент мы стали крупнейшей компанией на этом рынке просто потому, что он был и остается самым капиталоемким в нашем лингвистическом бизнесе.

 

А вот эти все онлайн-штуки, они на время фактически умерли. Ну, не то чтобы умерли. Оно продолжало жить, работать. Мы поддерживали технологию, которая была раньше. Постепенно это росло естественным, очень медленным, органическим образом. Но года два назад стало понятно, что возникает новый ренессанс этого дела.

 

JSONTV: Появились технологические возможности?

 

Иван Смольников: Появились облачные технологии, когда стало возможно тяжелую технологию, которая потребляет много вычислительных ресурсов, перенести в облако и дать к ней доступ большому количеству пользователей через браузеры, которые подключены через быстрый интернет к этой всей истории. Это стало повсеместным пару лет назад, а нам тогда уже (в 2003-м году) казалось, что сейчас мы это выпустим, и оно уже придет, пока мы доделаем. Но не сложилось.

 

Сейчас это пришло по новой, и мы совершенно с новым уже пониманием бизнеса, с новым пониманием процессов разработки вложились в это и перезапускаем по новой «Переведем.ру». Буквально сейчас вышла совершенно новая версия этого сервиса.

 

Технологии автоматизации работы переводчиков в облаке. Опять смещаем акцент в область инноваций, технологий автоматизации перевода и так далее.

 

С ABBYY получилось так, что в 2007-м году проинтегрировались, начали работать. ABBYY было небольшим совсем миноритарным инвестором, скажем так. Мы быстро росли в корпоративной области, быстро набирали обороты. ABBYY посчитало, что это интересный актив и увеличило свою долю в бизнесе. Но по-прежнему оно не является единоличным владельцем бизнеса. Существенная часть бизнеса – чуть меньше 50%, но больше 40% – принадлежит менеджменту компании, ее основателям и самым активным участникам. Тем, кто создавал эту компанию вместе с нами последние пять-шесть лет.

 

В результате то, что мы сейчас делаем внутри группы компаний ABBYY, все технологии, все услуги в области лингвистики, так или иначе, аккумулированы у нас. Постепенно вся разработка в этой области, которая была в компании ABBYY, практически вся перешла к нам в той или иной степени. Плюс мы сейчас сами делаем много нового и интересного.

 

JSONTV: Тема, которая меня очень интересует и интересовала, кстати говоря, всегда, с институтских времен. Я ж тоже по образованию педагог и переводчик. Получал в свое, еще советское, время.

 

Иван Смольников: Причем в лучшем вузе по этой теме.

 

JSONTV: Да. Машинный перевод всегда интересовал. Раньше мы пользовались большими словарями. У кого пятнадцать, у кого сто пятьдесят словарей было из переводчиков. Еще носили какие-то портативные, потому что эти фолианты с собой не унесешь, для записи непосредственно каких-то соответствий. Когда мой старший сын учился в том же инязе, он уже установил себе на компьютер тот же русско-английский словарь ABBYY, как только они появились.

 

В чем суть машинного перевода. Насколько эта проблематика связана вообще с проблемой искусственного интеллекта? Почему так сложно создать машинного переводчика, который адекватно, процентов на девяносто пять, удовлетворял бы потребности человека в переводе?

 

Иван Смольников: Про эволюцию этой штуки. Да, бумажные словари, а потом электронные словари. Потом начинается процесс, когда даже не машинный перевод. Машинный перевод появился как технология лет 50 – 60  назад и постепенно развивался. Но профессиональные переводчики в своей работе его еще лет 15 назад практически не могли использовать, потому что качество было таким, что отредактировать его и довести до нужного уровня было тяжелее, чем написать заново.

 

Только последние лет пять во всем мире отрасль пришла к тому, что с одной стороны сама технология и качество машинного переводчика. С другой стороны  инструменты, которые позволяют удобно его редактировать. Это называется постредактирование. Есть такой английский термин: называется “postedit”. То есть редактирование машинного перевода. Наверное, чтобы отличать от обычного редактирования.

 

Помимо самой технологии машинного перевода, нужно еще сделать некоторую среду, в которой переводчику будет делать это удобно. То есть не просто скопировал в Word или куда-нибудь машинный перевод и его там редактируешь, а некоторый специальный инструментарий, который позволяет  термины подставлять и контролировать ключевые. Условно говоря, некоторая связка с таким индивидуальным проектным словарем, чтобы можно было глянуть в словаре не просто определенный термин (десять его значений), а чтобы переводчик знал, какое конкретно значение нужно использовать в рамках данного проекта.

 

JSONTV: Иван, почему машинный перевод, куда ни запускай его, кажется таким убогим? Если человек (обычный пользователь, не знающий языка) запускает перевод. Слишком сложная проблема, чтобы ее алгоритмизировать?

 

Иван Смольников: Да, это правда. Почему так. Потому что человеческая речь полна разных контекстных смыслов. Много разных примеров, когда значение, о чем идет речь, можно понять только из контекста. Например, слова замок и замок для машины – это одно и то же, а человек  в контексте поймет, речь идет о замке либо о замке.

 

JSONTV: Ну, этот алгоритм прописать можно.

 

Иван Смольников: Очень сложно. Потому что для этого нужны некоторые семантические связи, которые позволяют понять, в каком контексте другие слова употреблены в данном предложении.

 

JSONTV: Семантические, то есть смысловые. Но можно по контексту, по словам, которые окружают. Если речь идет о кирпиче, о камне, это одно дело. Если речь идет о двери, это другое дело. То есть частотность слов, появляющихся в окружении.

 

Иван Смольников: Вообще в машинном переводе есть несколько типовых подходов. Вы сказали про частотность. Это статистический подход, когда на основе статистики и частоты употребления тех или иных слов машина пытается выбирать наиболее частотное. Тут примеров очень много.

 

Я прошу прощения про пример с Украиной, потому что это сейчас не лучшая тема. Но когда-то, когда в 2004-м году там была революция (Янукович и Ющенко), мы смеялись, потому что в Google можно было написать «Янукович», а он переводил это как «Ющенко». Наиболее частотное было употребление данной фамилии.

 

Искажение смысла возможно кардинальное. Вообще полное! Мы любим пример: «стекло на стекло». Вот это машина никогда не поймет. Вообще говоря, мы только думаем, что это такие редкие примеры многозначности в зависимости от контекста, а на самом деле они очень частотны. Мы просто не придаем этому значения. В нашей повседневной речи все состоит из контекстов, и мы друг друга хорошо понимаем, потому что процессинг этого в голове происходит мгновенно.

 

Чтобы машинному переводчику описать все возможные смыслы слова нужна серьезная технология и годы работы. Собственно это то, что ABBYY делает. Это занимает уже лет 10 – 12. Мы все описываем и описываем, и описываем разные слова, возможные значения и возможные связи.

 

JSONTV: Над этим работают серьезные лингвисты?

 

Иван Смольников: Да.

 

JSONTV: Серьезные лингвисты, программисты. Кто там еще – физики-ядерщики, может?

 

Иван Смольников: В основном лингвисты и программисты. Людей, которых бы готовили по специальности «Технологии машинного перевода», в России нет. Но есть прикладная лингвистика в некоторых вузах. Есть разные языки программирования, разные технологии искусственного интеллекта. Этому делу, так или иначе, учат.

 

У нас есть собственные кафедры ABBYY: кафедра в РГГУ, кафедра в МФТИ. Таким образом, стараются готовить определенных специалистов в этой области.

 

JSONTV: Кто максимально продвинулся в этой области? Ходят какие-то сказки о машине (пускай она большая), которая с английского на японский переводит уже настолько уверенно, что можно почти без правки это использовать. Это легенды?

 

Иван Смольников: Думаю, легенды. Смотрите, здесь есть две области.

 

Первая. Машина, условно без подготовки, переводит любой совершенно неспециализированный текст. Просто вы пришли куда-нибудь, на какой-нибудь ресурс и засовываете туда все, что угодно. Дальше получаете на выходе все, что угодно. Тут как раз у вас возникает неудовлетворенность.

 

Вторая история. Вы – компания, и у вас идет типовой поток определенного типа документов. Например, договоры какие-то, либо инструкции по эксплуатации трактора, автомобиля. Они достаточно типовые. Там много повторяющихся от инструкции к инструкции вещей. Это можно вообще снять без машинного перевода. Есть такая технология: называется translationmemory (память переводов). Когда переводчик один раз перевел что-то, это в базе сохранилось, он это переиспользовал.

 

На это можно так настроить машину, чтобы конкретно для этих инструкций в этой тематической области качество перевода резко возросло за счет как раз ранее выполненных переводов и глоссариев. В результате качество на самом деле очень хорошее. Понятно, что совсем без правки это пока выпускать невозможно, но в случае такого рода настроек можно получить результат, в  котором производительность переводчика возрастает в 2–3 раза, по сравнению с переводом с нуля.

 

Это то, что как раз и нужно компании. У нее, представим, есть поток из документации, не знаю, в тысячи страниц ежемесячно. Ей нужно сделать так, чтобы себестоимость единицы продукции под названием «страница перевода» стала ниже. То есть перевод стал для компании дешевле. Если производительность труда переводчика в три раза возросла, то не сильно важно, идеальный он был или не идеальный. Главное, что переводчик, его редактируя, работал в три раза быстрее. Отличный результат!

 

Но приближения к этому идеалу, я думаю, мы еще будем долго ждать.

 

JSON TV: Это равнозначная проблема проблеме построения искусственного интеллекта?

 

Иван Смольников: Это она и есть на самом деле. Это и есть проблема построения искусственного интеллекта. Компьютеру нужно, разобрав предложение, понять, в каком контексте употреблены определенные слова в этом предложении, и выбрать наилучшее соответствие. Понять, что три переведенные слова определенным образом  стоять не могут. Или, чаще всего, не стоят таким образом.

 

Например, люди чаще всего не танцуют на столах, а все-таки за ними сидят. Это нужно описать машине, чтобы она понимала. Скорее всего, когда мы переводим, что мы с вами «сидели за столом», то это не «стояли на столе», не «под столом сидели» и так далее. Собственно, это и есть задача искусственного интеллекта.

 

JSON TV: Берете 10 тысяч лингвистов. Сажаете их и распределяете между ними работу. Они работают над алгоритмами. 10-15 лет, и все будет описано.

 

Иван Смольников: Безусловно. Только вопрос, где взять денег на этих 10 тысяч лингвистов и на 10–15 лет их работы. Компания ABBYY вкладывала примерно в 300 лингвистов на протяжении 12 лет: это десятки миллионов долларов. Вы сейчас говорите, боюсь подумать, о сотнях и даже о миллиардах. Ни один инвестор не захочет вкладывать такие деньги в эту проблему прямо так вот с ходу, поэтому идет постепенно, постепенно, постепенно. Эволюция.

 

JSON TV:Объем рынка. Многие, засовывая свой кусочек текста во всякие онлайн-машины, которые позволяют делать переводы, и желая получить перевод, наверное, не представляют, как велик объем работы. Поскольку промышленность стала международной, вы часто используете термин «локализация», когда большая фирма, продавая свои товары или услуги на разных территориях, идет к заказчику. Почему недостаточно английского языка, который в наше время стал таким универсальным языком общения? Это как-то влияет на продажи?

 

Иван Смольников: Конечно. Первый и самый главный фактор состоит в том, что это прямым образом влияет на продажи, если вы международная компания и продаете что-то в разных странах.

 

В этом случае есть проверенная статистика. Разные исследования были. Одно из крупнейших исследований мы переводили лет пять назад и размещали прямо у себя на сайте. Оно гласит примерно следующее: вероятность совершаемой покупки  возрастает примерно в два раза, если текст о товаре либо услуге написан на родном языке покупателя. Эта цифра немножко варьируется от страны к стране. Например, во Франции эта цифра будет выше, чем…

 

JSON TV: В Швеции, например.

 

Иван Смольников: В Голландии уж точно. Вы понимаете почему. Вы, по-моему, как раз с французским языком работали. Францию, наверное, знаете хорошо. В Японии эта цифра будет выше, чем в Голландии. Но и там, и там это примерно такой порядок величины: в два раза возрастает вероятность покупки, если текст на родном языке покупателя.

 

При этом вероятность покупки возрастает, даже если этот текст переведен машиной без редактирования. Если вы можете, читая на родном языке, понять суть написанного, вероятность покупки все равно среднестатистически выше, чем, если это будет на английском языке.

 

Понятно, что в каждой стране есть некая аудитория, которая совершенно не ощущает границ и вообще давно уже мультикультурна: перемещается и читает на английском свободно, не испытывает никаких внутренних дискомфортных ощущений, покупая что-либо на английском языке. Но это не большинство. Это даже не 50% в каждой стране, поэтому переводить необходимо, если компания серьезно работает на локальном рынке.

 

JSON TV:Каков объем рынка переводов. Это чтобы представить себе, сколько может перевести один переводчик, сколько может перевести машина, и с каким качеством работать. И вообще весь этот рынок, теперь уже не бумажный, а электронный.

 

Иван Смольников: Порядок примерно следующий. Как говорят разные ведущие аналитики, примерно 33–35 миллиардов долларов в год компании и люди по всему миру тратят на услуги перевода. Это включает все.

 

JSON TV: Это по деньгам, а по объему? Вы же считаете. У вас есть определенный объем знаков. Не все, что выходит в интернете, не все, что публикуется в той или иной форме. Сколько переводчик может сделать? У вас же штат профессиональных переводчиков тоже есть, насколько я понимаю.

 

Иван Смольников: Да, конечно. У нас ежедневно работает порядка тысячи переводчиков по всему миру. Только они не все в штате, потому что тут есть такой важный фактор: культура перевода состоит в том, что если мы переводим на определенный язык, то это должен делать носитель целевого языка. Не оригинального, а целевого.

 

JSON TV: Это и в ООН долго было принято, хотя с этим переводчики иногда спорят, иногда проще переводить на иностранный, но есть такое.

 

Иван Смольников: Даже если переводчик настолько хорош, чтобы переводить на иностранный, если мы говорим о тексте, который потом публикуется в маркетинговых материалах и прочем, его крайне желательно, (вообще говоря, необходимо), вычитать носителю целевого языка после переводчика. Тогда мы достигаем хорошего уровня качества.

 

У нас есть тысяча переводчиков, и они по всему миру. Если мы переводим с английского на вьетнамский, мы это делаем во Вьетнаме, а не здесь, российскими переводчиками, которые сидят в штате.

 

Объем рынка, как я сказал, порядка 30-ти миллиардов долларов. В переводе на страницы, я бы сказал, что это, наверное, 5–6 миллиардов страниц текста в год.

 

JSON TV: Страницы стандартные, по 1800 знаков, как всегда считали?

 

Иван Смольников: Там примерно 250 слов (1800 знаков). Примерно вокруг этого. Наверное, это делается миллионом переводчиков. Где-то так. На рынке присутствует порядка 30-ти тысяч более-менее приличных по размеру компаний в мире. Где-то примерно миллион, полтора миллиона переводчиков, и 30 – 50 (может быть, до 100 тысяч, если взять совсем мелкие) компаний во всем мире. Это в основном перевод разной корпоративной документации. Конечно, здесь и всякий худлит играет роль, и машинный перевод как доля рынка тоже сюда входит.

 

По объему машинного перевода я вообще затрудняюсь сказать, потому что в этом отношении технологии, которые в свое время принес на рынок Google (а потом Microsoft это стал делать), поменяли в этом плане картину. Объемы, которые там прокачиваются, я уверен, в сотни, в тысячи раз больше перевода, который делается людьми, или с использованием машин и людей одновременно. Но в этом объеме рынка, который я сказал, машинный перевод тоже участвует как звено в цепочке профессионального перевода.

 

JSON TV: В худлите тоже машины используются?

 

Иван Смольников: Это бессмысленно.

 

JSON TV: Человек мыслит образами и пишет образами, а машине еще далеко до этого.

 

Иван Смольников: Ценятся разные вещи. В технической документации, в договоре ценится единообразие языка, а в худлите – многообразие, красота языка. Настроить хорошо машину… Вернусь еще раз к тому тезису, что мы засовываем в публичные сервисы и получаем оттуда не всегда удачный перевод. Иногда очень удачный, кстати говоря, потому что статистика позволяет иногда выбрать очень удачный вариант. Вы смотрите, а ничего редактировать не нужно –  все понятно. Но частенько неудачный.

 

В корпоративном случае настраивается на определенные тексты и типы текстов так, что все в целом хорошо. С худлитом это практически невозможно, да и бессмысленно. Это же искусство, люди получают удовольствие от процесса.

 

JSON TV: Давайте поговорим немножко о линейке ваших собственных продуктов, которыми вы занимаетесь. Что наиболее перспективно. Все ли предыдущие области и направления тоже поддерживаете.

 

Иван Смольников: Самое главное, что мы сейчас делаем в плане технологии автоматизации перевода – мы сделали платформу, которая в облаке (то есть в интернете) через браузер позволяет любому переводчику использовать все современные технологии автоматизации.

 

В России и вообще в мире в целом проникновение технологий автоматизации до конечного переводчика, в том числе индивидуальных переводчиков (фрилансеров так называемых), было не очень высоко. Мы хотим это поменять. Мы хотим сделать так, чтобы эти технологии стали доступны каждому. Для индивидуальных переводчиков мы отдаем бесплатно.

 

Сегодня человек может прийти на сайт, зарегистрироваться и начать использовать и машинный перевод, и технологии translation memory, и глоссарий, и все вообще. В одном месте, в облаке, бесплатно по большинству вот этих технологий.

 

JSON TV: Прямо благотворительность.

 

Иван Смольников:  Ну, в этом есть, безусловно, цели определенные. Это чтобы процесс стал более технологизированным, и мы могли большее количество переводчиков использовать вместе с этими технологиями. Не как сейчас, когда нужно их сначала обучить, потом уговорить, а потом оказывается, что им нужно купить этот продукт, а мы им не готовы его купить. В общем, непрерывный процесс обхаживания вокруг этого.

 

JSON TV: Вы набираете объем аудитории. Фактически как соцсети в какой-то степени. Аналогия хоть и отдаленная, но присутствует.

 

Иван Смольников: Да. При этом в нашей системе, в нашем продукте, переводчик может переводить любые тексты, в том числе свои. Не обязательно, чтобы он работал на нас. Мы этому не препятствуем, более того, это поощряем. Главное, чтобы он давал обратную связь по улучшению продукта. Не совсем благотворительность, потому что если компания покупает это для себя и использует в этой же системе своих штатных переводчиков, она за это платит: за рабочие места этих людей. Мы продолжаем работать в корпоративном сегменте, но для индивидуальных переводчиков мы отдаем это все бесплатно сейчас.

 

Это очень, я считаю, интересная и правильная штука, которая должна постепенно поменять рынок в целом (я уже не верю в изменения за один день), потому как она должна кардинально улучшить проникновение технологии к конечному переводчику.

 

Сейчас компания на верхушке пирамиды может быть очень технологизированной и современной. Дальше доходит до конечного исполнителя, а там в лучшем случае MicrosoftWord, и все на этом. Использовать все современные штуковины, которые позволяют переводить быстрее, дешевле и даже качественнее, не получается. Это проблема для рынка, которую мы меняем сейчас.

 

JSON TV: Как вы оцениваете вашу долю на рынке, и в какой позиции находитесь? Кто основные игроки, ваши конкуренты.

 

Иван Смольников: Рынок переводов, так сложилось исторически, очень фрагментирован. Он большой, но на нем много игроков. И нет игрока на рынке, даже в мире, который бы обладал долей рынка более чем 1–2%. Таких, которые имеют долю рынка в 10%, а тем более 20–30%, не существует. В России порядка тысячи, полутора тысяч переводческих компаний. Из них крупных порядка 10–20 максимум.

 

Мы уже не один год являемся крупнейшей, либо одной из крупнейших, в зависимости от того как считать. Это такие сложные штуки. Иногда аналитики посчитают так, иногда по-другому. В целом, точно всегда являемся в тройке крупнейших компаний. Иногда считаемся самой большой, иногда нам говорят, что мы в тройке крупнейших в Восточной Европе. Всегда говорят, что мы в первой сотне в мире. Вот примерно такой приблизительный расклад.

 

JSON TV: Основная конкуренция идет с Google и Яндекс?

 

Иван Смольников: Нет, абсолютно. Мы не конкурируем с ними. Они дают бесплатный сервис индивидуальному конечному потребителю. Мы же работаем с компаниями, которым предоставляем полный цикл профессиональных услуг лингвистического обеспечения от начала до конца.

 

Прежде всего, это профессиональный перевод: письменный, устный. Разные технологии, чтобы автоматизировать процесс и сделать его более эффективным, а значит перевод для компании более дешевым. Мы можем просто им продать технологии, можем сделать полный цикл.

 

Разные нарезки. Но это все то, где мы с Googleи Яндексом никак не пересекаемся вообще, потому что публичные системы машинного перевода в корпоративной среде для серьезных документов нельзя использовать (из-за публичности).

 

Еще потому, что как раз тот самый факт про настройку качества, о котором я говорил. Ну и потом, корпорации могут относиться к машинному переводу как к одной частичке всего процесса, но не как к заменителю всего переводческого цикла и вообще всей задаче перевода контента на многие языки.

 

JSON TV: Машинизация перевода должна, по логике, уменьшать стоимость перевода для конечного потребителя. Это так и есть или есть какие-то загогулины на этом рынке?

 

Иван Смольников: Нет.

 

JSON TV: Можете сравнить стоимость работы квалифицированного переводчика, индивидуального человека, с помощью машины, либо без машины и машинного перевода с примитивным редактированием?

 

Иван Смольников: Смотрите, очень просто. Представим, что переводчик работает в компании. Не будем брать переводческий бизнес, которым мы занимаемся. Вот переводчик в компании «Газпром» работает. Переводит, например, 200 страниц текста в месяц. Это достаточно стандартная нагрузка: это значит, что в день он переводит примерно 10 страниц. Ну, может быть, 8-10. Стандартная скорость.

 

Например, компании Х или компании «Газпром» он стоит, со всеми налогами, с его рабочим местом и со всеми overhead – 100 тысяч рублей в месяц. Нормальная оценка. Наверное, не завышенная, с учетом того, что его чистая зарплата за вычетом налогов составляет, например, 50 тысяч рублей.

 

Это означает, что его 200 страниц на 100 тысяч дают примерно 500 рублей за страницу себестоимости конечной продукции для компании, в которой он работает. Стоимость «сырого» машинного перевода на выходе одной страницы составляет примерно 5-10 рублей даже с настройкой, с внедрением, со всем остальным. Может быть чуть-чуть больше где-то, а скорее меньше на больших объемах. То есть разница в 100 раз примерно.

 

Что будет, если переводчик будет использовать машинный перевод в качестве входа, чтобы его редактировать и потом дальше запускать по тому же самому каналу, как и раньше. Если перевод настроен хорошо, то производительность переводчика вырастет минимум на 50%. Таким образом, если раньше себестоимость его страницы стоила 500 рублей, то сейчас будет, например, 350 или 330. Плюс 10 рублей за стоимость машинного перевода, получается 340–350.

 

Таким образом, раньше себестоимость была 500, а стала 350. Разница очень существенная. Экономический эффект очень существенный. Если «на пальцах», то примерно так это выглядит.

 

JSON TV: Ваши кумиры в бизнесе. Вы пошли в бизнес, потому что хотели быть похожим на Гейтса?

 

Иван Смольников: Вы знаете, нет! Я многих людей очень уважаю и в мировом бизнесе, и в отечественном. Читаю про многих людей. Но слово «кумир» я никогда не применяю. Мне кажется, это не очень правильно – стараться быть похожим на кого-то. Главное – это внутренний комфорт и  баланс. Тогда все хорошо. Поэтому я могу назвать много людей в технологическом бизнесе, которые мне симпатичны, но я никогда не пытаюсь исследовать человека абсолютно многогранно и понять, кумир он для меня или не кумир.

 

JSON TV: Вы трудоголик? Работаете сто часов в неделю.

 

Иван Смольников: Да. Сто уже не могу. Наверное, раньше работал сто, а сейчас семьдесят, восемьдесят уж точно.

 

JSON TV: Исповедуете принципы коллективной работы, вернее организации распределения ролей, либо стараетесь следить за всем сами?

 

Иван Смольников: Вопрос сложный. Совершенно точно исповедую принцип, когда в компании должно быть много сильных людей, которые в том числе сильнее меня в определенных вопросах. Так оно и есть в данный момент. Все ключевые люди в компании в настоящий момент сильнее меня в определенной области знаний – это раз. Второе – исповедую принцип, что свободу людям и независимость в принятии решений нужно давать очень большую.

 

При этом мне кажется правильным, когда люди на руководящих позициях понимают детали того, чем они занимаются и того, чем они управляют. Когда я вижу, что человеку не совсем хватает понимания деталей, я, конечно, влезаю и помогаю, но не с целью чаще всего сделать работу за человека, а помочь ему построить работу так, чтобы он мог самостоятельно давать нужные результаты.

 

JSON TV: Любимые гаджеты. Высокотехнологичные программы всегда о них спрашивают: что у вас всегда с собой? Пять, десять, пятнадцать?

 

Иван Смольников: С собой всегда телефон и планшет. Это то, с чем уже научился жить как-то и не представляю. С собой всегда некоторое программное обеспечение, которое позволяет записывать информацию и хранить, и чтобы она была синхронизирована на разных устройствах.

 

Это всегда со мной, потому что это важно. Я привык записывать. Давно уже не помню все, что нужно сделать, или идеи – они улетучиваются. Давно стал ценить не сами идеи, а качество и возможность их выполнить, поэтому их нужно записать, а потом по возможности вернуться и запустить в рабочий процесс. Это очень важная часть жизни.

 

JSON TV: Часто ли обновляете свои гаджеты? Следите за модой или за новыми технологическими возможностями?

 

Иван Смольников: Нет, я вообще немодный человек. Я сторонюсь. Я на самом деле, помню, даже iPhone купил уже спустя, когда несколько итераций обновилось. Я все что-то сопротивлялся, но потом понял, что зря. Иногда, наверное, опаздываю, но обновлять есть смысл, только когда перестает работать. За новинками я не гонюсь, нет.

 

Но последнее время стараюсь из профессиональной, так сказать, точки зрения покупать что-нибудь, если понимаю, что опыт, полученный от взаимодействия, может быть полезен для возникновения новых идей в бизнесе. Это стараюсь делать, но так, чтобы просто выискивать, тестировать – такого нет вообще.

 

JSON TV: У вас есть бизнес-мечта?

 

Иван Смольников: Да. Я сейчас занимаюсь бизнесом-мечтой, который мне очень нравится. Мне искренне интересно то, что я делаю, но мне хочется его трансформировать в реально глобальный, большой бизнес, который трансформирует отрасль хотя бы отчасти.

 

Вот это мечта. Когда она сбудется… Пока не знаю, чего дальше. Не загадываю так далеко, но пока мы в процессе. Мы пока далеки от того, чтобы стать действительно заметной на глобальном рынке компанией.

 

Заметны мы сейчас – мы в первой сотне. Но компании, которые влияют на отрасль в глобальном масштабе, это компании из первой десятки, поэтому это одна из целей – оказаться там. В России мы давно влияем, мы давно в самом топе этих компаний, но российский рынок – это меньше 10%. Меньше 5% на самом деле или даже 3% от глобального рынка. То есть степень влияния на всю мировую отрасль рынка – маленькая пока.

 

Хочется, чтобы это поменялось. Для этого мы разрабатываем много интересных технологий. Надеюсь, получится.

 

JSON TV: Сегодня JSON TV был в гостях у Ивана Смольникова, генерального директора ABBYY Language Services.

 

Спасибо вам огромное за этот разговор.

 

Иван Смольников: Спасибо вам.

 

JSON TV: Всем счастливо.

 

Заказать стенограмму TV-программы, Интервью, Конференции, большого Форума или Конгресса, радиопрограммы - делового или светского мероприятия можно в компании «Свежие Материалы» Тел. +7 904 64 226 79 , info@ima-ges.ru