- Как получилось, что все исследования и разработки Ectaco ведутся в России, в Петербурге, а головной офис, основной бизнес и продажи - в США?
- Компания основана в 1989 году русским эмигрантом, ленинградцем Давидом Лубяницким, который до сих пор и руководит Ectaco. В 1988 году он покинул СССР, около года ездил по разным странам и в конце концов решил остановиться в США. Первый бизнес Лубяницкого был совсем не высокотехнологичным - он работал тренером по бодибилдингу. Но в силу особенностей своего характера не мог сидеть на одном месте и ждал удобного случая реализовать себя в другом, более перспективном деле.
В какой-то момент ему попался на глаза один из первых электронных словарей, сейчас уже трудно доподлинно определить какой - скорее всего, китайский. Тогда они были крайне несовершенны, что-то наподобие первых электронных записных книжек. Это было вроде озарения - такие моменты знакомы многим успешным бизнесменам. И момент "встречи" Давида со словарем мы считаем исходной точкой отсчета истории компании. Давид, недолго думая, купил целую партию русскоязычных вариантов этих устройств, потратив на них свои последние деньги, которые с женой долгое время копил на мебель. Был даже семейный скандал, и теперь в Ectaco шутят, что наш бизнес начался с семейных разборок. Купив словари, Лубяницкий дал их рекламу в эмигрантскую газету. Из трех человек, позвонивших по этой рекламе, двое словари купили. Давид почувствовал себя крупным предпринимателем и снова дал рекламу - так начался настоящий бизнес. Думаю, что купи тогда словарь один человек, а не два, Ectaco бы не было.
Первые несколько лет Давид вел бизнес всего с одним напарником в небольшом подвальчике в эмигрантском районе Нью-Йорка и лично набивал в компьютер базы данных для первых русских словарей, а затем отправлял их по факсу в компанию, которая занималась производством "железа" по заказу. А из той фирмы, в свою очередь, поступали уже технологические наработки. Потом появились собственные технологии. Компания стала в прямом смысле компанией. Тогда же определилась и аудитория наших первых словарей - некоренные американцы, желающие овладеть английским языком.
Наверное, самый серьезный перелом произошел в середине 90-х годов, когда стало очевидно, что содержать собственный центр разработок в Нью-Йорке слишком дорого, и было принято решение перенести его в Петербург. Я же тогда стал первым сотрудником центра. С тех пор все разработки ведутся здесь, а управление фирмой осуществляется из Нью-Йорка. Там же, в США, в основном продается наша продукция.
- Питер выбрали только по патриотической причине?
- Конечно, то, что Лубяницкий родом из Петербурга, сыграло свою роль. Кроме того, здесь было легче сколотить профессиональную команду. В США это вопрос миллионных затрат и значительного времени, а здесь в связи с нашими кризисами и устройством жизни отличные кадры либо просто безработны, либо склонны к смене текущих профессиональных позиций. А стоит ли говорить, что это за люди? Выпускники Университета, ЛЭТИ, Военмеха (Балтийского университета) - то есть как раз специалисты нашего профиля.
- Все начиналось с обычных электронных переводчиков. Что подтолкнуло уйти в сложную наукоемкую область речевых технологий?
- Года три назад наметилась тенденция стремительного роста рынка разнообразных карманных технических устройств, в первую очередь портативных компьютеров. Тогда же стало очевидно, что для подобной техники применение голосовых технологий - реальная возможность выйти на принципиально новый уровень. Ведь посмотрите: одно дело, когда у вас стоит большой компьютер, рядом мышка, клавиатура, вы сидите в мягком кресле - вам удобно этим пользоваться, легко управлять работой машины.
Карманным многофункциональным компьютером, которым человек пользуется на бегу, очень часто даже одной рукой, постоянно управлять вручную крайне сложно. Именно поэтому внедрение речевых технологий, которые позволяют производить голосовой ввод и вывод информации, - стратегическое направление для карманных компьютеров. Таким образом бурно развивающейся "портативный" рынок подтянул, приблизил к живым деньгам технологии, основанные на распознавании речи.
Тем более это актуально для наших словарей. Ведь, совместив распознавание речи с возможностью перевода "на лету", можно получить устройство, которое доселе встречалось только в фантастических произведениях. Наши словари помогают людям общаться и изучать иностранные языки. Для нас применение голосовых технологий - это и возможность упростить работу с устройством, и сделать его более функциональным, оживить общение, повысить эффективность изучения языка.
- Это в полной мере применено на практике в вашей разработке UT-103?
- Не буду лукавить, UT-103 - это пробный шар, первое в своем роде устройство. Он уже стал историей, даже легендой. По правде сказать, технология, реализованная в нем и дающая очень приличное качество и скорость распознавания, несколько устарела - мы уже создали более совершенную. Новая - гораздо ближе к той, о которой я говорил: это та, благодаря которой произойдет диалог человека с карманным устройством.
А UT-103, этот разговорник с возможностью распознавания речи, как мы его позиционируем, впервые был показан в прошлом году на выставке COMDEX. С тех пор UT "засветился" практически во всех крупнейших мировых СМИ: BBC, CNN, Bloomberg, NY Times, Los Angeles Times... С первых недель своего появления в рознице он стал лидером продаж и остается им до сих пор. Судя по всему, он хорошо удовлетворяет потребности клиента, решает его проблемы.
- Несколько лет работая в области речевых технологий, вы уже можете оценить ее перспективность в целом. Стоит ли ждать серьезных изменений для потребителя в связи с бурным развитием речевых технологий?
- Нужно разделять научную и бизнес-составляющие. Само развитие возможностей распознавания речи последние лет 15, если это изобразить на графике, идет плавно по прямой. Каких-то резких скачков нет и, думаю, в ближайшее время не предвидится. Скачок этот будет на практике выражаться, скажем, в том, что наша с вами беседа будет синхронно переводиться на другой язык. Чтобы это стало реальностью, необходимы фантастические производственные мощности, новые неизвестные сейчас алгоритмы и т.д. - это, наверное, вопрос десятилетий. Но над созданием таких систем сейчас работает множество научных организаций, и, возможно, когда-нибудь они достигнут результата.
Пока же все изменения ограничиваются чаще всего незначительным увеличением процентной доли распознавания голоса. И, как мне представляется, сейчас все зависит от того, кто первый сможет использовать эти небольшие подвижки в свою пользу, применить их в реальном бизнесе. Деньги в этой области лежат на поверхности. И для потребителя тоже открываются широкие возможности. Секрет успеха прост - надо занять нужную нишу.
- Есть какие-то примеры?
- Их много. Могу рассказать о нашем опыте, помимо портативных переводчиков. Например, сейчас в Штатах есть явная тенденция: ряд компаний, работающих с массовым клиентом, пытаются уйти от его обслуживания вживую. Один из ярких тому примеров - автомобильные рестораны быстрого обслуживания типа MсDonald's. Как они устроены? Несколько десятков окошек, вы подъезжаете, говорите в микрофон заказ, девочка на той стороне его записывает и передает информацию другим работникам, которые уже заказ выполняют. Как только появляется возможность убрать из этой цепочки девочку, хозяин заведения экономит примерно 1500 долларов в месяц. 20 девочек - 30 тыс. долларов в месяц. Что мы можем предложить вместо девочек? Нашу технологию. Меню, которое заказывает клиент в подобных местах, довольно типовое, количество вариантов и комбинаций не слишком большое. Клиент произносит заказ, специальное устройство выдает информацию работнику, его выполняющему, без каких-либо лишних посредников. Очень простой вариант, но вот вам и живые деньги. Сейчас мы совместно с партнерами в США активно ведем разработки в этой области и, бог даст, этот проект будет реализован.
Нечто подобное - использование речевых технологий в call-центрах. Оно позволяет высвободить сотни тысяч человек, сотрудников таких структур, которые работают с типовыми вопросами и дают типовые ответы. Можно сделать так, что эти ответы будет давать машина.
Уверен, что без голосовых технологий в будущем не обойдется ни одно карманное устройство со сложной навигацией: MP3-плейеры, портативные компьютеры, мобильные телефоны. Последние, например, с каждым годом уменьшаются в размерах. Уже сейчас ввести sms-сообщение в маленький телефон - самое настоящее испытание. А у нас есть технология, которая позволяет ввести в мобильник любое слово по буквам.
Очень перспективный проект - туристический разговорник. Принцип работы тоже прост: вы произносите какую-то типичную для туриста фразу. Скажем, "я хотел бы заказать номер". А специальное устройство немедленно произносит ее по-английски. Прототипом его является UT-103, о котором я уже говорил. Мы работаем над более совершенным устройством и планируем, что оно появится на рынке года через полтора.
Наконец, пример от наших конкурентов. Недавно появились системы диктовки для врачей и юристов. Компании, которые первыми освоили эту нишу, сейчас купаются в золоте. Известно, что хороший частный врач в США получает до 1 млн. долларов в год. Таким образом, каждая страница бумаги, которую он написал собственной рукой, стоит ему несколько сотен долларов по затраченному времени. Потому ни один нормальный врач не будет писать многочисленные бумажки (истории болезни и т.д.) сам - он наймет секретаршу. Секретарша стоит ему примерно 3 тыс. долларов в месяц, или 36 тыс. долларов в год. И тут врачу предлагается альтернатива - система диктовки стоимостью 3 тыс. долларов. Врач надиктовывает специализированный текст, система записывает, секретарша в крайнем случае только подправляет. Аналогичная ситуация и с юристами. С учетом того, что на одного человека в США приходится по 3-4 юриста и врача, это огромный и очень перспективный рынок.
Примеров можно еще приводить множество, но все они будут свидетельствовать об одном - в данный момент развитие рынка речевых технологий идет очень бурно, появляются все новые решения. Компании, которые ранее занимались фундаментальными наукоемкими исследованиями, постепенно поворачиваются лицом к потребителю, пытаются удовлетворить его запросы. Опыт показал, что клиент довольно активно приобретает продукцию, в которой так или иначе присутствует возможность распознавания речи. Однако по-настоящему массовым этот рынок станет тогда, когда такой продукции будет представлено много - для различных целей.
Санкт-Петербург