Yandex.com пересек границу

Василий Каснакин
24 мая 2010, 00:00

«Яндекс» запустил поиск в англоязычном интернете. Главная цель компании не мировое господство, а увеличение отрыва от Google на российском рынке. Но одно другому не мешает

Российский поисковик начал индексировать зарубежные сайты около двух лет назад, но в выдаче (страница, которая является ответом на запрос пользователя) ино­язычные результаты появлялись вместе с русскоязычными — скорее как дополнительные данные. С 20 мая «Яндекс» начал искать информацию, расположенную исключительно на зарубежных сайтах. Получить ее можно, используя либо фильтры поиска на портале yandex.ru, либо тестовую площадку yandex.com, на которой иностранный поиск установлен по умолчанию. «Яндекс» проиндексировал более 4 млрд веб-страниц на латинице, большая часть которых на английском языке, меньшая — на французском и немецком.

Некоторые аналитики поторопились предположить, что компания выходит на международные рынки. Одним из аргументов является расположение тестовой площадки на английском языке в международной зоне .com. Однако 4 млрд проиндексированных «Яндексом» страниц на латинице — это очень немного в масштабах мировой сети. В 2008 году в официальном блоге Google было сказано, что поисковик знает 1 трлн гиперссылок (правда, не все они ведут на уникальные страницы). Получается, что пока накопленной базы для работы на международном рынке у российского поисковика маловато.

Но «Яндекс» это не смущает. Как рассказывают в компании, в первую очередь индексировались страницы, которые содержат контент, максимально соответствующий запросам пользователей, то есть в поле зрения поисковика попали лишь наиболее авторитетные источники информации. Несмотря на то что страниц в интернете огромное количество, далеко не все они содержат полезную информацию. Так, согласно прошлогоднему исследованию контента рунета, проведенному «Яндексом», примерно четверть из 15 млн российских сайтов почти не содержит полезных сведений, а порядка 88% текстовой информации сконцентрировано всего на 1% сайтов. Именно этот 1% и является наиболее интересным для пользователей. Такие соотношения верны для всей мировой сети, поэтому для того, чтобы ответить на запрос пользователя, необязательно индексировать всю информацию. Достаточно выбрать авторитетные источники по теме и ранжировать их, чтобы на самом верху выдачи оказались наиболее подходящие пользователю или релевантные запросу результаты.

«У многих пользователей “Яндекса” время от времени возникает необходимость искать по зарубежным сайтам, — объясняет причины внедрения новой услуги пресс-секретарь компании Очир Манджиков. — Это мы наблюдаем уже в течение двух лет — с начала индексации зарубежного контента. Люди задают запросы и переходят на иностранные сайты. Проанализировав их, мы поняли, что есть запросы, по которым нужны только зарубежные результаты». Таким образом, поисковик ввел новую функцию, именно исходя из потребности отечественных пользователей. Раньше они искали информацию на зарубежных сайтах американскими поисковиками, в первую очередь Google.

Поэтому главная цель новинки — отвоевать еще одни маленький кусочек отечественного рынка у Google, с которым российская компания ведет планомерную борьбу. В конце прошлого года «Яндекс» нанес американцам массированный удар — внедрил в ноябре прошлого года «Матрикснет», технологию, используемую при создании формулы ранжирования результатов поиска. Дело в том, что поисковым машинам свойствен так называемый эффект переобучения — на основе операций с большим количеством факторов и малой обучающей выборкой, которая делается практически вручную, алгоритм начинает находить несуществующие закономерности. «Матрикснет» устойчив к переобучению. Благодаря этому, по данным счетчика Liveinternet (см. график), «Яндекс» увеличил свою долю поисковых запросов с ноября прошлого года примерно на 4%. Сейчас у «Яндекса», по статистике Liveinternet, около 53,6% рынка, 34,2% пользователей предпочитают Google, 7,2% пользуются поиском mail.ru, около 5% — другими поисковыми системами.

Сколько процентов позволит отбить иноязычный поиск? Согласно статистике «Яндекса», количество запросов на латинице составляет 12−15%, но это еще не означает, что пользователю необходима информация с зарубежных сайтов. Например, вводя запрос «Nissan», пользователь зачастую хочет не попасть на глобальный сайт компании, а узнать локальную информацию о товаре — где он продается или где ремонтируется. Любителей посещать зарубежные сайты немного, по оценке специалистов, лишь около 1−2%. Но несколько процентов — это те самые копейки, которые берегут рубль на устоявшемся рынке.

В Европе yandex.com уже заметили. Дело в том, что «Яндекс» — одна из очень немногих национальных поисковых систем, являющихся лидерами на традиционном для них рынке. Обычно в этом сегменте доминируют американские корпорации — Google, Yahoo! и Microsoft с недавно запущенным поисковиком Bing. Кроме «Яндекса» на своем поле смогли сохранить лидерство чешский поисковик Seznam, китайский Baidu и сервис Naver в Южной Корее. Для большинства европейцев альтернативы Google просто не существует. Возможно, именно поэтому появление даже тестовой версии альтернативного поиска, судя по отзывам в западной прессе и блогах, всячески приветствуется. Не исключено, что российский поисковик забросил удачный пробный шар на европейский рынок.