Тест на терпение или немного о техподдержке

12 ноября 2012, 11:30

Интересно, какой максимальный срок для устранения неполадок сами провайдеры считают допустимым и от чего он зависит? От сложности повреждения или эффективности работы аварийных служб конкретного провайдера?

  • Денис Рычка
    Денис Рычка АКАДО, руководитель пресс-службы
    Внутри каждой компании есть внутренние регламенты по строкам устранения проблемы. Например, в АКАДО есть электронный журнал проблем, который заполняется по обращению абонентов или техническими службами при обнаружении снижения качества предоставления услуги.

    Я могу показать как это работает на живом примере:

    7 ноября произошел порыв оптики из-за внешнего фактора. Велись строительные работы какой-то внешней организацией и в нарушении регламентов, строительная техника начала работать вблизи кабеля, скорее всего, ими не использовалась строительная документация. В итоге повреждение кабеля и отключение 48 телеканалов у всех московских абонентов цифрового телевидения.

    Сразу же техническими службами была заведена авария в журнал проблем с решением 15 минут, так как это с лихвой хватило бы для резервированния канала, но резервирование не осилило потерю 48 телеканалов и периодически отключалось. В итоге мы имели аварию вместо 15 минут — 4 часа. Причем, так как резервирование отваливалось периодически, то абонентская служба не могла уведомить абонентов о конкретных сроках решения проблемы.

    В идеале хорошо, если аварий нет, но это слишком идеальная картина. На моей памяти самые продолжительные аварии на Сети, это те, которые произошли из-за внешнего фактора: вертолет МЧС намотал оптику и улетел вместе с ней, взрыв газопровода в Очаково, ледяной дождь, пожар на путепроводе на проспекте Мира и так далее. В таких случаях не всегда оперативно можно получить допуск к работам специалистам оператора связи. А сварка оптики и восстановление сетевого оборудования не занимает катастрофически много времени.

    Я хотел бы затронуть еще такой аспект. Как известно, сегодня управление домами перешло к ТСЖ и это оправданно, но как только выбирается руководство этих товариществ, то некоторые из низ сразу устанавливают оплату за доступ специалистам к сетевому оборудованию оператора, которое располагается на крыше или в подвале. В итоге страдают абоненты, проживающие в этом доме, ведь для устранения аварии, которая произошла на узле связи требуется оперативный доступ, а специалистам ограничен доступ к нему. По этой причине нам пришлось даже обращаться в ФАС за разъяснением, и в итоге мы выиграли дело в отношении одного такого ТСЖ.

    Действительно, есть типовые аварии, которые поддаются оперативному решению, незаметные клиенту, но если это авария, связанная с внешним фактором, то это становится уже экзаменом для эксплуатирующих подразделений телекоммуникационной компании.

    В АКАДО в начале этого года был образован Департамент контроля качества, который ведет независимую работу и оценку деятельности практически всех подразделений компании, отвечающих за предоставление услуг абонентам, так вот ежемесячно руководство компании получает данные по выполнению нормативов по срокам и качеству устранения аварий на Сети. Это позволяет не только осуществлять контроль, но и улучшать эти показатели.
  • Александр Хенкин
    Александр Хенкин 2КОМ, генеральный директор
    Поскольку вопрос задан генеральному директору провайдера 2КОМ, ответ будет настоящий провайдерский:

    Произносится четким командирским голосом — «Мы стремимся к тому, чтобы максимальный срок устранения неполадок не превышал времени сходимости протокола RSTP (Rapid Spanning Tree Protocol)».

    Ну а в реальной жизни происходит несколько иначе. Система мониторинга Сети практически мгновенно оповещает службы о возникших проблемах и начинается работа по локализации неисправности. Это может занять от нескольких минут до часа.

    За это время проблема либо устраняется удаленно, например изменением маршрутизации или реконфигурацией оборудования, либо принимается решение о необходимости выезда инженеров к месту аварии. В московских условиях аварийная бригада попадает на место в течение часа.

    Если это рабочее время рабочего дня, организационных проблем, как правило, не возникает, и в течение часа нам удается установить временный беспроводный линк между разорванными точками, а уже затем мы приступаем к восстановлению основного линка.

    Таким образом, штатное время восстановления связи не превышает 3 — 4 часов, но, к сожалению, это время может вырасти по независящим от провайдера обстоятельствам, таким, как отказ в доступе к оборудованию в доме, потому что «Приходите завтра, а сейчас уже после 20:00 и я вам ключи не дам» или «По распоряжению московского правительства на время выходных и праздников все работы на чердаках и в подвалах запрещены из соображений общественной безопасности».

    И тогда приходится уговаривать, выходить на уровень Управы, Префектуры и так далее, чтобы получить аварийный доступ, а это может занять и часы и дни, а время ремонта заметно возрастает.

    Есть еще отказы на абонентских окончаниях. Их невозможно обнаружить средствами мониторинга Сети, так как невозможно отличить отказ от просто выключенного компьютера абонента. Информация о таких проблемах поступает в наш Центр обслуживания, как правило, от самих абонентов и сразу передается дежурным инженерам.

    Нормативы 2КОМ настроены таким образом, чтобы такие заявки отрабатывались в день обращения, если это еще рабочее время и на следующий день, если заявка поступает после 18 часов. Но опять, оперативность устранения таких проблем во многом зависит от возможности доступа к оборудованию.

    А вывод я бы предложил следующий:

    Если для Вас критичным является непрерывность связи, нужно иметь резервный канал от мобильного оператора, а если очень критично, то от нескольких мобильных операторов, например в Москве это может быть кто-то из большой тройки через 3G и какой-то Wimax оператор. Это конечно дороже, но ведь, как известно, нервные клетки не восстанавливаются.
  • Михаил Андрианов
    Михаил Андрианов Bestint, ведущий специалист
    "Даже Мона Лиза разрушается" — сказал герой небезызвестной книги Чака Паланика. Все рано или поздно приходит в упадок, любой инженер это знает.

    Готовность к немедленной замене телекоммуникационного оборудования, способность предвидеть проблему до ее возникновения, умение найти источник неприятностей — вот показатели работы инженера технической поддержки/узлового инженера, это причины, по которым связь работает с наивысшими показателями отказоустойчивости, это, в моем представлении, показатель качества работы самого провайдера.

    К сожалению, даже при наличии всех трех качеств у поставщика услуг, время от времени происходят аварии. Для более обстоятельного ответа о сроках устранения неполадок, разделим аварии на 4 категории: аварии своего телекоммуникационного оборудования, авария на своей или дружественной магистрали, аварии с участием чужого оборудования, авария на транзитной магистрали.

    Как видно из принадлежности первых двух типов неприятностей, их обязаны решать мы. В большинстве случаев, дежурные инженеры справляются с проблемой по замене оборудования за несколько минут.

    Нередко, благодаря отработанной практике сохранения конфигураций оборудования, потребители не успевают понять, что произошла поломка.

    Дольше приходится разбираться на кабельных авариях. Ввиду погодных условий и сложностей по перекладке поврежденного участка кабеля, мы справляемся за 6 — 10 часов с привлечением субподрядчиков. Тут и наступает время для отделения профессионалов от любителей.

    В этот промежуток времени, необходимо позаботиться о своих клиентах, которые уже звонят и сообщают не только о своем негодовании, но и финансовых потерях, которые несут их компании.

    Требуется найти любой способ хотя бы частично решить проблему потери связи. Никаких общих инструкций здесь не существует: если в здании, с которым потеряно соединение, присутствует провайдер не пострадавший от разрыва, нужно найти с ним общий язык и договориться об условиях подачи связи, используя его ресурсы.

    Даже если все здание обесточено, не работают ни компьютеры, ни серверы, и в кулере вода достигла комнатной температуры, это не означает, что у провайдера совесть чиста. Необходимо позаботиться хотя бы о телефонии.

    Ведь для многих компаний факт отсутствия электричества в розетке не отменяет возможности принимать звонки от потенциальных и постоянных клиентов. Тогда и только тогда можно говорить об успокоении совести.

    Отдельного рассказа требует ситуация с поломкой оборудования 3-й стороны, разрывающей цепочку передачи данных. Сразу скажу, что это вопрос исключительно индивидуальный, и сроки устранения проблемы трудно сформулировать с точностью до часа.

    Однако есть методы борьбы с зависимостью от транзитных провайдеров: главный из них — зеркалирование (failover mirroring). Все просто: Вы создаете платформу для телефонии, видеосвязи, обработки запросов, биллинга и всего того, что нужно Вашим клиентам и Вам, как провайдеру, а после окончания строительства, беретесь за строительство новой под те же нужды, только уже совсем на другой магистрали.

    Этот способ довольно дорог в реализации, однако дает ряд неоспоримых преимуществ. При проблемах на транзите данных (перегрузке оборудования, обрывах, авариях, отключении электропитания узла), всегда можно незримо переключить клиентов на зеркальную платформу.

    Однако зеркалирование нельзя применять повсеместно, так как любой провайдер услуг передачи данных или голоса находится в одной глобальной цепочке, под названием «всемирная паутина».

    Эта цепочка имеет иерархическую структуру от родительского коммутатора к дочернему, нескольким дочерним в одной магистрали, нескольким дочерним в разных магистралях. То есть работает принцип «всегда есть рыба крупнее». Представьте ситуацию, в которой Вы обязаны дождаться представителя верхнего провайдера (ответственного за родительский коммутатор), только для того, чтобы открыть опломбированный шкаф и самому перенастроить чужое оборудование, в то время, как сотрудница Вашего центра поддержки звонит и говорит, что крупный клиент ругается, припоминая всех ее ближайших родственников, и разрывает договор. Именно это называется аварией на оборудовании верхнего провайдера. А еще бывают и опломбированные шкафы ГУВД.

    В последние годы, мы все реже сталкиваемся с подобными проблемами. Отчасти благодаря межпровайдерским отношениям, отчасти благодаря опыту и отлаженным действиям инженеров, отчасти, благодаря уменьшившейся, за последние годы, нагрузки на оборудование.

    Как бы там ни было, инженеры технической поддержки должны быть готовы к любой ситуации, будь то выслушать недовольного клиента, сидя в офисе, перенастроить биллинговый сервер в 4 утра или заменить коммутатор, находясь на М IХ. Такова работа связиста, и, люди, пользующиеся услугами связи не должны о ней даже догадываться.

    В заключение, я хотел бы поблагодарить всех наших клиентов, которые когда-либо испытывали трудности в получении телекоммуникационных услуг: Спасибо за Ваше терпение и оказанное доверие.