Cобытия

IDC: мировые продажи планшетов в I квартале 2024 г. выросли впервые за три года

20:22

В ООН сообщили о росте цен на еду в мире

19:45

МЭР представило стандарт отчетности об устойчивом развитии для бизнеса

19:00

Apple и Amazon закрыли сезон отчетности «бигтехов»

14:00

Производственная активность еврозоны в апреле сокращалась 22-й месяц подряд

12:42

Россияне оценивают работу профсоюзов чаще негативно, но уверены, что они нужны

11:30

Роснедра: РФ обеспечит себя дефицитным минеральным сырьем и начнет его экспорт к 2030 г.

11:00

Выдача сельских ипотек в России выросла в полтора раза

Вчера 18:45

Владимир Путин одобрил соглашение о системе таможенного транзита в ЕАЭС

Вчера 18:15

Туристам не хватает номеров

Вчера 17:00

Американцы считают TikTok инструментом влияния Китая

Вчера 16:30

Биткоин подешевел на 10% после приговора основателю Binance

Вчера 13:59

ФРС сохранила базовую ставку на уровне 5,25–5,5%

Вчера 12:30

ОЭСР улучшил прогноз по росту ВВП России на 2024 год с 1,8% до 2,6%

Вчера 12:00

Михаил Мишустин дал поручения по развитию экономики предложения

Вчера 11:24

ЦБ РФ: за год на 54% больше стало нелегальных финансовых проектов и организаций

30 апр 13:15

Генсек ОПЕК: «конца нефти не видно»

27 апр 20:00

Обязательная продажа валютной выручки продлена на год

27 апр 19:30

Банк России: в пенсионной системе накоплено более 7,5 трлн рублей

27 апр 18:53

Владимир Путин: рост ВВП в 2024 г. будет более 3%, инфляция снижается, импорт надо вытеснять

27 апр 16:00

Безработица в Германии вырастет до самого высокого уровня за почти 10 лет

27 апр 14:33

МЭР: курс доллара к концу года вырастет до 98,1 рублей, евро — до 109,5 рублей

27 апр 13:45

МЭР: годовая инфляция в РФ замедлится до 5,1% к концу года

27 апр 13:24

Обсуждается исключение семей с высокими доходами из льготной ипотеки

27 апр 12:16

Капитализация Alphabet впервые превысила $2 трлн

27 апр 11:27

Закупки госкомпаний у МСП в I квартале сократились на 36% год к году

26 апр 20:10

Россия, КНР и Казахстан строят транспортно-логистический хаб в Подмосковье

26 апр 19:33

Reuters: BYD продает электромобили по миру вдвое дороже, чем дома в Китае

26 апр 19:00

Бигтех отчитался за первый квартал

26 апр 18:16

Сергей Лавров: Россия заинтересована в освоении месторождений лития в Боливии

26 апр 16:02

«Эксперт РА», журнал «Эксперт» и ВЭБ.РФ подготовят национальный рейтинг юридических консультантов

26 апр 11:30

Мировое потребление вина упало до минимума за 27 лет, производство — за 60 лет

26 апр 11:20

Производство топлива в России в апреле стабилизировалось

26 апр 10:39

Рост ВВП США в I квартале замедлился до 1,6%, а инфляция разогналась до 3,7%

25 апр 20:00

TikTok оспорит в суде закон о запрете соцсети в США

25 апр 15:55

Экспорт российской рыбы в 2023 г. расширен на 18 стран

25 апр 13:46

Число вакансий для студентов в РФ за год выросло на 24%, для пенсионеров — на 14%

25 апр 13:04

Россия сократила экспорт электроэнергии на 20% в I квартале

25 апр 12:30

Bloomberg: изъятие активов РФ может привести к глобальной дедолларизации

25 апр 12:00

МЭР: промышленное производство РФ в марте выросло на 4%

24 апр 20:45

МЭР: недельная инфляция в РФ c 16 по 22 апреля замедлилась до 0,08%, годовая — до 7,82%

24 апр 20:30

Отстающие ЦПЭ выполнят показатели нацпроекта благодаря межрегиональному наставничеству

24 апр 20:22

Президент США подписал закон о возможной блокировке TikTok

24 апр 19:45

МЭА понизило глобальный прогноз роста спроса на газ и поставок СПГ на 2024 г.

24 апр 19:15

МЭА: зимой РФ нарастила экспорт газа в Европу на четверть, в 2024 г. его добыча в стране вырастет на 5%

24 апр 18:46

DNV: Китай не сможет отказаться от угля к 2040 г.

24 апр 12:39

Илон Маск: Tesla может начать продавать роботов Optimus в 2025 г., а уже в этом они начнут работать на заводах

24 апр 12:00

Минпромторг: все торговые сети в России продают газеты и журналы

24 апр 11:30

Владимир Путин: решение по запуску третьего этапа развития БАМа и Транссиба принято

24 апр 11:03

Apple лишилась титула крупнейшего продавца смартфонов в Китае

23 апр 20:30

Все события

Помощник, а не конкурент

Практика 22 апр 2024 16:40

Ирина Барская

Активное развитие искусственного интеллекта (ИИ), в том числе генеративных нейросетей, уже сейчас влияет на рынок труда. Внедряя решения с ИИ, компании стремятся предоставить пользователям новые функции и автоматизировать процессы, и люди начинают опасаться за свои рабочие места. Текущую ситуацию можно сравнить с промышленной революцией — да, она отняла у некоторых людей работу, но и способствовала появлению большого количества новых профессий. Бизнесы, которые используют ИИ в своей работе, убеждены, что это в первую очередь полезный инструмент и «второй пилот» для их сотрудников. Он позволяет уменьшить число рутинных задач и сфокусироваться на чем-то более стратегическом и глобальном.

Ирина Барская

Руководитель службы аналитики и исследований «Яндекса»

Как работают языковые нейросети

Генеративный искусственный интеллект (GenAI) — это тип алгоритмов машинного обучения, предназначенных для создания текстов, изображений и другого контента на основе пользовательских запросов. Мы сфокусируемся именно на текстовых генеративных нейросетях.

Процесс обучения генеративного языкового ИИ можно разделить на три основных этапа.

Pretrain. Это первый этап обучения модели на ранее собранном наборе данных. Например, pretrain-датасет YandexGPT состоит из данных из открытых источников. Их отбирают с помощью поисковых технологий, а также используют разные фильтры, чтобы исключить бесполезный или «вредный» контент.

На этапе pretrain модель учится предсказывать следующее слово в предложении. Здесь она вбирает базовую эрудицию и знания о естественном языке. На этом этапе нейросеть еще не умеет понимать запросы и не может на них отвечать.

Alignment, или finetune. Этап, на котором нейросеть учат «понимать» человека. Здесь важную роль играют AI-тренеры. Тренеры пишут для обучения модели эталонные ответы на разнообразные запросы (промты). Множество таких запрос — ответных пар загружаются в нейросеть. Так она учится понимать инструкции на естественном языке.

Так, например, нейросеть учится отвечать длиннее или короче, смешно или серьезно, понимать, что значит «объясни ребенку». В этот же период модель обучается корректно выражать свои мысли в рамках сложных тем — так у нее появляется этика.

После этапа finetune моделью уже можно пользоваться и вести с ней диалог.

Reinforcement learning (RL). На этапе RL качество работы нейросети улучшают. Для этого нужно создать и обучить отдельную модель (она называется reward-модель), которая могла бы оценивать качество ответов основной модели.

Здесь тоже помогают AI-тренеры: они размечают ответы нейросети. Например, специалист может получить пять ответов модели на один и тот же вопрос. Он должен проверить каждый по нескольким параметрам и поставить им оценку. Кроме того, они выделяют в ответах проблемные места и объясняют, что в них не так. После этого специалисты располагают ответы от лучшего к худшему. Все эти данные показываются reward-модели, чтобы она научилась предсказывать, какой ответ будет считаться хорошим.

Reward-модель как бы дает фидбек основной модели, которая генерирует ответ, и она таким образом дообучается, выдавая результаты все лучше и лучше.

Кто учит нейросети

Чтобы скормить нейросети огромное количество информации на этапе pretrain, ее сначала надо собрать. Этим занимаются специалисты, которых принято называть Data Scientists. Профессия находится на стыке статистики, машинного обучения (ML) и программирования. В основные обязанности Data Scientists входят сбор, обработка, анализ и визуализация данных. Спрос на таких специалистов всего за несколько лет вырос более чем в семь раз.

Дополнительно к процессу pretrain можно привлечь Data-инженеров. Они создают инфраструктуру для работы с данными, отвечают за их упорядочивание и хранение. Отмечу, что, в отличие от Data Scientists, они не занимаются анализом, но обеспечивают других специалистов нужными для работы инструментами.

На основе данных, собранных Data Scientists, ML-инженеры создают модели. Они также занимаются их обучением, оптимизацией, контролем и улучшением качества. Как и Data Scientist, ML-инженер входит в рейтинги самых востребованных профессий в IT.

Важно понимать, что ML существует давно, поэтому все вышеперечисленные профессии сложно назвать новыми. Но для работы с генеративным ИИ нужны специфичные хард-скиллы, поэтому профессия в этой области немного видоизменилась.

После того как «память» модели заполнили в достаточной степени, наступает второй этап обучения — alignment, про который я уже рассказывала выше. Здесь ключевую роль в процессе играют люди новой профессии — AI-тренеры.

Задачи тренеров ИИ условно можно разделить на две категории: написание качественных, эталонных текстов для дообучения модели и ранжирование нескольких вариантов ответа нейросети на один и тот же вопрос от худшего к лучшему. Проще говоря, сначала необходимо показать модели, что от нее ожидают, а затем оценить качество того, как она поняла задачу.

«Яндекс» стал первой компанией в России, которая повлияла на зарождение и образ профессии AI-тренера. Сейчас в компании уже несколько сотен таких специалистов, включая шефов, которые сами готовят и обучают не только нейросети, но и новые кадры. Мы открыли целую Школу AI-тренеров, в которой уже прошли два набора.

Нейросети не умеют проверять информацию и иногда могут «галлюцинировать»: придумывать несуществующие факты, людей и так далее.

За последний год мы сильно сократили количество подобных ошибочных ответов. И значимая часть этой заслуги, безусловно, принадлежит AI-тренерам. Нужно знать, какие источники можно использовать для проверки, и в принципе ставить под сомнение любой факт «из уст» языковой модели.

Кто строит карьеру на использовании нейросетей

Если изучить рынок вакансий в креативной сфере, то можно заметить, что навык «владения нейросетями» становится трендом и конкурентным преимуществом.

Сейчас, по данным «Нейростата», уже около 30% интернет-пользователей в России использовали генеративные нейросети. И есть люди, которые делают на этом карьеру.

Так появилась новая профессия — промт-инженер. Его основная задача — подобрать такой запрос, чтобы получить релевантный и точный результат. Например, промт-инженер может создать рекламное объявление, используя только нейросетевые инструменты.

На то, чтобы написать с помощью промта хороший текст, иногда может потребоваться больше времени, чем если бы его писал профессиональный копирайтер. Зато такие запросы нейросетям можно масштабировать и поставить на поток. Поэтому цель промт-инженера заключается не просто в том, чтобы написать один хороший запрос, но и понять, за какие ниточки стоит дергать конкретную модель.

Продвинутый промт-инженер может обладать и определенными хард-скиллами: знать языки программирования (Python, Java и другие), иметь навыки работы с API и методами анализа данных, иметь представление об обработке естественного языка.

Материалы по теме:

Практика, 3 апр 07:30

Опора на собственные ватты

Кому нужна малая энергетика

Свежие материалы

Вернуться в начало