Из России с любовью. Третий сезон

Сергей Пименов: «Конечному пользователю нужен простой алгоритм работы с ИИ-помощником»

Музыкальный продюсер, инженер и разработчик ИИ-ассистентов продолжил рассказ о своих проектах.

Сергей Пименов: «Конечному пользователю нужен простой алгоритм работы с ИИ-помощником»

Сергей Пименов: «Конечному пользователю нужен простой алгоритм работы с ИИ-помощником». ЕвроМедиа Музыкальный продюсер, инженер и разработчик ИИ-ассистентов продолжил рассказ о своих проектах.
Лого ЕвроМедиа

Ряд разработок с использованием искусственного интеллекта Сергей Пименов уже создал в помощь журналистам: «Могу рассказать про продукты, созданные, в частности, для холдинга «Евромедиа». Ввиду того, что мы вникаем в бизнес-процессы и находим «некую боль», поэтому, прежде всего, стараемся облегчить рутинные процессы. Я же понимаю специфику журналистской работы, сам много лет работал на радио, и в жизни много и давал, и сам брал интервью. А для любого интервьюера «боль» – это расшифровка аудиозаписи. Это самая нудная работа, но без которой - никуда. Часто, после того, как журналист берет интервью, он потом пропадает на месяц, и редактор спрашивает: «Ну, а где же интервью, когда оно выйдет?». А журналист говорит, что еще не расшифровал. И вот для облегчения процесса перевода звучащего слова в буквы я использовал одну из возможностей, широко применяемую в больших языковых моделях. Это то, что называется транскрибация, то есть, расшифровка аудио в текст. Уже существуют хорошие модели, их много, какие-то лучше понимают аудио, какие-то хуже. Но расшифровать аудио - это только первая часть, потому что текст получается такой «грязный». Поэтому мы пошли дальше и нашему боту добавили еще и дополнительные функции: разложить говорящих по голосам, а также создать на основе «услышанного» некую связную аннотацию. И, когда мы для своих целей реализовали подобные инструменты для транскрибации, то я сразу подумал о том, что журналистам это может быть полезно, и предложил специалистам «Евромедиа» протестировать нашего ИИ-помощника. Сейчас это воплощено в виде простого, однозадачного телеграм-бота, но под «капотом» которого работают сразу три ассистента. Это работает следующим образом: журналист отправляет боту любую аудиозапись, тот сначала обрабатывает и переводит аудиофайл в полный текст, потом разбивает это по спикерам, и в конце еще дает некое резюме, аннотацию, чтобы можно было быстро понять, о чем был разговор. Весь процесс занимает не более пяти минут. Естественно, ошибки случаются, ведь наш ассистент на 100% никогда не сможет расслышать текст и из-за помех, и из-за особенностей речи. Люди могут перебивать друг друга, и — так далее. Но журналист-то свой материал знает, и ему останется несколько минут на поправку текста, присланного нашим помощником».

«Как сделать такого бота - техническое решение у меня сложилось почти сразу. Еще 10 лет назад, да что там — еще год-два назад получилось бы «черт-те что». А сейчас удалось сделать реально работающий продукт. Это выглядит очень просто в применении, но в этом-то и задача, чтобы конкретному конечному пользователю было просто работать с помощником, алгоритм работы должен быть очень простым. Пользователю не надо знать, насколько сложную технологию я использовал при создании. А на самом деле запускаются три ассистента на трех серверах, которые находятся в трех разных странах. Но пользователю лучше не знать, как работает бот, потому что это даже для меня все еще фантастика. И я горжусь этим техническим решением именно потому, что оно на выходе является для пользователя очень простым.
Если говорить о расшифровках аудиозаписей, то здесь имеется вообще невероятный потенциал. Вот мы для своей работы сделали бота «Расшифровка разговоров», которого уже представили в публичный доступ. Я записываю сейчас все деловые встречи. Приходит ко мне человек с какой-то идеей или с заказом. И мне нужно ему сделать какое-то деловое предложение. Процесс до принятия решения раньше растягивался надолго. А сейчас после записи любой встречи я сразу «кидаю» аудиозапись в расшифровку. И мои боты, ассистенты выдают мне из делового разговора проблемы и вытекающие из них задачи для постановки и возможности для реализации возникших идей. Далее этот текст, полученный с помощью бота, я отправляю буквально в тот же день, в течение часа заказчику и прошу его посмотреть и оценить результаты. И заказчик соглашается, как правило, работать дальше. После этого я беру список задач и «кидаю» в следующего ассистента. И этот помощник пишет мне техническое задание. То есть, я в обед поговорил с потенциальным клиентом, днем я уже посылаю ему сформулированное техническое задание, а вечером, собственно, могу выставлять счет! И дальше у заказчика два пути: оплатить и начать делать, или ничего не отвечать, понимая при этом, что в техническом задании уже все разложено. А техническое задание, как та же расшифровка, – это отдельная большая работа, которую никто не любит делать. И вот эту проблему я решил. Клиенту остается только подтвердить, все ли так, как он хотел, наша ИИ-модель поняла. А если все так, то можно начинать делать «чистовую» работу, цена которой известна. Такой бот автоматически «убирает» часть ненужного для бизнесмена персонала».

Добавим, что как музыкального продюсера Сергея Пименова представлял журнал «Нация».

Текстовый материал и изображение героя подготовлены информационным агентством «ЕвроМедиа» при участии ИИ-ассистентов, разработанных командой Сергея Пименова.

Читайте также: