Попал в новости — получи кредит

Искусственный интеллект

Искусственный интеллект

Михаил Шевцов считает отсев искусственным интеллектом фейковых новостей вполне решаемой задачей

Банкиры начали использовать искусственный интеллект для анализа сообщений в СМИ о деятельности компаний — действующих и потенциальных заемщиков

DS-мониторинг (Data Science, наука о данных) все чаще применяют банки для работы с клиентами. К примеру, у Сбербанка около 900 сотрудников по всей стране следят за финансовым состоянием компаний-заемщиков и 300 человек — за сохранностью залогов. Цель финансово-кредитной организации — чтобы модели искусственного интеллекта выполняли примерно 80% этой работы. Таких моделей, позволяющих собирать большие объемы данных, обрабатывать и выдавать результат, в Сбере разработано уже 54. Так, одна из моделей на основе банковских транзакций и финансовой отчетности выявляет контрагентов и отрасли, влияющие на бизнес заемщиков.

Ловцы событий

Свежий тренд — новостной DS-мони­торинг, о котором рассказал на конференции по искусственному интеллекту в екатеринбургском Ельцин Центре директор дивизиона «Цифровой кредитный мониторинг» Сбербанка Михаил Шевцов:

— Банк выдает кредиты большим и малым компаниям. Конечно же, нам нужно смотреть, все ли с бизнесом этих компаний хорошо. Развиваем такое направление, как новостной мониторинг. То есть наша модель представляет новости о компаниях и события, релевантные ухудшению или улучшению их бизнеса. В день проходит миллион новостей, нашим сотрудникам это все нужно перечитывать, но сделать это физически невозможно. Поэтому мы берем несколько новостных лент, привязываем их к кредитным портфелям компаний, потом смотрим, какие события нам нужно «отловить». Таким образом, мы сильно сужаем вал новостей и выдаем только результат.

В начале 2019 года Сбер внедрил в систему онлайн-мониторинга новостей интеллектуальные технологии ABBYY, чтобы автоматически анализировать содержание сообщений на русском языке. На первом этапе это были сообщения СМИ о тысяче с лишним банков-контрагентов. Позднее сфера применения модели была расширена, сегодня она способна охватить 200 тыс. компаний, а в перспективе — практически все 8 млн организаций, числящихся в справочнике Сбербанка. Благодаря этому решению в онлайн-режиме происходят агрегирование и смысловой разбор новостей, классификация их по различным рисковым факторам. Это существенно снизило трудозатраты сотрудников на обработку и структурирование информации, значительно повысило скорость реакции банка на события, в которых замешан тот или иной заемщик.

— Сейчас мы тестируем эту услугу как внешний сервис для клиентов: есть пилот с Московской биржей и еще целым рядом компаний. Планируем потом на этом зарабатывать, — говорит Михаил Шевцов. — В рамках модели новостного DS-мониторинга у нас сегодня уже созданы такие продукты, как приложение для сотрудников (настраиваемая лента новостей, единое окно информации, интеграция с другими системами), канал в Telegram (крупнейшие компании, хэштеги для важных событий, повышение скорости реакции), чат-бот в Telegram (подписка на новости по компаниям, хэштеги, кастомизация ленты новостей), API для внешних клиентов (настраиваемый поток данных, 60 крупнейших источников, только ключевая информация).

Приложение Сбера не ошибается почти в половине случаев: точность привязки компании к новости — 55%

В настоящее время приложение Сбера тестируют более 1700 пользователей. Система обрабатывает в день более 65 тыс. уникальных (не дублирующих друг друга) новостей. Тексты показывают 90-процентную точность моделей поиска событий. При этом точность привязки компании к новости пока невелика — 55%, но по клиентам CIB (крупнейшим компаниям) она составляет 99%.

В ближайшие два года Сбербанк намерен разработать модель новостного DS-мониторинга следующего поколения: она освободит его сотрудников от необходимости в случае появления сообщений об экстраординарных событиях в той или иной компании-заемщике ехать в эту компанию и на месте обсуждать перспективы погашения кредита. Модель будет сама выдавать стратегию по клиенту и расписывать план действий.

— Развивать это направление планируем в Екатеринбурге: подготовка и сопровождение витрин данных, разработка моделей для новостного мониторинга, разработка мобильной версии приложения для смартфона и планшета, — добавил Михаил Шевцов.

Это сказал фараон

Анализ новостей с использованием методов глубокого обучения банкиры пытаются применять не только для отслеживания бизнеса уже имеющихся компаний-заемщиков, но и для привлечения новых. Здесь важно оперативно реагировать на публикующуюся информацию о тех или иных шагах потенциальных инвесторов: их заявления о готовящихся проектах, подборе площадок под строительство, ведении переговоров, подписании соглашения о намерениях и др.

— Мы работаем совместно с нашими коллегами из новостного мониторинга, — поделилась на той же конференции по искусственному интеллекту сотрудник блока корпоративно-инвестиционного бизнеса Сбербанка Екатерина Патракова. — Они разрабатывают классификаторы и выделяют некие события в новости. Мы опираемся на их разработки и берем от них новости по темам, которые потенциально могут принести нам деньги. К примеру, к нам попала новость о потенциальном контракте или новом инвестпроекте. Далее мы выделяем участников этой сделки и ее сумму, которые описаны в новости. После этого выдаем задачу клиентскому менеджеру, который должен проработать участие банка в качестве финансового партнера, подготовить специализированное продуктовое предложение для клиента. У Сбера много различных видов кредитования, поэтому мы каким-то образом можем поучаствовать в этом проекте. Пока мы тестируем эту систему в течение одного месяца и выставляем небольшое количество задач. Получилось выдать кредитов на 3,6 млрд рублей. В работе задачи еще на 13,5 миллиарда.

По словам Екатерины Патраковой, при анализе новостей в данном случае итоговой задачей является определение ИНН компании, которая заинтересовала банк в качестве потенциального заемщика, ведь менеджер должен четко понимать, к какой конкретно организации ему идти с кредитным предложением. Для этого создается около десятка видов связанных сущностей: упоминаемые в новостях названия компаний, локации, действующие лица и т.д. Также важно понимать из новости роль компании в проекте, выступает ли она инвестором, соинвестором, проектировщиком, застройщиком или оператором. А может, просто решила засветиться на событии, к которому в действительности не имеет прямого отношения.

— Есть важная для нас информация, которую модель пока плохо улавливает, — признается Екатерина Патракова. — Названия компаний и учреждений в новостях иногда весьма вольно сокращаются. Например, Ивановская областная дума сокращается до Ивоблдума, вместо министерства имущественных отношений Московской области — Минмособлимущества, а вместо ООО «ЧайКофеОптом» — ЧКО. Найти такие соответствия в нашем справочнике на 8 млн организаций очень сложно. Поэтому мы обогатили справочник: помимо полной формы названия организации также указываем короткую форму и, если имеется, аббревиатуру.

Другая сложность — обучить программу распознавать именно новости, то есть сообщения только о новых событиях. Нередко попадается относительно свежая информация, содержащая новости месячной и даже годовой давности, которые уже были отработаны сотрудниками банка. Но тут важно не пропустить сообщения, которые в действительности не являются дублем: например, несмотря на то, что пересекаются некоторые сущности (те же компании и действующие лица), названия инвестпроектов разные, к тому же запланированы к реализации в разных регионах.

Но это еще полбеды. Как искусственный интеллект будет фильтровать фейковые и рекламные новости, имеющие целью пиар компаний или дискредитацию конкурентов, содержащие откровенную дезинформацию или только половину правды? Представители банка говорят о неком ранжировании источников информации по степени достоверности. Как это будет выглядеть на практике — большой вопрос, ведь таких источников информации уже сейчас используется свыше 60 тысяч. Причем в этот список включены не только СМИ, имеющие высокую репутацию, но также желтая пресса и каналы в соцсетях. Теоретически ложь должна отсеиваться при сравнении с достаточно большой выборкой новостей, поступающих за последние два-три месяца. Поскольку лгут все по-разному, а правда — всегда одна, как сказал Тутанхамон, который был очень умен. Тоже, кстати, фейк, ведь он умер, не успев вступить во взрослую жизнь.        

Материалы по теме

Сжатие

Скорость реагирования

Оптимальное решение международных расчетов

IX Фестиваль качества банковских услуг прошел в конце апреля в Екатеринбурге

«НЕЙВА» глазами клиентов

Прецедентный минус