2021: Автоматизация процесса извлечения данных из формы W8-BEN
Национальный расчетный депозитарий (НРД, входит в Группу «Московская Биржа») совместно с ITFB Group реализовали проект по автоматизации процесса извлечения данных из формы W8-BEN. Об этом НРД сообщил 30 ноября 2021 года.
Форма W8-BEN заполняется физическими лицами – налоговыми нерезидентами США, которые планируют получать доходы в виде дивидендов и купонов по ценным бумагам американских эмитентов с применением льготной ставки налогообложения. Заполненную форму клиент передает брокеру, а он, в свою очередь, – вышестоящему депозитарию, который является налоговыми агентом, удерживает налог и перечисляет его в налоговую службу США.
Рост интереса к иностранным акциям привел к значительному увеличению объемов поступающих на обработку форм W8-BEN и к повышению требований к качеству извлекаемых данных. До реализации проекта данные из формы анализировались вручную сотрудниками НРД, что требовало значительных трудозатрат. Необходимо было найти эффективное, быстрое и качественное решение, позволяющее автоматически извлекать необходимые данные из анкеты.
В качестве системы распознавания была выбрана система на платформе ITFB EasyDoc, реализующая концепцию управления контентом предприятия: управление сканированием и распознаванием, управление анализом извлеченных из документов данных, управление хранением и поиском.
Специалисты ITFB Group разработали на платформе EasyDoc приложение, обеспечивающее распознавание атрибутов формы W8-BEN. Для этого по предоставленному массиву уже имеющихся анкет была обучена модель распознавания, настроены правила автоматической верификации данных и реализована интеграция с целевой системой на стороне НРД. Программное обеспечение полностью автоматизирует обработку формы W8-BEN от момента получения ее от клиента до передачи извлеченных и проверенных данных в целевую систему.
«Данное решение позволило в короткие сроки реализовать проект по автоматизации и снизить нагрузку на операционное подразделение, оставив для разбора вручную только копии очень плохого качества. Опытная эксплуатация системы продемонстрировала высокое качество распознавания данных, а качество данных гарантировано многоступенчатой системой автоматических проверок. Кроме того, решение отвечает стандартам безопасности и бесперебойности. Инвесторы могут быть спокойными за сохранность своих данных», отметил Павел Андрианов, член Правления, Директор по информационным технологиям НРД.
«Основной трудностью, с которой мы столкнулись в процессе создания шаблона распознавания формы W8-BEN, была высокая вариативность формы представления документа при кажущейся внешней похожести. Для ее преодоления помимо классической технологии создания шаблонов распознавания были использованы элементы искусственного интеллекта: обучение нейросетей на предоставленных заказчиком данных», прокомментировала Голянская Екатерина, руководитель проекта от ITFB Group.