MWC 2019: Smart Engines показала распознавание иероглифов Китая, Японии и Кореи
На проходящей в Барселоне международной выставке Mobile World Congress 2019 российская компания Smart Engines представила технологию распознавания иероглифов. Ее разработка стала возможна благодаря применению глубоких разреженных дискретных нейронных сетей, которые позволяют распознавать свыше 45 000 иероглифов на документах со сложным фоном и при различных условиях освещения. Из них 20 941 китайский, 12 912 японских и 11 172 корейских иероглифов.
Новая функциональность интегрирована в систему искусственного интеллекта Hieroglyph, которая теперь на уровне платформы поддерживает распознавание 800+ типов удостоверяющих документов на более чем 40 языках. Это ID карты, паспорта, водительские права, визы и другие документы более 170 стран мира. Распознавание иероглифической письменности позволило расширить потенциальную пользовательскую аудитория продуктов Smart Engines более чем на 1,5 млрд человек.
Распознавание иероглифов является сложной научно-технической задачей, в которой разработчики искусственного интеллекта имеют дело с десятками тысяч символов, многие из которых незначительно отличаются друг от друга. В процессе разработки специалисты Smart Engines смогли преодолеть важный технологический барьер и перейти от методов классических OCR, рассчитанных на распознавание символов на белом фоне на качественных сканах, к компьютерному зрению, способному распознавать иероглифы даже в удостоверениях личности в видеопотоке и на фотографиях.
«К сложному устройству самих иероглифов в нашем случае добавляются визуальные помехи, вызванные наличием на изображении фона у документа, и искажения, обусловленные разной яркостью освещения и ракурсом съемки. Нам удалось создать специальную архитектуру нейронных сетей, которая обеспечивает быстродействие и качество распознавания иероглифов в документах на уровне символов латинского алфавита и кириллицы», – отмечает генеральный директор Smart Engines к.т.н. Владимир Арлазаров.
Представленная технология предназначена для использования в процессах регистрации, идентификации и верификации пользователей в мобильных приложениях и интернет сервисах банковского сектора, страхования, финтеха, шеринговой экономики, транспорта, телекома и др. Уже сейчас разработчикам доступны библиотеки распознавания удостоверяющих документов Китая, Гонконга, Японии и Кореи для iOS, Android, Linux, Windows, macOS и Solaris.
Протестировать распознавание китайских, японских и корейских иероглифов в видеопотоке и на фотографиях можно установив бесплатное демонстрационное приложение Smart IDReader из Google play или App Store.