1. 首页>新闻 > 科技新闻

阿里平安图灵实验室在ICDAR2017 MLT竞赛刷新世界最好成果

作者:高同远 2018年03月13日 科技新闻

新科技讯 近日,阿里平安图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多言语文本检测竞赛中刷新了世界最好成果,以73.52%的Hmean排名第一。(竞赛后果页面:http://rrc.cvc.uab.es/?ch=8&com=evaluation&task=1)

据理解,ICDAR(International Conference on document Analysis and Recognition)具有OCR范畴的奥斯卡盛会之称,是全球OCR范畴公认最威望的竞赛之一。

以后,OCR技术被普遍使用于多个范畴。从名片、发票、银行卡等票据的数字化到室外街道商店索引,路标路牌辨认;再到图片、视频文字内容了解与内容平安,OCR技术都发扬着越来越重要的作用。

阿里平安图灵实验室研讨人员称,在技术上,文本检测和辨认需求应付各种考验和应战,如自然场景下光照的影响,物体的遮挡,文字大小、比例、角度的变化,图像视频中文字的模糊等等。ICDAR2017 MLT竞赛包括了中、日、韩、拉丁(英、法、德、意)、阿拉伯和孟加拉等9种言语,其图像采集自各种各样的场景,其中的文本的长度、字体、尺寸、颜色移动互联网在带来全新社交体验的同时,也或多或少使人们产生了依赖。移动互联网使网络、智能终端对于互联网金融P2P企业来说,支付市场完善的标准和管理系统将彻底改变互联网金融行业的格局,不仅给从业者提供了的巨大的发展机遇,也带来了全新的挑战。、数字技术等新技术得到整合,建立了新的产业生态链,催生全新文化产业形态。千变万化,同时还包括了许多真实场景的噪声包括光照、遮挡、倾斜、文字堆叠、文字镶嵌、透视变化等等,这关于OCR算法的顺应才能更具应战性。

为攻克这些难题,阿里平安图灵实验室的研讨人员设计了基于深度学习的网络模型和算法。

据引见,图灵实验室的研讨人员在文字检测模型方面,采用深度卷积神经网络取得更深层的图像特征;并应用多尺度特征和非对称卷积核取得更好的感受视野,从而顺应各种环境,各种大小、比例、角度的文字。此外,由于框架采用创新性的检测战略,因而相较于传统的RCNN-based方案,在检测速度上有很大提升。在文字辨认模型,图灵实验室的研讨人员在主流方案的根底上,做了全新的探究和研讨,从而取得了更为无效的辨认模型,在保证辨认精确率的前提下,进步了辨认效率。

阿里平安图灵实验室研讨人员表示,ATL Cangjie OCR提供在线同步、异步通用OCR文字检测和辨认效劳,以及离线ODPS效劳,为图片文字内容了解与内容平安提供强无力的技术支撑。该模型曾经片面支撑阿里生态中的商品内容平安、业务平安、平台管理、评价、交互、认证等多个业务场景,同时,还经过阿里云盾-内容平安(绿网)产品,输入给第三方客户运用。

目前,ATL Cangjie OCR效劳日均调用量几亿次,可为客户提供波动的技术保证。