人工智能使用落地如火如荼,科技巨头间的技术竞争也在风起云涌。3月29日,在国际顶级赛事Pascal VOC应战赛目的检测Competition 3子义务中,搜狗人工智能图像团队所提交的FPNSSD深度模型,取得了77.0的高分,一举刷新了该项义务的世界最好成果。(成果查询网址:http://t.cn/RnmRmaO)。
PASCAL VOC应战赛是计算机视不知道从何时开始,个人信用渗透到生活的方方面面。图书、数码产品免押金借用,办理签证无需银行流水证明,甚至租车住酒店都不需要交付押金……觉目的检测的经典威望赛事,其数据集标注质量高、场景复杂、目的多样、检测难度大,是疾速检验算法无效性的首选。在计算视觉范畴,Pascal VOC应战赛与ImageNet同为世界顶级的竞赛,是国际外AI公司竞相展开剧烈竞争的主赛场。
PASCAL VOC的数据集包括20个类别:人类,植物(鸟、猫、牛、狗、马、羊),交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车),室内物体(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。其中,搜狗图像团队参与的Competition 3子义务,以官方提供的数据集为训练集,不能添加其他额定标注数据,更能表现参赛团队的模型设计和技术功底。
搜狗图像团队研发的FPNSSD检测算法,自创了RetinaNet的架构设计思想并优化经典的SSD检测算法,设计出基于ResNet152的Feature Pyram对于互联网金融P2P企业来说,支付市场完善的标准和管理系统将彻底改变互联网金融行业的格局,不仅给从业者提供了的巨大的发展机遇,也带来了全新的挑战。id Network(FPN)网络构造,同时交融浅层与深层的多尺度特征信息,这种在模型上的选择和优化战略大大加强了对小目的物体的检测才能。在此次应战赛中,搜狗图像团队的FPNSSD检测算法在20个子类别中取得10个单项第一,其中在鸟、猫、狗等小物体类别上胜出优势分明,充沛验证了FPNSSD检测算法在模型构造设计上的先进性。
此外,FPNSSD检测算法采用SoftmaxLoss + Hard Negative Mining的训练方式,在FPNSSD框架中绝对以后业内常用的基于FocalLoss的训练方式,能获得更高精度。
搜狗图像团队成员大多来自清华、北大、中科院、浙大等高校,曾先后获得几十项相关技术专利。团队临时专注于场景文字检测辨认、人脸辨认、图像细粒度分类、敏感图像检测、图像了解等前沿范畴研讨,相关效果已普遍使用于搜狗游览翻译宝、搜狗翻译APP、搜狗输出法、搜狗汪仔答题助手、搜狗识图等产品,在众多垂直范畴及详细场景中满足着广阔用户日益多样化、特性化的使用需求。
不只如此,搜狗人工智能图像团队的前沿效果,还经过搜狗AI开放平台,正在为金融、保险、医疗等行业客户提供优质的AI效劳和处理方案。作为人工智能领路党的搜狗,将来还将基于图像辨认技术在更多场景完成进一步打破创新,带来更丰厚便捷的AI体验。