
云知声 AI 全栈才能再获打破!人脸辨认技能达业界抢先程度
《经济学人》杂志称:很多硅谷公司以“全栈”(fullstack)而自大。其原意指打造一套完备的、端到真个产品或办事系统。在人工智能范畴,“全栈”的观点更多的被了解为在人工智能的多个使用范畴(盘算机视觉、语音、天然言语了解等多模态交互技能),具有提供业内一流的技能和办事的才能。
克日,云知声 AI “全栈”才能再次获得严重打破——在国际威望的人脸辨认尺度评测数据库 LFW 和 MegaFace 上,云知声团队研发的人脸辨认 UFaceID 算法体系,在上述两项尺度评测中,功能辨别到达 99.80%和 98.47%,初次到场外部测评,体系功能登基居业内前线。这两个测试集是业内公认的尺度评测数据集,常常到场测试的另有阿里、腾讯优图、百度、搜狗、商汤、Face++ 等着名公司。该成果不但彰显了云知声在盘算机视觉范畴的技能气力,也意味着云知声多模态 AI 才能再一次取得拓展与验证。
LFW 和 MegaFace 均为人脸辨认范畴紧张的评测数据集。前者是人脸辨认研讨范畴最紧张的人脸图像测评聚集之一,后者为现在最具威望的、抢手的评价人脸辨认功能的数据集之一。LFW 是针对晚期人脸验证义务提出评测办法与目标,后果有自创意义,但已不代表现在的最难题目。MegaFace 提出的关于百万级另外 1:N 人脸辨识义务的评测目标,难度更大,是现在学术界测评的新主流。只管两个数据集都存在高分数与实践使用需求间的抵牾,但由评测历程中催生出来的新办法,无疑极大的推进了人脸辨认技能的长足前进。

通常在盘算机视觉评测中,为了跑出更好的成果,参赛团队广泛会利用多模子和较高的模子庞大度,既磨练模子算法的功能,也响应对盘算资源提出更高要求。这次,云知声初次研发人脸辨认算法即斩获精彩成果,除了团队算法研讨职员的不懈高兴之外,云知声散布式呆板学习智能盘算平台 —— Atlas 亦异样功不行没。
云知声很早就开端结构建立国际抢先的 GPU/CPU 异构盘算平台和散布式文件存储体系,该盘算集群可以为智能盘算提供高功能盘算和海量数据的存储拜访才能。在该盘算集群的底子上,云知声建立了被誉为云知声版“TensorFlow + GKE (Google Kubernetes Engine) ”的 Atlas 呆板学习盘算平台,在云知声向人工智能多范畴技能横向扩展和纵向迭代中,发扬了至关紧张的作用。

Atlas 呆板学习智能盘算平台以 GPU 和 CPU 为盘算集群的底子硬件资源,针对智能盘算的需求和义务特点,利用云知声外部改良的 Kubernetes 作为资源办理和调理体系,经过盘算义务容器化和图形化的义务交互,最大化的简化算法研讨职员提交盘算义务的庞大度,完成盘算义务的全流程办理和一键式散布式运转。同时,针对智能盘算对海量真实使用场景数据的拜访特点, Atlas 智能盘算平台构建具有 PB 量级的高 IO 和高牢靠的散布式存储体系。
在盘算机视觉等新的人工智能使用范畴,愈加依赖高功能的盘算和海量数据的读写才能,而此恰好表现了云知声在智能盘算平台的超前结构。到 2019 年,Atlas 盘算平台将具有 1000+ 的 GPU 盘算资源和凌驾一亿亿次每秒的浮点盘算才能,为在人工智能新范畴的拓展奠基了壮大的盘算才能底子。
除此之外,在 Atlas 智能盘算平台底子上,为了愈加高效地完成算法模块共享和高效运转,云知声研发了 UniFlow 盘算框架。支持 DNN、CNN、RNN/LSTM、seq2seq 等丰厚的呆板学习和深度学习算法模块,支持 TensorFlow 、 PyTorch 、Caffe 等主流盘算框架以及用户自界说算法,同时,优化散布式义务的盘算和通讯逻辑,盘算服从提拔 50% 以上。在下一代的 UniFlow 中,还将集成主动调参和模子紧缩模块,完成全流程托管式主动调参,可以为差别场景下的 AI 数据处置、算法演进提供高效的盘算支持。

基于 Atlas 盘算平台和 UniFlow 盘算框架,云知声完成在一致盘算框架系统下的盘算高服从和算法高产出,经过协同使用 AI 底层研发的技能效果,进而完成在人工智能的多个使用范畴的疾速拓展,从语音辨认(ASR)、语义了解(NLU) 到呆板翻译(NMT)、盘算机视觉(CV)等新的人工智能技能范畴。
值得一提的是,在往年5月份的WMT2018国际呆板翻译大赛中英翻译竞赛中,组建不敷一年的云知声NMT呆板翻译团队首战即斩获英中第二、中英第四,综合第三(BLEU要害评分仅次于第二名0.1)的成果,同期参赛的另有阿里、腾讯、微软、剑桥等顶尖巨擘与高校院所。联合这次在盘算机视觉范畴的佳绩,无疑证明白Atlas 盘算平台在云知声探究多模态 AI 技能才能历程中的威力与代价。

云知声 CEO 黄伟指出,“在 LFW 和 MegaFace 评测数据集上的初露矛头,查验了云知声在盘算机视觉研讨方面的新停顿,也愈加刚强了九游会开展多模态 AI 才能的决心。但,从另一方面来看,技能的终极目标是落地,由单纯算法所驱动的技能差距实践上正在变得越来越小,怎样将技能落地加入景才是一切的 AI 公司应该体贴和思索的。”
在技能场景化使用方面,云知声无疑拥有抢先上风。现在,云知声抢先的语音技能已在包罗家居、车载、医疗、教诲、金融、批发等多个范畴完成落地。与此同时,在汽车行业,云知声已与吉祥汽车告竣互助,配合研发交融语音、盘算机视觉等技能的车规级前装 AI 芯片。可以想象的是,陪同着盘算机视觉技能的成熟,智能语音与盘算机视觉技能的深化联合,将进一步丰厚云知声 AI 产品与办事的形状,也将无效提拔用户的利用体验。
分外提示:本网内容转载自其他媒体,目标在于通报更多信息,并不代表本网附和其看法。其原创性以及文中报告笔墨和内容未经本站证明,对本文以及此中所有大概局部内容、笔墨的真实性、完备性、实时性本站不作任何包管或答应,并请自行核实相干内容。本站不承当此类作品侵权举动的间接责任及连带责任。如若本网有任何内容侵占您的权柄,请实时联系九游会,本站将会在24小时内处置终了。