近日,第二十六屆ICONIP國際神經(jīng)信息處理學(xué)術(shù)會議(The 26th International Conference on Neural Information Processing, ICONIP)在澳大利亞悉尼召開,平安科技自動化機(jī)器學(xué)習(xí)平臺(AutoML)——奧卡姆Occam平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》正式亮相,并受邀在大會上進(jìn)行主題演講。這是繼在斯坦福大學(xué)深度學(xué)習(xí)推理DAWNBench競賽獲得冠軍、獲得2019年CCF科學(xué)技術(shù)獎科技進(jìn)步杰出獎后,平安科技奧卡姆平臺的又一項(xiàng)重大突破。


ICONIP會議是由亞太神經(jīng)網(wǎng)絡(luò)協(xié)會APNNS(Asia-Pacific Neural Network Society)主辦的人工智能神經(jīng)網(wǎng)絡(luò)領(lǐng)域最重要的會議之一。本次會議特別邀請到了神經(jīng)網(wǎng)絡(luò)領(lǐng)域權(quán)威專家David Powers 和 Bao-Liang Lu等嘉賓出席并進(jìn)行主題分享,并匯聚了來自世界各地從事人工智能理論和應(yīng)用研究的頂尖研究人員,共同分享國際人工智能研究領(lǐng)域的最新理論和技術(shù)成果。會議共收到1200+篇來自世界頂尖學(xué)府和科研機(jī)構(gòu)的論文投稿,最終錄用337篇,會議錄用率僅為27.4%,而受到邀請進(jìn)行主題演講的文章更是屈指可數(shù)。

平安科技奧卡姆平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》是由平安集團(tuán)首席科學(xué)家肖京博士指導(dǎo),平安科技副總工程師王健宗博士作為論文的通訊作者,在會議錄用的337篇論文中脫穎而出,并受邀成為口頭報(bào)告論文。

奧卡姆平臺這篇論文針對OCR識別中未分段文本識別模型中的校準(zhǔn)異常問題,創(chuàng)新性地將順序文字識別網(wǎng)絡(luò)(SRN)與校準(zhǔn)卷積神經(jīng)網(wǎng)絡(luò)(Calibration CNN)相結(jié)合,提出了一種將未分段文本轉(zhuǎn)化為單個字符并進(jìn)行識別校準(zhǔn)的新型算法。不同于傳統(tǒng)算法針對一段文字中所有樣本均采用相同的模型參數(shù)的方式,奧卡姆采用的算法將未分段文本中的每個文字提取出來,雖然仍采用相同的識別模型,但是憑借奧卡姆平臺計(jì)算能力極強(qiáng)的優(yōu)勢,可以并對不同的個體文字自適應(yīng)地選擇不同的校正參數(shù),調(diào)整每個文字識別結(jié)果的置信度輸出,從而降低置信度的誤差。而在此論文成果的真實(shí)應(yīng)用中,通過使用奧卡姆平臺,高效、快速地在三個樣本集中試驗(yàn)了五種不同的CNN參數(shù)校準(zhǔn)方式,并得出了以DenseNet結(jié)構(gòu)的為基礎(chǔ)的最佳識別校準(zhǔn)算法。

本論文的研究成果可利用在金融、保險(xiǎn)、醫(yī)療等領(lǐng)域?qū)ㄗC、財(cái)務(wù)票據(jù)等信息進(jìn)行智能識別錄入。以智能投保場景為例,用戶可利用論文中的技術(shù),對駕駛證、行駛證等證件上的未分段信息進(jìn)行識別,實(shí)現(xiàn)車主信息的自動識別和錄入。在手機(jī)移動投保、信息核實(shí)等過程中有效提升運(yùn)營效率,優(yōu)化用戶體驗(yàn)。定義全新的AI開發(fā)模式,Occam平臺屢獲殊榮

Occam平臺是平安集團(tuán)研發(fā)的搭建在大規(guī)模GPU集群上的一站式AI開發(fā)平臺,為用戶提供了從數(shù)據(jù)處理、算法開發(fā)、模型訓(xùn)練、模型優(yōu)化到模型推理的全周期AI工作流,并且包含數(shù)據(jù)標(biāo)注、數(shù)據(jù)增強(qiáng)、多元模型自動搜索、超參優(yōu)化、模型自動壓縮、圖神經(jīng)網(wǎng)絡(luò)、聯(lián)邦學(xué)習(xí)、難例自動發(fā)現(xiàn)等多種特色工具和服務(wù)。

2019年,Occam平臺的多項(xiàng)優(yōu)秀成果得到國內(nèi)計(jì)算機(jī)領(lǐng)域權(quán)威學(xué)術(shù)團(tuán)體的肯定。不僅首次榮獲“2019年CCF科學(xué)技術(shù)獎科技進(jìn)步杰出獎”,還在斯坦福大學(xué)深度學(xué)習(xí)推理DAWNBench競賽中,力壓由康奈爾大學(xué)和谷歌組成的豪華聯(lián)隊(duì),以7.579毫秒的驚人成績勇奪冠軍。

當(dāng)前Occam平臺已落地平安產(chǎn)險(xiǎn),并為平安聲紋、AI音樂、智能視覺等多個AI團(tuán)隊(duì)項(xiàng)目提供平臺支持。例如:Occam平臺實(shí)現(xiàn)了首個基于神經(jīng)架構(gòu)搜索的聲紋識別模型Auto-Vector,只需要30GPUh就可以在VCTK數(shù)據(jù)集搜索一個高精度聲紋識別模型,其效果遠(yuǎn)超過如Xvector、LSTM-GE2E等最先進(jìn)的頂級專家設(shè)計(jì)的聲紋模型,并且聲紋模型訓(xùn)練最高可達(dá)到90%的訓(xùn)練提速。