【ZiDongHua 之人文化天下收錄關(guān)鍵詞: 漢王科技 人工智能 高質(zhì)量發(fā)展
  
  數(shù)字力量護(hù)文化 人工智能守遺風(fēng)|漢王科技龐素蕾入選“北京榜樣·最美互聯(lián)網(wǎng)從業(yè)者”提名
  
  近日,北京市委互聯(lián)網(wǎng)企業(yè)工委啟動(dòng)“北京榜樣·最美互聯(lián)網(wǎng)從業(yè)者”評(píng)選活動(dòng),經(jīng)過(guò)推薦、考察、專家評(píng)審等環(huán)節(jié)嚴(yán)格甄選,漢王科技數(shù)據(jù)產(chǎn)品經(jīng)理龐素蕾、小米集團(tuán)黨委常務(wù)副書記、工會(huì)主席、婦工委主任施艷、快手科技黨委副書記、副總裁徐靜蕓和360數(shù)字安全集團(tuán)總裁胡振泉、58同城(集團(tuán))副總裁、黨委書記胡迪等30名互聯(lián)網(wǎng)優(yōu)秀工作者獲得 “北京榜樣·最美互聯(lián)網(wǎng)從業(yè)者”提名。
  
  以下內(nèi)容是《北京日?qǐng)?bào)》對(duì)漢王科技數(shù)據(jù)產(chǎn)品經(jīng)理龐素蕾的介紹:  片
  
  龐素蕾在2006年大學(xué)畢業(yè)后進(jìn)入漢王科技股份有限公司工作至今,先后負(fù)責(zé)手寫識(shí)別、OCR和人臉等數(shù)據(jù)建設(shè)與產(chǎn)品研發(fā),目前擔(dān)任大模型數(shù)據(jù)產(chǎn)品經(jīng)理,負(fù)責(zé)大模型數(shù)據(jù)與安全工作。龐素蕾深耕人工智能領(lǐng)域近二十年,為公司和社會(huì)創(chuàng)造了大量經(jīng)濟(jì)效益,為保護(hù)與傳承中華傳統(tǒng)文化做出重要貢獻(xiàn)。她曾獲漢王科技優(yōu)秀共產(chǎn)黨員、十佳員工等榮譽(yù),獲得系統(tǒng)集成項(xiàng)目經(jīng)理、NPDP、ACP等資質(zhì)。
  
  一、保護(hù)語(yǔ)言,少數(shù)民族文字走向互聯(lián)網(wǎng)
  
  龐素蕾入職時(shí),漢王科技的手寫識(shí)別和OCR技術(shù)獲得了國(guó)家科技進(jìn)步一等獎(jiǎng)和二等獎(jiǎng)。但當(dāng)時(shí)少數(shù)民族文字的手寫識(shí)別還是空白,少數(shù)民族同胞只能通過(guò)紙筆進(jìn)行傳承。怎么能讓這些資料電子化、用于互聯(lián)網(wǎng),是她面對(duì)的第一個(gè)難題。龐素蕾在新疆時(shí)就體會(huì)到維吾爾族語(yǔ)言的美麗與寶貴。她接到任務(wù),第一個(gè)想到的就是回到家鄉(xiāng)收集維語(yǔ)文字手寫數(shù)據(jù),幫助鄉(xiāng)親們用上維語(yǔ)手寫輸入法。她立刻聯(lián)系了幾所學(xué)校的老師開展維語(yǔ)手寫數(shù)據(jù)收集工作。當(dāng)她回到家鄉(xiāng),一位老師熱情地握住她的手說(shuō):“我們一直想讓維語(yǔ)文字資料電子化,可是輸入實(shí)在太困難了!”龐素蕾體會(huì)到鄉(xiāng)親們迫切的心情,收集完數(shù)據(jù)后就立馬趕回北京。經(jīng)過(guò)不懈努力,她和同事們終于一起研發(fā)出維語(yǔ)手寫識(shí)別輸入法,解決了維吾爾族同胞輸入難的問(wèn)題。她接著收集了新疆地區(qū)多種語(yǔ)言文本數(shù)據(jù)用于OCR研發(fā),這些珍貴數(shù)據(jù)也促成了“維哈柯語(yǔ)言文字軟件開發(fā)及產(chǎn)業(yè)化”項(xiàng)目立項(xiàng),為少數(shù)民族發(fā)展做出重要貢獻(xiàn)。
  
 
  
  后續(xù),龐素蕾又開始收集其他少數(shù)民族文字?jǐn)?shù)據(jù)。少數(shù)民族文字結(jié)構(gòu)復(fù)雜、使用人數(shù)少、資料匱乏,為解決數(shù)據(jù)不足的棘手問(wèn)題,龐素蕾親自深入甘肅、吉林、四川等地收集數(shù)據(jù)。路途遙遠(yuǎn),過(guò)程艱辛,但她不畏艱苦,一心只想把工作做好。采集朝鮮語(yǔ)時(shí)正值冬季,她到吉林的第二天就被寒冷的天氣凍感冒了,一度發(fā)燒到39℃。但為了盡快完成任務(wù),她依然堅(jiān)持在第一線,帶病完成數(shù)據(jù)采集。后續(xù)她帶領(lǐng)團(tuán)隊(duì)收集了彝族、藏族等少數(shù)民族的手寫樣本和文字資料,總數(shù)達(dá)上百萬(wàn)字。這些寶貴的數(shù)據(jù)用于“中華字庫(kù)項(xiàng)目”中“漢字和少數(shù)民族文字的手寫輸入法”研發(fā)。研發(fā)工作取得了巨大突破,研究成果打破了少數(shù)民族文字與互聯(lián)網(wǎng)之間的壁壘,讓中華各民族使用文字更加便捷高效,讓中華文明的傳播更加廣泛深遠(yuǎn)。
  
  二、發(fā)揚(yáng)文化,小語(yǔ)種文字建立傳播渠道
  
  中華文化既要傳下來(lái),也要走出去。2008年北京舉辦奧運(yùn)會(huì)開始,中國(guó)和世界有了更加緊密的交流。龐素蕾也開始了讓傳統(tǒng)文化“走出去”的工作。
  
  她帶領(lǐng)團(tuán)隊(duì)陸續(xù)收集了德語(yǔ)、俄語(yǔ)、印地語(yǔ)等十幾種小語(yǔ)種文字?jǐn)?shù)據(jù),數(shù)據(jù)量超過(guò)千萬(wàn)字。很多外國(guó)人喜歡左手寫字,與右手書寫的筆跡有所差別,為提升手寫算法在海外產(chǎn)品中的識(shí)別率,她利用周末到名勝古跡找外國(guó)人采集數(shù)據(jù)。這些數(shù)據(jù)幫助漢王科技的手寫識(shí)別與OCR擴(kuò)展至數(shù)十種文字。在這些數(shù)據(jù)的基礎(chǔ)上,漢王科技成功立項(xiàng)兩項(xiàng)國(guó)家級(jí)新一代人工智能重大項(xiàng)目,在國(guó)家安全、文化傳播領(lǐng)域做出了卓越貢獻(xiàn)。
  
  工作之外,龐素蕾也致力于中國(guó)文化的保護(hù)與宣傳。她在采集時(shí)認(rèn)識(shí)了不少外國(guó)朋友,閑暇時(shí)她會(huì)帶著外國(guó)朋友到北京文化景點(diǎn),為他們講解中國(guó)的傳統(tǒng)文化。“采集小語(yǔ)種數(shù)據(jù)能讓我們與其他國(guó)家建立更順暢的交流,我也希望中國(guó)的文化可以通過(guò)這些語(yǔ)言傳遞到世界上許多不同的國(guó)家。”
  
  三、傳承歷史,歷史古籍重獲數(shù)智化生命
  
  2022年,ChatGPT掀起人工智能新浪潮,漢王科技選擇將大模型技術(shù)與我國(guó)傳統(tǒng)文化相結(jié)合。龐素蕾勇于擔(dān)當(dāng),投入到漢王天地大模型的研發(fā)工作,迅速組建大模型專項(xiàng)數(shù)據(jù)組,快速開發(fā)高效的數(shù)據(jù)標(biāo)注平臺(tái),制定嚴(yán)謹(jǐn)?shù)墓芾砹鞒蹋蛩惴▓F(tuán)隊(duì)提供高質(zhì)量的訓(xùn)練數(shù)據(jù),包括歷史、古文、水墨畫等。
  
 
  
  開始時(shí),模型對(duì)歷史人物關(guān)系的理解存在錯(cuò)誤,這是因?yàn)槟P椭械臍v史數(shù)據(jù)混雜在大量的自然數(shù)據(jù)中,信息被稀釋,模型不能精準(zhǔn)提取與問(wèn)題相關(guān)的數(shù)據(jù)。為解決該問(wèn)題,龐素蕾帶領(lǐng)團(tuán)隊(duì)構(gòu)建了完善的知識(shí)圖譜,矯正了數(shù)萬(wàn)條歷史人物數(shù)據(jù)。不斷地優(yōu)化迭代,讓漢王天地大模型成為了“歷史百事通”,讓中國(guó)青少年可以用嶄新的方式了解、喜歡與傳播中國(guó)歷史。
  
  在龐素蕾和同事的努力下,漢王天地大模型通過(guò)了互聯(lián)網(wǎng)信息服務(wù)算法備案、生成式人工智能服務(wù)備案。龐素蕾團(tuán)隊(duì)的工作促成了漢王科技成功立項(xiàng)國(guó)家檔案局科技項(xiàng)目,將大模型應(yīng)用于檔案電子化,攻關(guān)檔案高質(zhì)量發(fā)展核心問(wèn)題,服務(wù)國(guó)家重大發(fā)展戰(zhàn)略;輔助漢王科技與國(guó)家圖書館達(dá)成合作,用AI技術(shù)賦予中華古籍?dāng)?shù)智化生命。在未來(lái),龐素蕾還會(huì)和團(tuán)隊(duì)一起用大模型賦能文化與歷史傳承,讓傳統(tǒng)文化在互聯(lián)網(wǎng)時(shí)代煥發(fā)新生。
  
  面對(duì)互聯(lián)網(wǎng)行業(yè)快速更新迭代,龐素蕾作為一名擁有18年黨齡的中共黨員、一名熱愛(ài)AI行業(yè)的互聯(lián)網(wǎng)從業(yè)者,勇于擔(dān)當(dāng)、默默奉獻(xiàn)、磨礪技術(shù),從少數(shù)民族文字到小語(yǔ)種,再到大模型,龐素蕾為公司打造了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ),為國(guó)家文化保護(hù)、傳承與發(fā)展貢獻(xiàn)了自己的力量。她在互聯(lián)網(wǎng)行業(yè)、人工智能領(lǐng)域真正做到科技報(bào)國(guó),產(chǎn)業(yè)興邦。
  
 ?。▋?nèi)容來(lái)源:北京日?qǐng)?bào))