【ZiDongHua 之創(chuàng)新自科文收錄關(guān)鍵詞:大模型 人工智能 自動(dòng)駕駛 工業(yè)制造 】
  
  大模型在這里“刷題”!國內(nèi)首個(gè)人工智能數(shù)據(jù)訓(xùn)練基地啟用
  
  如果把人工智能大模型比作一位小學(xué)生,那么數(shù)據(jù)訓(xùn)練時(shí)所用的“語料”和“算力”,就相當(dāng)于小學(xué)生“刷題”時(shí)使用的習(xí)題冊(cè)和計(jì)算器,幫助他掌握知識(shí)點(diǎn)、更快給出正確答案。
  
  
  
  如今,北京的大模型有了更全面的“習(xí)題冊(cè)”、更強(qiáng)大的“計(jì)算器”。3月29日,在2024北京AI原生產(chǎn)業(yè)創(chuàng)新大會(huì)暨北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)成果發(fā)布會(huì)上,國內(nèi)第一個(gè)人工智能數(shù)據(jù)訓(xùn)練基地、北京規(guī)模最大的公共算力平臺(tái)正式啟用。
  
  為解決算力不足等問題,近兩年本市布局建設(shè)了多處公共算力平臺(tái)。這就像電力公司供電一樣,只不過這些機(jī)柜里提供的是算力。因?yàn)橐?guī)模大、穩(wěn)定,所以公共算力可提高訓(xùn)練的效率,進(jìn)而降低大模型訓(xùn)練耗費(fèi)的時(shí)長(zhǎng)。
  
  此次北京亦莊人工智能公共算力平臺(tái)正式點(diǎn)亮,算力規(guī)模在北京最大,可提供算力3000P。1P相當(dāng)于每秒1000萬億次的計(jì)算速度。也就是說,這里每秒就進(jìn)行300億億次的計(jì)算,相當(dāng)于超過百萬臺(tái)高性能電腦的算力。以往企業(yè)自己要算幾個(gè)月的事,在這里十幾天就能搞定。
  
  
  “經(jīng)開區(qū)規(guī)劃了超10000P的算力規(guī)模。”經(jīng)開區(qū)相關(guān)負(fù)責(zé)人說,未來將推出支持政策,為人工智能企業(yè)提供公共普惠的算力、創(chuàng)新領(lǐng)先的算網(wǎng)服務(wù)、細(xì)致完善的解決方案,助推大模型訓(xùn)練和行業(yè)應(yīng)用。
  
  大模型的自我學(xué)習(xí)仰仗訓(xùn)練。同日啟用的北京人工智能數(shù)據(jù)訓(xùn)練基地里,已經(jīng)有多款大模型正練就“最強(qiáng)大腦”。訓(xùn)練中,大模型依靠基地“投喂”的語料,像學(xué)生“刷題”一樣不斷提升自己的能力,從而在未來上線后應(yīng)付現(xiàn)實(shí)中的各種難題。
  
  這是國內(nèi)最早啟用的人工智能數(shù)據(jù)訓(xùn)練基地,可以組織數(shù)據(jù)供給方、加工服務(wù)方、模型訓(xùn)練方“進(jìn)場(chǎng)”合作,推動(dòng)高質(zhì)量數(shù)據(jù)價(jià)值釋放,助力通用模型和行業(yè)垂類模型訓(xùn)練精調(diào)。
  
  成為“第一個(gè)”,不只依靠算力“硬件”。“訓(xùn)練基地要干的,不只是訓(xùn)練。”運(yùn)營(yíng)訓(xùn)練基地的北京亦莊智能城市研究院公司總經(jīng)理顏敏解釋,使用數(shù)據(jù)時(shí)會(huì)面臨所有權(quán)歸誰、是否可信、如何保障安全、收益如何分配等各種問題,都需要建立機(jī)制來規(guī)范。為此,基地針對(duì)大模型訓(xùn)練的數(shù)據(jù)合規(guī)和場(chǎng)景應(yīng)用了“監(jiān)管沙盒”機(jī)制,為新技術(shù)創(chuàng)新迭代提供開放包容的政策保障,免除后顧之憂。
  
  數(shù)據(jù)不像普通的商品,使用方一旦獲得了會(huì)不會(huì)復(fù)制外泄?為此,基地里專門的存儲(chǔ)設(shè)備能讓數(shù)據(jù)“可用不可見”。從采集到存儲(chǔ),再到初加工、精加工,最后到模型訓(xùn)練,整個(gè)鏈條都是在訓(xùn)練基地進(jìn)行,跑不出去。“一旦發(fā)生糾紛,也有糾紛解決的兜底機(jī)制,會(huì)邀請(qǐng)互聯(lián)網(wǎng)法院、知識(shí)產(chǎn)權(quán)局等來幫忙協(xié)調(diào)。”顏敏說。
  
  大模型的訓(xùn)練、算力使用都要面臨一筆不小的支出,初創(chuàng)企業(yè)能否應(yīng)付得了?“我們每年會(huì)發(fā)放1億元算力券,企業(yè)可申領(lǐng)用于算力租用,即領(lǐng)即享。”經(jīng)開區(qū)管委會(huì)主任孔磊介紹。
  
 
  
  圖為北京亦莊人工智能公共算力平臺(tái) 、北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)公共智算中心。 
  
  近日,經(jīng)開區(qū)專門發(fā)布了《關(guān)于加快打造AI原生產(chǎn)業(yè)創(chuàng)新高地的若干政策》,從推動(dòng)算力賦能產(chǎn)業(yè)發(fā)展、構(gòu)建高效協(xié)同創(chuàng)新體系、高水平建設(shè)北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)、推動(dòng)人工智能應(yīng)用場(chǎng)景賦能與開放、打造人工智能產(chǎn)業(yè)集聚區(qū)、優(yōu)化產(chǎn)業(yè)發(fā)展生態(tài)6個(gè)方面提出14條具體措施。
  
  除了算力券,亦莊每年還會(huì)發(fā)放1億元模型券,對(duì)購買技術(shù)自主可控基座大模型產(chǎn)品及服務(wù)進(jìn)行補(bǔ)貼;開展“大模型+”行動(dòng),在自動(dòng)駕駛、具身智能、醫(yī)藥健康、工業(yè)制造等領(lǐng)域開放高質(zhì)量應(yīng)用場(chǎng)景,推動(dòng)AI賦能千行百業(yè)。
  
  通過政策集成與創(chuàng)新,亦莊將持續(xù)推進(jìn)人工智能核心技術(shù)取得重大突破,全面構(gòu)建自主可控軟硬件人工智能產(chǎn)業(yè)生態(tài)。到2026年,亦莊將培育性能達(dá)到國際先進(jìn)水平的通用大模型,打造人工智能標(biāo)桿應(yīng)用場(chǎng)景10個(gè),集聚人工智能產(chǎn)業(yè)鏈企業(yè)100家,實(shí)現(xiàn)園區(qū)營(yíng)業(yè)收入1000億元,建成人工智能算力10000P。
  
  來源:北京日?qǐng)?bào)