【ZiDongHua 之自動化學(xué)院派收錄關(guān)鍵詞:人工智能 通用大模型  】
  
  論壇回顧 | 聚焦通用大模型“主戰(zhàn)場”,強化頂層設(shè)計——中國人工智能產(chǎn)業(yè)年會大模型與通用人工智能論壇圓滿落幕
  
  4月14日上午,以“創(chuàng)新驅(qū)動•數(shù)智強國”為主題的第十三屆吳文俊人工智能科學(xué)技術(shù)獎頒獎典禮暨2023中國人工智能產(chǎn)業(yè)年會——大模型與通用人工智能專題論壇在蘇州工業(yè)園區(qū)希爾頓酒店圓滿落幕。來自國內(nèi)知名高校的專家學(xué)者匯聚一堂,觀點碰撞,探究具身智能、多模態(tài)多任務(wù)學(xué)習(xí)、語義空間對齊等重要的AI技術(shù)的理論發(fā)展和智能人機交互、OCR、內(nèi)容生成等AI技術(shù)落地應(yīng)用等關(guān)鍵議題,共同探討、分享人工智能的關(guān)鍵技術(shù)、創(chuàng)新難點及發(fā)展趨勢。
 
  
  眾抒己見
  
  擁抱人工智能大時代
  
  中國圖象圖形學(xué)學(xué)會青工委副主任、北京航空航天大學(xué)徐邁教授與中國電信人工智能研究院青年科學(xué)家趙健研究員共同擔(dān)任論壇主席,上海交通大學(xué)電子信息與電氣工程學(xué)院特聘教授熊紅凱,華南理工大學(xué)二級教授金連文,中國科學(xué)院大學(xué)特聘教授葉齊祥,CAAI教育工委會主任、浙江大學(xué)人工智能研究所所長吳飛,阿里巴巴通義實驗室人物AIGC負(fù)責(zé)人孫佰貴,北京航空航天大學(xué)電子信息工程學(xué)院教授李勝曦,深信服科技股份有限公司安全GPT業(yè)務(wù)主管訾然,西北工業(yè)大學(xué)副教授、上海人工智能實驗室青年科學(xué)家趙斌等學(xué)術(shù)界與產(chǎn)業(yè)界的專家出席并在論壇上發(fā)表專題報告。中國電信人工智能研究院青年科學(xué)家趙健研究員擔(dān)任論壇主持人。
 
  
  趙健研究員
  
  中國圖象圖形學(xué)學(xué)會青工委副主任、北京航空航天大學(xué)徐邁教授為本次論壇致歡迎詞。致辭中提到:“隨著人工智能技術(shù)的飛速發(fā)展,大模型已經(jīng)成為推動社會進步,促進產(chǎn)業(yè)升級的重要力量,它們以強大的數(shù)字處理能力和深度學(xué)習(xí)能力,正在改變著我們的生活方式、工作模式乃至思想習(xí)慣。”
  
  他表示:“本次論壇匯聚了眾多大模型領(lǐng)域的佼佼者,我們共同探討大模型的最新研究成果、應(yīng)用案例和未來趨勢,我相信通過我們的交流合作,我們能夠更好的理解大模型的潛力和挑戰(zhàn),更有效的推動大模型技術(shù)的發(fā)展和應(yīng)用。”當(dāng)下而言,大模型的發(fā)展并非一帆風(fēng)順,對計算資源的巨大需求,對數(shù)據(jù)質(zhì)量的嚴(yán)格要求,以及可能帶來的倫理和隱私問題,亟待領(lǐng)域?qū)W者、開發(fā)者、使用者共同努力,探索和創(chuàng)新,以確保大模型技術(shù)的健康發(fā)展和廣泛應(yīng)用。每一個人都要以更積極的態(tài)度,擁抱全新的趨勢,面對新時代背景下技術(shù)邏輯、需求邏輯和場景方面的挑戰(zhàn)。
 
  
  徐邁教授
  
  共赴AI大模型熱潮
  
  聚焦時代機遇與挑戰(zhàn)
  
  上海交通大學(xué)電子信息與電氣工程學(xué)院特聘教授熊紅凱作題為《面向通用視覺大模型的稀疏優(yōu)化和泛化設(shè)計》的主題報告,他針對構(gòu)建大模型的基本架構(gòu)Transformer設(shè)計,與參會嘉賓共同討論不同場景和幾何結(jié)構(gòu)數(shù)據(jù)的高效可泛化方法。他討論了模態(tài)混合適配信息遺忘的問題,根據(jù)可逆歸一化流進行信息無損的適應(yīng)性調(diào)整,構(gòu)建多任務(wù)的動態(tài)模型拓?fù)?。拓展Transformer結(jié)構(gòu),形成可學(xué)習(xí)的各向異性濾波,實現(xiàn)多尺度幾何頻率分析。對于一般化的流形上信號,進行動態(tài)路由可學(xué)習(xí)構(gòu)圖,設(shè)計規(guī)范等變網(wǎng)絡(luò),提升在不同局部坐標(biāo)系、不同三維網(wǎng)格結(jié)構(gòu)及分辨率下的泛化性能。
  
  熊紅凱教授
  
  華南理工大學(xué)二級教授金連文作題為《視覺基礎(chǔ)模型與OCR垂直大模型的一些思考》的主題報告。隨著大語言模型(LLMs)的興起,面向自然語言處理領(lǐng)域的通用人工智能(AGI)取得了重大突破,近年來視覺基礎(chǔ)模型、多模態(tài)大模型也引起了廣泛的研究關(guān)注并取得了快速發(fā)展,但針對光學(xué)文字識別(OCR)垂直領(lǐng)域的大模型研究工作報道還不多。他在分享中簡要回顧了近年來多模態(tài)大模型、視覺基礎(chǔ)模型和OCR垂直領(lǐng)域基礎(chǔ)模型等相關(guān)代表性技術(shù)進展,并向大眾介紹了他所在團隊的最新研究,也就是面向OCR的文檔圖像像素級底層處理基礎(chǔ)大模型構(gòu)建方法和技術(shù)路線。隨后與參會嘉賓共同對大模型時代OCR等垂直領(lǐng)域的發(fā)展趨勢與未來研究方向進行討論和展望,為大家?guī)砹朔浅P路f的見解。
  
  金連文教授
  
  國科學(xué)院大學(xué)特聘教授葉齊祥作題為《視覺表征模型的結(jié)構(gòu)設(shè)計與物理啟發(fā)》的主題報告,他首先分析了局部卷積運算與全局注意力運算的互補性及辯證關(guān)系,將局部特征與全局特征耦合形成Conformer網(wǎng)絡(luò)結(jié)構(gòu),顯著增強視覺表征能力,提升表征模型的性能下限。接著探討了局部卷積運算造成的Mask Image Modeling (MIM)自監(jiān)督學(xué)習(xí)信息泄露問題,提出了Token Merging操作,突破卷積或局部運算的局部約束,形成高效分層Transformer 表征(HiViT)與全預(yù)訓(xùn)練的Transformer 金字塔網(wǎng)絡(luò)(iTPN)。這一系列研究,從模型結(jié)構(gòu)設(shè)計角度將視覺目標(biāo)檢測、分割等任務(wù)性能提升到了一個新高度。
  
  葉齊祥教授
  
  探索大模型創(chuàng)新發(fā)展
  
  打通技術(shù)與典型場景應(yīng)用壁壘
  
  深信服科技股份有限公司的安全GPT業(yè)務(wù)主管訾然作題為《大語言模型在網(wǎng)絡(luò)安全領(lǐng)域的落地實踐和研究》的主題報告。他在報告中首先介紹了國內(nèi)外網(wǎng)絡(luò)安全領(lǐng)域落地大語言模型的最新進展和落地實踐,包括攻擊檢測、威脅研判、數(shù)據(jù)安全等。并探討在RAG、超長上下文、AI agent等大語言模型新技術(shù)快速發(fā)展的當(dāng)下,安全領(lǐng)域的大語言模型會如何發(fā)展。從更貼近實際產(chǎn)品的角度向大家介紹了安全領(lǐng)域大模型落地到底會給客戶展現(xiàn)哪些更為直觀的場景。
  
  訾然博士
  
  阿里巴巴通義實驗室人物AIGC負(fù)責(zé)人孫佰貴結(jié)合自身豐富的研究經(jīng)驗分享了題為《AIGC FaceChain的應(yīng)用與創(chuàng)新》的主題報告。他認(rèn)為在AIGC技術(shù)浪潮推動下,圖像內(nèi)容生成已經(jīng)在C端和B端展現(xiàn)出了廣闊的應(yīng)用潛力。結(jié)合實際應(yīng)用,他向大家分享了facechain在人物寫真、虛擬試衣、人物視頻等熱門應(yīng)用場景的攻關(guān)成果。相關(guān)技術(shù)場景已在飛豬數(shù)字旅拍、通義萬相寫真館等多個應(yīng)用中成功落地,其開放API具有開箱即用、自定義模板、靈活配置風(fēng)格以及免訓(xùn)練技術(shù)路徑等優(yōu)勢。目前facechain團隊積極推進開源社區(qū)建設(shè),在GitHub上收獲超過8.1K Star,已榮獲6項國內(nèi)外開源項目和個人獎項。他希望通過此次分享, facechain能被更多人了解,也更關(guān)注這方面的發(fā)展與未來應(yīng)用。
  
  孫佰貴研究員
  
  北京航空航天大學(xué)電子信息工程學(xué)院教授李勝曦作題為《面向視覺語義重構(gòu)的表征與壓縮方法》的主題報告,他表示:大數(shù)據(jù)、大模型時代下,智能算法的不斷進步常伴隨其表征能力的穩(wěn)步提升,而概率生成模型以無監(jiān)督方式對信號進行概率表征,以其概率釋義等優(yōu)勢在人工智能中扮演著極為關(guān)鍵的角色。報告圍繞面向視覺語義重構(gòu)的生成對抗網(wǎng)絡(luò)表征與可逆化方法,分析生成對抗網(wǎng)絡(luò)的表征性能,以特征函數(shù)為統(tǒng)計度量,進而介紹面向語義重構(gòu)的生成對抗網(wǎng)絡(luò),其理論完備性可確保語義表征的完備性。
  
  李勝曦教授
  
  CAAI教育工委會主任、浙江大學(xué)人工智能研究所所長吳飛作題為《從文本合成到視頻合成的技術(shù)鏈路與瓶頸挑戰(zhàn)》的主題報告。他在報告中介紹了谷歌公司2016年提出能夠捕獲文本單詞之間局部/全局關(guān)聯(lián)的自注意力神經(jīng)網(wǎng)絡(luò)transformer、谷歌公司2021年將transformer從文本領(lǐng)域拓展到圖像領(lǐng)域的Vision transformer、Stability AI 公司2022年提出的以文生圖Stable Diffusion、加州大學(xué)伯克利分校和紐約大學(xué)2023年提出圖像合成技術(shù)Diffusion Transformers (DiTs)等核心算法發(fā)展脈絡(luò),以及在這些核心算法的發(fā)展中,揭示了對合成內(nèi)容中的最小單元進行有意義的關(guān)聯(lián)組合的機理與天花板。
  
  在垂直領(lǐng)域的大模型或者通用大模型方面,他也提出了未來展望的研究熱點。包括語言大模型躍升為跨媒體大模型;如何讓大語言模型訓(xùn)練和賦能過程,實現(xiàn)數(shù)據(jù)和知識的雙輪驅(qū)動;如何讓大語言模型和環(huán)境進行交互,對智能體的動作行為進行指導(dǎo)或者是評估;如何設(shè)計更好的大語言模型工具,完成基礎(chǔ)科學(xué)研究或者工程技術(shù)領(lǐng)域挑戰(zhàn)的問題;以及如何通過端云協(xié)同鏈條化技術(shù)打通垂直領(lǐng)域大模型和端側(cè)輕量級推理之間的障礙,形成大小模型端云協(xié)同的研究等。這些挑戰(zhàn),為大模型領(lǐng)域的發(fā)展提出了更具體的科研要求。
  
  吳飛教授
  
  西北工業(yè)大學(xué)副教授、上海人工智能實驗室青年科學(xué)家趙斌為大家?guī)砹祟}為《人工智能軟硬件一體化》的主題報告。他提到,生命起源以來,生物智能的進化過程不僅體現(xiàn)在思維方式的演進,還包括體型和四肢等身體結(jié)構(gòu)的轉(zhuǎn)變。人工智能是參考生物智能所形成的系列技術(shù),其理論發(fā)展和技術(shù)落地需要軟硬件的協(xié)同。在這一思想的驅(qū)使下,有必要關(guān)注人工智能軟硬件一體化研究,推動人工智能應(yīng)用落地。
  
  他的分享內(nèi)容主要凝練了生物智能“思維計算-實體控制-環(huán)境感知”的三元交互模式,重點介紹大模型驅(qū)動具身智能體的相關(guān)研究,包括高層語義理解、自身技能認(rèn)知與復(fù)雜任務(wù)執(zhí)行等技術(shù),為大模型時代的人工智能軟硬件發(fā)展提供新思路。他表示:“現(xiàn)在大模型的方案能力比較差,和真正環(huán)境交互的時候,還有很多長尾問題沒有解決,這也引導(dǎo)了接下來做如何的研究。希望未來人工智能能夠觸及一切,讓世界都變得好玩起來,涌現(xiàn)更多新的概念。”
  
  趙斌副教授
  
  圍繞問題與挑戰(zhàn)
  
  縱論大模型未來發(fā)展
  
  圓桌對話環(huán)節(jié)由部分報告嘉賓及特別邀請的中科院計算所山世光研究員共同參與,就“大模型對于視覺研究的影響”、“大模型會不會主導(dǎo)一切”、“通用人工智能的實現(xiàn)方式?專用人工智能與通用人工智能如何結(jié)合”這三個話題進行探討。
  
  嘉賓們各抒己見,分別就上述話題發(fā)表了極具啟發(fā)性的深刻見解,帶領(lǐng)參會觀眾們更為清晰的認(rèn)識了大模型的發(fā)展與通用人工智能的未來。嘉賓們表示:大模型不能主導(dǎo)一切,而未來人工智能學(xué)習(xí)肯定會回歸到人類的學(xué)習(xí)上面。大模型將來能不能在自我創(chuàng)造、自我發(fā)明方面能夠有所突破,這是一個長期且困難的事情。
  
  隨著大模型推廣,如何形成批量性、規(guī)模性的效益,是行業(yè)的共性話題。隨著應(yīng)用價值的體現(xiàn),大模型在金融業(yè)的推廣力度才會更大。大模型無疑會帶來一個全新的時代,需要政、產(chǎn)、學(xué)、研、用深度合作、協(xié)同創(chuàng)新。
  
  激勵創(chuàng)新,智能擔(dān)當(dāng)。本次論壇通過研討大模型與通用人工智能技術(shù)與應(yīng)用趨勢,為數(shù)智產(chǎn)業(yè)發(fā)展提供新的思路和建議,同時促進了行業(yè)的交流與合作,推動AI創(chuàng)新技術(shù)普及和推廣。未來,大會將持續(xù)分享人工智能領(lǐng)域的新科技、新政策和新趨勢,搭建行業(yè)溝通橋梁,共同推動中國人工智能行業(yè)的高質(zhì)量發(fā)展。
  
  為期兩天的第十三屆吳文俊人工智能科學(xué)技術(shù)獎頒獎典禮暨2023中國人工智能產(chǎn)業(yè)年會已圓滿落幕。本屆大會大模型與通用人工智能專題論壇由中國人工智能學(xué)會主辦,蘇州工業(yè)園區(qū)管委會協(xié)辦,中國人工智能學(xué)會吳文俊人工智能科學(xué)技術(shù)獎評選基地(蘇州)、智博天宮(蘇州)人工智能產(chǎn)業(yè)研究院、北京航空航天大學(xué)、西北工業(yè)大學(xué)、深信服科技承辦。
  
  吳文俊人工智能科學(xué)技術(shù)獎
  
  “吳文俊人工智能科學(xué)技術(shù)獎”由中國人工智能學(xué)會發(fā)起主辦,是我國智能科學(xué)技術(shù)領(lǐng)域唯一以人民科學(xué)家、人工智能開拓先驅(qū)、我國智能科學(xué)研究的開拓者和領(lǐng)軍人、首屆國家最高科學(xué)技術(shù)獎獲得者、中國科學(xué)院院士、中國人工智能學(xué)會名譽理事長吳文俊先生命名,依托社會力量設(shè)立的科學(xué)技術(shù)獎(國科獎社證字第0218號),具備提名推薦國家科學(xué)技術(shù)獎資格,被譽為“中國智能科學(xué)技術(shù)最高獎”、“人工智能領(lǐng)域皇冠上的明珠”。旨在獎勵在智能科學(xué)研究中取得重要發(fā)現(xiàn),著力實現(xiàn)原始創(chuàng)新與突破,或在人工智能領(lǐng)域攻克關(guān)鍵核心技術(shù),推動科學(xué)技術(shù)進步取得重大進展,創(chuàng)造巨大經(jīng)濟社會效益或者生態(tài)環(huán)境效益的單位或個人。迄今,“吳文俊人工智能科學(xué)技術(shù)獎”已成功召開十三屆評審及表彰活動,為大力弘揚科學(xué)家精神,激勵創(chuàng)新人才涌現(xiàn),增強科技創(chuàng)新的內(nèi)生動力,促進人工智能與傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型融合,推動經(jīng)濟社會高質(zhì)量發(fā)展提供了有力支撐,在我國智能科學(xué)技術(shù)領(lǐng)域享有盛譽。