聚焦通用大模型“主戰(zhàn)場”，強化頂層設(shè)計——中國人工智能產(chǎn)業(yè)年會大模型與通用人工智能論壇圓滿落幕

時間：2024-04-19 14:26:35 發(fā)布：tgy 來源：吳文俊人工智能科學(xué)技術(shù)獎第一對焦：人工智能

　　【ZiDongHua 之自動化學(xué)院派收錄關(guān)鍵詞：人工智能通用大模型】

　　論壇回顧 | 聚焦通用大模型“主戰(zhàn)場”，強化頂層設(shè)計——中國人工智能產(chǎn)業(yè)年會大模型與通用人工智能論壇圓滿落幕

　　4月14日上午，以“創(chuàng)新驅(qū)動•數(shù)智強國”為主題的第十三屆吳文俊人工智能科學(xué)技術(shù)獎頒獎典禮暨2023中國人工智能產(chǎn)業(yè)年會——大模型與通用人工智能專題論壇在蘇州工業(yè)園區(qū)希爾頓酒店圓滿落幕。來自國內(nèi)知名高校的專家學(xué)者匯聚一堂，觀點碰撞，探究具身智能、多模態(tài)多任務(wù)學(xué)習(xí)、語義空間對齊等重要的AI技術(shù)的理論發(fā)展和智能人機交互、OCR、內(nèi)容生成等AI技術(shù)落地應(yīng)用等關(guān)鍵議題，共同探討、分享人工智能的關(guān)鍵技術(shù)、創(chuàng)新難點及發(fā)展趨勢。

　　眾抒己見

　　擁抱人工智能大時代

　　中國圖象圖形學(xué)學(xué)會青工委副主任、北京航空航天大學(xué)徐邁教授與中國電信人工智能研究院青年科學(xué)家趙健研究員共同擔(dān)任論壇主席，上海交通大學(xué)電子信息與電氣工程學(xué)院特聘教授熊紅凱，華南理工大學(xué)二級教授金連文，中國科學(xué)院大學(xué)特聘教授葉齊祥，CAAI教育工委會主任、浙江大學(xué)人工智能研究所所長吳飛，阿里巴巴通義實驗室人物AIGC負(fù)責(zé)人孫佰貴，北京航空航天大學(xué)電子信息工程學(xué)院教授李勝曦，深信服科技股份有限公司安全GPT業(yè)務(wù)主管訾然，西北工業(yè)大學(xué)副教授、上海人工智能實驗室青年科學(xué)家趙斌等學(xué)術(shù)界與產(chǎn)業(yè)界的專家出席并在論壇上發(fā)表專題報告。中國電信人工智能研究院青年科學(xué)家趙健研究員擔(dān)任論壇主持人。

　　趙健研究員

　　中國圖象圖形學(xué)學(xué)會青工委副主任、北京航空航天大學(xué)徐邁教授為本次論壇致歡迎詞。致辭中提到：“隨著人工智能技術(shù)的飛速發(fā)展，大模型已經(jīng)成為推動社會進步，促進產(chǎn)業(yè)升級的重要力量，它們以強大的數(shù)字處理能力和深度學(xué)習(xí)能力，正在改變著我們的生活方式、工作模式乃至思想習(xí)慣。”

　　他表示：“本次論壇匯聚了眾多大模型領(lǐng)域的佼佼者，我們共同探討大模型的最新研究成果、應(yīng)用案例和未來趨勢，我相信通過我們的交流合作，我們能夠更好的理解大模型的潛力和挑戰(zhàn)，更有效的推動大模型技術(shù)的發(fā)展和應(yīng)用。”當(dāng)下而言，大模型的發(fā)展并非一帆風(fēng)順，對計算資源的巨大需求，對數(shù)據(jù)質(zhì)量的嚴(yán)格要求，以及可能帶來的倫理和隱私問題，亟待領(lǐng)域?qū)W者、開發(fā)者、使用者共同努力，探索和創(chuàng)新，以確保大模型技術(shù)的健康發(fā)展和廣泛應(yīng)用。每一個人都要以更積極的態(tài)度，擁抱全新的趨勢，面對新時代背景下技術(shù)邏輯、需求邏輯和場景方面的挑戰(zhàn)。

　　徐邁教授

　　共赴AI大模型熱潮

　　聚焦時代機遇與挑戰(zhàn)

　　上海交通大學(xué)電子信息與電氣工程學(xué)院特聘教授熊紅凱作題為《面向通用視覺大模型的稀疏優(yōu)化和泛化設(shè)計》的主題報告，他針對構(gòu)建大模型的基本架構(gòu)Transformer設(shè)計，與參會嘉賓共同討論不同場景和幾何結(jié)構(gòu)數(shù)據(jù)的高效可泛化方法。他討論了模態(tài)混合適配信息遺忘的問題，根據(jù)可逆歸一化流進行信息無損的適應(yīng)性調(diào)整，構(gòu)建多任務(wù)的動態(tài)模型拓?fù)?。拓展Transformer結(jié)構(gòu)，形成可學(xué)習(xí)的各向異性濾波，實現(xiàn)多尺度幾何頻率分析。對于一般化的流形上信號，進行動態(tài)路由可學(xué)習(xí)構(gòu)圖，設(shè)計規(guī)范等變網(wǎng)絡(luò)，提升在不同局部坐標(biāo)系、不同三維網(wǎng)格結(jié)構(gòu)及分辨率下的泛化性能。

　　熊紅凱教授

　　華南理工大學(xué)二級教授金連文作題為《視覺基礎(chǔ)模型與OCR垂直大模型的一些思考》的主題報告。隨著大語言模型（LLMs）的興起，面向自然語言處理領(lǐng)域的通用人工智能（AGI）取得了重大突破，近年來視覺基礎(chǔ)模型、多模態(tài)大模型也引起了廣泛的研究關(guān)注并取得了快速發(fā)展，但針對光學(xué)文字識別（OCR）垂直領(lǐng)域的大模型研究工作報道還不多。他在分享中簡要回顧了近年來多模態(tài)大模型、視覺基礎(chǔ)模型和OCR垂直領(lǐng)域基礎(chǔ)模型等相關(guān)代表性技術(shù)進展，并向大眾介紹了他所在團隊的最新研究，也就是面向OCR的文檔圖像像素級底層處理基礎(chǔ)大模型構(gòu)建方法和技術(shù)路線。隨后與參會嘉賓共同對大模型時代OCR等垂直領(lǐng)域的發(fā)展趨勢與未來研究方向進行討論和展望，為大家?guī)砹朔浅Ｐ路f的見解。

　　金連文教授

　　國科學(xué)院大學(xué)特聘教授葉齊祥作題為《視覺表征模型的結(jié)構(gòu)設(shè)計與物理啟發(fā)》的主題報告，他首先分析了局部卷積運算與全局注意力運算的互補性及辯證關(guān)系，將局部特征與全局特征耦合形成Conformer網(wǎng)絡(luò)結(jié)構(gòu)，顯著增強視覺表征能力，提升表征模型的性能下限。接著探討了局部卷積運算造成的Mask Image Modeling （MIM）自監(jiān)督學(xué)習(xí)信息泄露問題，提出了Token Merging操作，突破卷積或局部運算的局部約束，形成高效分層Transformer 表征(HiViT)與全預(yù)訓(xùn)練的Transformer 金字塔網(wǎng)絡(luò)（iTPN）。這一系列研究，從模型結(jié)構(gòu)設(shè)計角度將視覺目標(biāo)檢測、分割等任務(wù)性能提升到了一個新高度。

　　葉齊祥教授

　　探索大模型創(chuàng)新發(fā)展

　　打通技術(shù)與典型場景應(yīng)用壁壘

　　深信服科技股份有限公司的安全GPT業(yè)務(wù)主管訾然作題為《大語言模型在網(wǎng)絡(luò)安全領(lǐng)域的落地實踐和研究》的主題報告。他在報告中首先介紹了國內(nèi)外網(wǎng)絡(luò)安全領(lǐng)域落地大語言模型的最新進展和落地實踐，包括攻擊檢測、威脅研判、數(shù)據(jù)安全等。并探討在RAG、超長上下文、AI agent等大語言模型新技術(shù)快速發(fā)展的當(dāng)下，安全領(lǐng)域的大語言模型會如何發(fā)展。從更貼近實際產(chǎn)品的角度向大家介紹了安全領(lǐng)域大模型落地到底會給客戶展現(xiàn)哪些更為直觀的場景。

　　訾然博士

　　阿里巴巴通義實驗室人物AIGC負(fù)責(zé)人孫佰貴結(jié)合自身豐富的研究經(jīng)驗分享了題為《AIGC FaceChain的應(yīng)用與創(chuàng)新》的主題報告。他認(rèn)為在AIGC技術(shù)浪潮推動下，圖像內(nèi)容生成已經(jīng)在C端和B端展現(xiàn)出了廣闊的應(yīng)用潛力。結(jié)合實際應(yīng)用，他向大家分享了facechain在人物寫真、虛擬試衣、人物視頻等熱門應(yīng)用場景的攻關(guān)成果。相關(guān)技術(shù)場景已在飛豬數(shù)字旅拍、通義萬相寫真館等多個應(yīng)用中成功落地，其開放API具有開箱即用、自定義模板、靈活配置風(fēng)格以及免訓(xùn)練技術(shù)路徑等優(yōu)勢。目前facechain團隊積極推進開源社區(qū)建設(shè)，在GitHub上收獲超過8.1K Star，已榮獲6項國內(nèi)外開源項目和個人獎項。他希望通過此次分享， facechain能被更多人了解，也更關(guān)注這方面的發(fā)展與未來應(yīng)用。

　　孫佰貴研究員

　　北京航空航天大學(xué)電子信息工程學(xué)院教授李勝曦作題為《面向視覺語義重構(gòu)的表征與壓縮方法》的主題報告，他表示：大數(shù)據(jù)、大模型時代下，智能算法的不斷進步常伴隨其表征能力的穩(wěn)步提升，而概率生成模型以無監(jiān)督方式對信號進行概率表征，以其概率釋義等優(yōu)勢在人工智能中扮演著極為關(guān)鍵的角色。報告圍繞面向視覺語義重構(gòu)的生成對抗網(wǎng)絡(luò)表征與可逆化方法，分析生成對抗網(wǎng)絡(luò)的表征性能，以特征函數(shù)為統(tǒng)計度量，進而介紹面向語義重構(gòu)的生成對抗網(wǎng)絡(luò)，其理論完備性可確保語義表征的完備性。

　　李勝曦教授

　　CAAI教育工委會主任、浙江大學(xué)人工智能研究所所長吳飛作題為《從文本合成到視頻合成的技術(shù)鏈路與瓶頸挑戰(zhàn)》的主題報告。他在報告中介紹了谷歌公司2016年提出能夠捕獲文本單詞之間局部/全局關(guān)聯(lián)的自注意力神經(jīng)網(wǎng)絡(luò)transformer、谷歌公司2021年將transformer從文本領(lǐng)域拓展到圖像領(lǐng)域的Vision transformer、Stability AI 公司2022年提出的以文生圖Stable Diffusion、加州大學(xué)伯克利分校和紐約大學(xué)2023年提出圖像合成技術(shù)Diffusion Transformers (DiTs)等核心算法發(fā)展脈絡(luò)，以及在這些核心算法的發(fā)展中，揭示了對合成內(nèi)容中的最小單元進行有意義的關(guān)聯(lián)組合的機理與天花板。

　　在垂直領(lǐng)域的大模型或者通用大模型方面，他也提出了未來展望的研究熱點。包括語言大模型躍升為跨媒體大模型；如何讓大語言模型訓(xùn)練和賦能過程，實現(xiàn)數(shù)據(jù)和知識的雙輪驅(qū)動；如何讓大語言模型和環(huán)境進行交互，對智能體的動作行為進行指導(dǎo)或者是評估；如何設(shè)計更好的大語言模型工具，完成基礎(chǔ)科學(xué)研究或者工程技術(shù)領(lǐng)域挑戰(zhàn)的問題；以及如何通過端云協(xié)同鏈條化技術(shù)打通垂直領(lǐng)域大模型和端側(cè)輕量級推理之間的障礙，形成大小模型端云協(xié)同的研究等。這些挑戰(zhàn)，為大模型領(lǐng)域的發(fā)展提出了更具體的科研要求。

　　吳飛教授

　　西北工業(yè)大學(xué)副教授、上海人工智能實驗室青年科學(xué)家趙斌為大家?guī)砹祟}為《人工智能軟硬件一體化》的主題報告。他提到，生命起源以來，生物智能的進化過程不僅體現(xiàn)在思維方式的演進，還包括體型和四肢等身體結(jié)構(gòu)的轉(zhuǎn)變。人工智能是參考生物智能所形成的系列技術(shù)，其理論發(fā)展和技術(shù)落地需要軟硬件的協(xié)同。在這一思想的驅(qū)使下，有必要關(guān)注人工智能軟硬件一體化研究，推動人工智能應(yīng)用落地。

　　他的分享內(nèi)容主要凝練了生物智能“思維計算-實體控制-環(huán)境感知”的三元交互模式，重點介紹大模型驅(qū)動具身智能體的相關(guān)研究，包括高層語義理解、自身技能認(rèn)知與復(fù)雜任務(wù)執(zhí)行等技術(shù)，為大模型時代的人工智能軟硬件發(fā)展提供新思路。他表示：“現(xiàn)在大模型的方案能力比較差，和真正環(huán)境交互的時候，還有很多長尾問題沒有解決，這也引導(dǎo)了接下來做如何的研究。希望未來人工智能能夠觸及一切，讓世界都變得好玩起來，涌現(xiàn)更多新的概念。”

　　趙斌副教授

　　圍繞問題與挑戰(zhàn)

　　縱論大模型未來發(fā)展

　　圓桌對話環(huán)節(jié)由部分報告嘉賓及特別邀請的中科院計算所山世光研究員共同參與，就“大模型對于視覺研究的影響”、“大模型會不會主導(dǎo)一切”、“通用人工智能的實現(xiàn)方式？專用人工智能與通用人工智能如何結(jié)合”這三個話題進行探討。

　　嘉賓們各抒己見，分別就上述話題發(fā)表了極具啟發(fā)性的深刻見解，帶領(lǐng)參會觀眾們更為清晰的認(rèn)識了大模型的發(fā)展與通用人工智能的未來。嘉賓們表示：大模型不能主導(dǎo)一切，而未來人工智能學(xué)習(xí)肯定會回歸到人類的學(xué)習(xí)上面。大模型將來能不能在自我創(chuàng)造、自我發(fā)明方面能夠有所突破，這是一個長期且困難的事情。

　　隨著大模型推廣，如何形成批量性、規(guī)模性的效益，是行業(yè)的共性話題。隨著應(yīng)用價值的體現(xiàn)，大模型在金融業(yè)的推廣力度才會更大。大模型無疑會帶來一個全新的時代，需要政、產(chǎn)、學(xué)、研、用深度合作、協(xié)同創(chuàng)新。

　　激勵創(chuàng)新，智能擔(dān)當(dāng)。本次論壇通過研討大模型與通用人工智能技術(shù)與應(yīng)用趨勢，為數(shù)智產(chǎn)業(yè)發(fā)展提供新的思路和建議，同時促進了行業(yè)的交流與合作，推動AI創(chuàng)新技術(shù)普及和推廣。未來，大會將持續(xù)分享人工智能領(lǐng)域的新科技、新政策和新趨勢，搭建行業(yè)溝通橋梁，共同推動中國人工智能行業(yè)的高質(zhì)量發(fā)展。

　　為期兩天的第十三屆吳文俊人工智能科學(xué)技術(shù)獎頒獎典禮暨2023中國人工智能產(chǎn)業(yè)年會已圓滿落幕。本屆大會大模型與通用人工智能專題論壇由中國人工智能學(xué)會主辦，蘇州工業(yè)園區(qū)管委會協(xié)辦，中國人工智能學(xué)會吳文俊人工智能科學(xué)技術(shù)獎評選基地（蘇州）、智博天宮（蘇州）人工智能產(chǎn)業(yè)研究院、北京航空航天大學(xué)、西北工業(yè)大學(xué)、深信服科技承辦。

　　吳文俊人工智能科學(xué)技術(shù)獎

　　“吳文俊人工智能科學(xué)技術(shù)獎”由中國人工智能學(xué)會發(fā)起主辦，是我國智能科學(xué)技術(shù)領(lǐng)域唯一以人民科學(xué)家、人工智能開拓先驅(qū)、我國智能科學(xué)研究的開拓者和領(lǐng)軍人、首屆國家最高科學(xué)技術(shù)獎獲得者、中國科學(xué)院院士、中國人工智能學(xué)會名譽理事長吳文俊先生命名，依托社會力量設(shè)立的科學(xué)技術(shù)獎（國科獎社證字第0218號），具備提名推薦國家科學(xué)技術(shù)獎資格，被譽為“中國智能科學(xué)技術(shù)最高獎”、“人工智能領(lǐng)域皇冠上的明珠”。旨在獎勵在智能科學(xué)研究中取得重要發(fā)現(xiàn)，著力實現(xiàn)原始創(chuàng)新與突破，或在人工智能領(lǐng)域攻克關(guān)鍵核心技術(shù)，推動科學(xué)技術(shù)進步取得重大進展，創(chuàng)造巨大經(jīng)濟社會效益或者生態(tài)環(huán)境效益的單位或個人。迄今，“吳文俊人工智能科學(xué)技術(shù)獎”已成功召開十三屆評審及表彰活動，為大力弘揚科學(xué)家精神，激勵創(chuàng)新人才涌現(xiàn)，增強科技創(chuàng)新的內(nèi)生動力，促進人工智能與傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型融合，推動經(jīng)濟社會高質(zhì)量發(fā)展提供了有力支撐，在我國智能科學(xué)技術(shù)領(lǐng)域享有盛譽。

自動對焦：通用大模型