【ZiDongHua 之自動化學院派收錄關鍵詞: 大模型 AI 人工智能 自動駕駛
  
  張鈸院士:大模型時代的企業(yè)AI發(fā)展趨勢
  
  yonyou
  
  在當今技術迅速發(fā)展的時代,生成式人工智能與大模型正成為推動產業(yè)變革的重要力量。隨著AI技術的不斷成熟與普及,它的應用已從個人領域擴展至企業(yè)層面,廣泛覆蓋各行各業(yè)。
 
  
  那么,新技術究竟會給產業(yè)帶來哪些積極地影響?它又將如何平穩(wěn)落地到場景?近日,在用友主辦的“2024全球商業(yè)創(chuàng)新大會”上,中國科學院院士、清華大學人工智能研究院名譽院長張鈸發(fā)表了主題為《生成式人工智能時代的產業(yè)》的演講。
  
  會上,張鈸院士從能力、應用、架構、趨勢等幾個維度,詳盡闡述了學術界關于大模型的洞察與思考,全面剖析了大模型的演進路徑,就該技術的應用前景、挑戰(zhàn)及其在不同領域的實際應用展開了深入探討。
  
  01
  
  大語言模型“三大能力”
  
  與“一大缺陷”不容忽視
  
  張鈸院士進一步探討了生成式人工智能的核心優(yōu)勢及其可能帶來的挑戰(zhàn)。目前,在大模型發(fā)展的進程中,已呈現出“三大能力”和“一大缺陷”。
  
  其中,生成式人工智能具備三大核心能力為:
  
  01
  
  第一,強大的語言生成能力,即在開領域生成多樣性的、語義連貫的、類似人類的文本。這是大語言模型區(qū)別于其他計算機生成語言的靈魂和優(yōu)勢所在;
  
  02
  
  第二,強大的自然語言對話能力,即在開領域實現人機自然語言對話;
  
  03
  
  第三,強大的遷移能力,即在代理任務上訓練一個模型,只需要少量數據和微調,就可以適配到下游任務中,從而凸顯出大模型可舉一反三的能力。
  
  除了上述優(yōu)勢外,大模型也呈現了一大缺陷,那就是大模型的幻覺。換句話說,在多樣性輸出的過程中,大模型也會犯錯,這與它的創(chuàng)造性同時產生。
  
  事實上,這種幻覺是外部信息驅動下產生的,因為大模型與人類生成的語言只是行為上相似,而內在機制完全不同。更深一步講,這也揭示出了基礎模型的局限性。一方面,它輸出的結果不一定正確,且質量不可控;另一方面,大模型不可信任;還有一方面,大模型對提示詞的依賴性強,魯棒性較差。
  
  “正因具備上述優(yōu)勢與缺陷,產業(yè)在落地大模型應用時必須格外重視這些因素。”
  
  ——張鈸院士
  
  02
  
  基礎模型的三種落地方向
  
  目前,在生成式AI的眾多應用場景中,高階應用如設計、規(guī)劃,低階應用如服務、營銷是相對容易實現的。例如,券商可依托大模型打造新一代AI中臺大腦,幫助企業(yè)實現智能化的開戶、客服、AI選股等服務場景。
 
  
  與之相反,涉及企業(yè)關鍵業(yè)務領域的大模型應用場景則是較難實現的,如自動駕駛或制造行業(yè)的定制化生產、質量控制等。因為這些核心業(yè)務對于技術的容錯率較低,而可靠性、準確性要求更高。
  
  那么,大模型的應用場景該如何落地到核心業(yè)務領域?技術提供商、產業(yè)界的機會在哪里?
  
  張鈸院士提出了落地通用基礎模型的三種方向。
  
  第一,面向各個行業(yè)的垂類大模型;
  
  第二,在大模型的基礎上打造產業(yè)應用;
  
  第三,讓大模型與其他技術、工具相結合,創(chuàng)造產業(yè)應用。
  
  03
  
  大模型的六種架構模式
  
  找到了大模型的落地方向,那么讓大模型真正落地,同時還能使其用起來安全、可信、可控,這是產業(yè)和企業(yè)普遍關注的話題。為此,張鈸院士提出了基于大模型的六種架構模式。
  
  第一,提示工程
  
  在很多大模型設計的過程中,都會增加這一至關重要的中間環(huán)節(jié)。它可以提升模型的理解和響應能力,輸出一個更令人滿意的結果。
  
  比如,當問及大模型9.11和9.9哪一個數大時,它會給出錯誤的答案。但是,當用戶在提示了有小數點存在的情況后,大模型便會給出正確的結果。因此,提示工程是影響生成結果的關鍵因素。提示的質量直接決定了輸出結果的準確性和質量。在實際應用中,如何優(yōu)化提示內容成為提升生成式人工智能應用效果的重要手段。
  
  第二,檢索增強生成(RAG)
  
  對于事實性的問題,為了提高生成內容的確定性,生成式人工智能需要結合檢索功能,通過觸發(fā)外部知識庫檢索機制,輔助大模型生成更加準確、詳盡且具有針對性的答案。
  
  第三,微調
  
  在加入了領域知識和私有數據后,通過在特定領域進行微調,可以顯著提高生成式人工智能的輸出質量,使其更符合特定領域的需求。比如,大模型在進行了醫(yī)療專業(yè)知識訓練后,它就可以完成執(zhí)業(yè)醫(yī)師資格考試,準確率可達90%以上。而且,在診斷推理的過程中,大模型也對結果做出合理的解釋。
  
  第四,知識圖譜與向量數據庫
  
  將知識圖譜與向量數據庫結合使用,能夠幫助生成式人工智能更好地理解和處理文本中的語義信息,可解決模型缺乏事實知識、幻覺和可解釋性等諸多問題。在企業(yè)部署大模型時,通過建立向量數據庫,并讓它與文檔數據庫協同工作,從而提高生成結果的準確性。
  
  第五,內部監(jiān)測與控制
  
  在加以人類控制后,大模型可檢測出數據偏差和漂移,也可處理異常情況。同時,通過引入智能體強化學習,可以讓大模型自我反應,幫助它完成感知、動作、學習的一體化,從而減少錯誤的發(fā)生。
  
  第六,安全與治理
  
  隨著大模型的發(fā)展,安全、誤用與濫用已經成為普遍問題,這里涉及政治標準、道德與倫理等問題。只有建立多層次的安全保障,推動治理體系落地,才能夠確保大模型健康可持續(xù)性發(fā)展。目前,這是一個迫在眉睫的問題。
  
  04
  
  堅持大模型自主發(fā)展之路
  
  推動應用創(chuàng)新與產業(yè)化進程
  
  隨著生成式人工智能的快速發(fā)展,業(yè)界也對其未來前景提出了質疑。針對這一業(yè)界普遍關注的問題,張鈸院士解釋道,生成式AI是人類發(fā)展史上的一次重大技術突破。為此,人類花費了幾十年時間解決了人工智能領域中的三個關鍵技術問題——文本的語義向量表示、生成式預訓練轉換器、自監(jiān)督學習。
  
  其中,最關鍵的技術創(chuàng)新就在于文本的語義向量表示,它實現了從信息形式的處理到信息內容處理的跨越。
  
  “這項技術真正意義在于它將語言問題轉變?yōu)橐粋€數學問題。原來,文本僅代表了一個個符號,符號是存在于離散空間的,這些很難用數學工具去解析。而現在,語言被翻譯為向量,計算機根據向量就可以解析成語義,對信息的內容加以處理,從而幫助人類真正進入到人工智能時代!”
  
  ——張鈸院士
  
  基于對大模型原理的深入理解,張鈸院士對第三代人工智能技術的發(fā)展抱有十足的信心。就目前來看,問題的關鍵點仍在于如何讓它落地。
  
  張鈸院士認為,第三代人工智能的發(fā)展方向重點在于:第一,構建具備可解釋與魯棒(穩(wěn)?。┑腁I理論與方法,消除人們心里產生的恐慌。其次,開發(fā)安全、可控、可信、可靠且可擴展的技術,從而驅動人工智能產業(yè)的繁榮發(fā)展。第三,推動AI的創(chuàng)新應用與產業(yè)化。這表明,AI技術的研究與開發(fā)不僅僅是學術上的突破,還需要與產業(yè)需求緊密結合,將技術創(chuàng)新轉化為現實應用,從而帶來經濟效益和社會進步。
  
  同時,他還提出了“知識驅動 + 數據驅動”的理念,通過整合知識、數據、算法和算力這四大要素,確保AI技術不僅具備強大的智能能力,還能夠在多樣化的應用場景中發(fā)揮穩(wěn)定且長效的作用。
  
  張鈸院士強調,堅持中國自主發(fā)展之路,必須認識到知識驅動與數據驅動在第三代人工智能中的核心作用,充分結合和利用知識、數據、算法、算力等要素,從而驅動中國人工智能產業(yè)的繁榮發(fā)展。
  
  在人工智能技術突飛猛進的今天,大模型正在各行各業(yè)中展現出巨大的潛力。同時,在這條充滿挑戰(zhàn)的征途上,只有通過不斷提升大模型的安全性、可靠性和可控性,才能真正實現其廣泛應用。
  
  未來,我們不僅要關注技術本身的突破,更要思考如何將其與產業(yè)實際深度結合。唯有如此,每一家企業(yè)才能通過探索與挖掘,為自身的未來發(fā)展創(chuàng)造關鍵變量,讓大模型為人類社會創(chuàng)造出更多的價值和機遇,迎接智能時代的全面到來。