科大訊飛劉慶峰：解放生產(chǎn)力釋放想象力

時間：2023-08-29 15:04:03 發(fā)布：tgy 來源：亞布力企業(yè)家論壇CEF 第一對焦：科大訊飛

　　【ZiDongHua 之方案應用場收錄關鍵詞：科大訊飛劉慶峰亞布力論壇人工智能機器人】

　　劉慶峰：解放生產(chǎn)力釋放想象力

　　劉慶峰｜科大訊飛創(chuàng)始人，董事長

　　8月25日，亞布力論壇2023年夏季高峰會在深圳正式開幕。科大訊飛創(chuàng)始人，董事長劉慶峰應邀作開幕演講。他表示，特別希望借助亞布力論壇這個平臺，讓中國企業(yè)在各個領域，將數(shù)據(jù)、算力、算法聯(lián)通起來，形成自己的生態(tài)優(yōu)勢，共同打贏這場通用人工智能時代的產(chǎn)業(yè)升級之戰(zhàn)，共同解放生產(chǎn)力、釋放想象力。

　　以下為劉慶峰演講全文：

　　最近大家普遍關注兩件事。

　　一是這一次通用人工智能包含哪些內容？ChatGPT于去年11月30日發(fā)布，用了短短兩個月的時間積累1億用戶。那么，它到底是一個以對話為主的好玩的工具？還是一個能夠賦能千行百業(yè)，能夠給以“人力”和“時長”為代表的商業(yè)模式帶來根本性變革的工具？

　　二是當2017年《新一代人工智能規(guī)劃》出臺時，大家都很有信心中國在人工智能領域可以跟美國比肩天下，而在今年一季度很多業(yè)界伙伴開始擔憂，認為我們無論從算力、算法，還是應用效果上，是不是又有了代差級的差距？現(xiàn)在人工智能到底發(fā)展如何？

　　我想分享下科大訊飛最新的實踐，并就這些問題做一個簡單的分享。

　　首先是通用人工智能為什么叫通用人工智能？

　　科大訊飛創(chuàng)立于1999年，一直圍繞語音技術和人工智能技術進行研究，希望機器可以像人一樣能聽會說，能理解會思考，用人工智能建設美好世界?？拼笥嶏w承建中國唯一的認知智能全國重點實驗室，核心任務就是要讓機器人具備學習、推理和決策能力。

　　在多年探索中，我們已經(jīng)讓機器人在一個又一個專業(yè)賽道上超越了人。例如語音合成，如果播音員播報水平是5分，那么機器人已達到4.8分了。這意味著，稍微優(yōu)化一下，這個機器人就可以給中央電視臺《創(chuàng)新中國》欄目來配音；在語音識別上，機器人已經(jīng)超過了最好的專業(yè)速記員。今年全國兩會上，2900多個全國人大代表使用科大訊飛產(chǎn)品，準確率為96%；在翻譯上，機器人在大學6級考試中超過了99%的大學生，順利通過國家翻譯師資格考試；在醫(yī)療中，我們讓“智醫(yī)助理”參加國家執(zhí)業(yè)醫(yī)師資格考試，成績?yōu)?56分（滿分600分），超過96.3%的考生……

　　三年前，科大訊飛對GPT所有算法做了深度解讀，我們發(fā)現(xiàn)，即便是1000多億的模型還沒有60多億的模型做得好，所以沒有花大代價去建服務器集群和數(shù)據(jù)。但去年ChatGPT一經(jīng)推出就帶來了巨大驚喜，我們迅速在15天內進行閃電驗證，隨后開始啟動科大訊飛“1+N”認知大模型專項攻關。其中，“1”是對標ChatGPT的通用認知大模型，“N”是教育、醫(yī)療、司法、辦公等領域的落地。

　　這次為什么叫通用人工智能？因為它把海量的多源多模態(tài)數(shù)據(jù)（多源就是多種來源，多模態(tài)可以是語音、圖像、文本、視頻等）送到一個統(tǒng)一的神經(jīng)網(wǎng)絡大模型，這個模型大概是1750億的浮點參數(shù)。原來我們只做60億的模型就可以把醫(yī)療領域的翻譯工作做得很好，那么這次用1000多億的模型能帶來什么好處？我們稱為通用領域的智慧涌現(xiàn)。這個大模型可以對海量數(shù)據(jù)進行記憶、學習和訓練，然后具備推理和決策的能力，很多東西即便沒有教給它，它也可以自己學會。今年4月28日，中央政治局專門提出要高度重視通用人工智能發(fā)展，7月10號，七部門聯(lián)合發(fā)布《生成式人工智能服務管理暫行辦法》，定于8月15號執(zhí)行。大家都在等著首批廠商什么時候能夠給用戶提供海量服務。

　　認知大模型的“智能涌現(xiàn)”將帶來解決人類剛需的全新機遇。我們根據(jù)ChatGPT解讀出的48個主要任務，以及科大訊飛500多萬開發(fā)者需求分析，得出當前階段通用人工智能的七大維度能力，即文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力和多模態(tài)能力。

　　5月6日，科大訊飛正式發(fā)布“星火認知大模型”。我們和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟以及中國科學院人工智能產(chǎn)學研創(chuàng)新聯(lián)盟，把七大維度能力分解成481個子任務。為什么是481個？因為光一個文本生成，就涉及到政府公文、廣告文案等100多項任務。雖然我們在國內可測系統(tǒng)中已處于領先位置，但跟ChatGPT相比還有不少差距。

　　6月9日、8月15日，我們對星火認知大模型進行兩次升級，接下來，我簡單說下七大維度的能力。

　　多風格多任務長文本生成。公文協(xié)作、故事創(chuàng)作、廣宣文案、書寫郵件等功能對工作其實非常有幫助?？拼笥嶏w在做大模型的第一天就堅持中英文同步，在英文文本上，我們與ChatGPT已經(jīng)非常接近了。再分享一個令我都很驚訝的例子。星火大模型中的講故事助手為一個小孩講了72集故事，共計24000多萬字，極大激發(fā)了孩子的想象力，最后小孩自己創(chuàng)作出了《小豬的故事》。

　　多層次跨語種語言理解。例如，以前科大訊飛可以把大家開會的速記由聲音轉為文字，而現(xiàn)在，這個大模型可以把開會的錄音直接變成500字、1000字的摘要，如果需要寫一個新聞通稿，它也可以一鍵生成。語音理解能力會讓認知大模型成為我們每個人在生活和工作中的助手。它可以像人一樣的來調用工具，這是通用大模型最了不起的地方。

　　知識問答。知識問答并不是原來簡單的搜索類問答。星火大模型或認知大模型能學習全世界的知識，它似乎都懂，但它的存在的問題是專業(yè)知識精準度不夠。所以，可以讓其對接行業(yè)知識庫和企業(yè)內部知識庫，這樣，它就可以在學好后用邏輯進行分析和解答。這就是知識問答的核心邏輯。有了它以后，所有企業(yè)的客戶服務系統(tǒng)都會發(fā)生重大革命。

　　代碼能力。幾乎每個企業(yè)都需要代碼能力，如果沒有代碼工程師，那么企業(yè)內部任何組織流程的變化都需要找專業(yè)團隊來修改。10月24日，訊飛星火將在代碼的各維度能力上超越ChatGPT，明年上半年對標GPT-4。根據(jù)OpenAI構建的代碼能力公開測試集HumanEval顯示，星火V2.0的Python語言效果已接近ChatGPT。之所以進步這么大，是因為方法已全部找到，我們缺的是時間和算力。

　　我們的編程助手提高代碼生產(chǎn)效率，成效顯著?？拼笥嶏w2000多名工程師的工具類代碼申請接受率在60%，代碼注釋甚至到了90%。目前綜合效率已提升15%。每天都在進步，今年的提效會到百分之二三十以上。我認為，如果中國軟件行業(yè)不趕快用上這樣的認知大模型，整個行業(yè)會跟美國形成代差級的差距。

　　多模態(tài)能力。當機器具備了圖像、視頻、語音、文字等能力，它會帶來很多幫助。一是在教育、醫(yī)療、司法這些領域可以識別圖像、文字、看影像結構；二是在工業(yè)領域可以自動看懂工業(yè)場景，比如在什么地方擺放螺絲釘、如何快速布局和找到庫房資源，等等；三是在家庭領域，人口老齡化之后，如果沒有陪伴機器人進入家庭，社會幸福是沒法保障的。陪伴機器人進入家庭必須要充分了解家庭的各種設施，這需要通過多模態(tài)能力來實現(xiàn)和提升。我們本次升級的認知大模型極大地提升了多模態(tài)能力，對整個工業(yè)自動化生產(chǎn)及家庭陪伴機器人而言，將開辟全新時代。

　　如果大家用訊飛星火發(fā)朋友圈會感到很幸福，因為它可以給隨便一張照片配出有意思文案。如果企業(yè)想要寫一個海外文案，訊飛星火也可以用幾分鐘的時間做出來，并且還會生成一個虛擬形象進行播報。如果畫面不夠，機器還能自動補齊需要的畫面。這只是制作方面的例子，我認為多模態(tài)能力更重要是，在理解上對工業(yè)和家庭等場景進行賦能。比如我們的“星火語伴2.0”，能夠進行主題對話、虛擬人對話，重點升級虛擬人?？寄芰突诙嗄B(tài)技術的自定義情景對話能力，可用AI實現(xiàn)真人式陪練。

　　最后，我講一下認知大模型如何在行業(yè)內落地應用。第一要安全可控，確保內容安全、算力安全；第二要場景驅動，真正產(chǎn)生價值；第三，形成自己的專屬模型。

　　其中，大模型的“內容安全”涉及兩個問題。一是污語料問題。如果大模型學習的語料中有不良信息，那么如何防止它對外傳輸，如何濾掉不良信息？這是一個很大的挑戰(zhàn)，如果只學中國知識，那么這個大模型就無法代表國家參與全球競爭，要想把它變聰明，必須要學習全世界的知識，而國外的價值觀和我們有差異，一旦觸碰到，就會面臨服務器被關掉的風險。所以，一定要有很強的“清洗”能力。我認為，科大訊飛的語音及語言國家工程技術中心就能很好解決這個問題。

　　二是幻覺。大模型最大的特點在于它什么都懂，但有些時候也會一本正經(jīng)地胡說八道。怎么解決大模型的幻覺？就是要用通用知識庫結合行業(yè)知識庫，以及人民日報等語料，針對各類型任務構建專業(yè)知識庫，以類搜索插件技術實現(xiàn)知識獲取，基于大模型的理解和概括摘要能力給出答案。

　　除了內容安全，還有算力問題。很多人疑問，中國的人工智能是不是被“卡脖子”了？我特別自豪地告訴大家，現(xiàn)在華為的GPU能力已經(jīng)對標英偉達A100了。要知道，2022年10月7日，美國對中國極限施壓，當時中國無法購買A100，只能買英格或者A800。過去一段時間，就是因為算子庫不全，所以綜合效率還有一定提升空間和差距，但我們現(xiàn)在基本解決了這個問題。

　　8月15日，科大訊飛和華為聯(lián)合發(fā)布了星火一體機。這意味著，任何企業(yè)都可以在我們的平臺上做訓練、做推理，這非常了不起。以前的“百模大戰(zhàn)”基本只能在內部做微小的調優(yōu)和訓練，現(xiàn)在，我們基本解決了這個壁壘。今年，科大訊飛定了一個目標，即10月24日實現(xiàn)對標ChatGPT，中文全面超越，英文與它相當。坦白講，現(xiàn)在距離這個目標還有差距，但我們相信10月份就能趕上。明年上半年科大訊飛將對標GPT4，在算法上我們有信心，在算力上，有華為這樣的公司去突破和努力。我們正在跟華為聯(lián)合打造面向超大模型訓練的集群優(yōu)勢，我們有信心在算力領域不被“卡脖子”，通用人工智能的應用成效上也可以跟OpenAI直接對標。

　　在這個過程中，我們還做了場景驅動。為了讓大家立足于自己的內部應用場景，我們提供了豐富的開發(fā)平臺和各種典型場景包，從客服、辦公、運營到研發(fā)，等等。

　　那么，行業(yè)龍頭企業(yè)應該如何運用大模型？底層大模型其實是由我們來完成，我認為到明年，中國的大模型最多剩下幾家，但一定要有人能對標OpenAI。龍頭企業(yè)一定保證每一行代碼和算法都是自己構建出來的，因為你根本不清楚開源模型原來的語料是從哪里訓練出來的，而且它不利于企業(yè)進步。

　　在數(shù)字經(jīng)濟時代，數(shù)字化轉型是每個企業(yè)必須做的事。以前，企業(yè)通過人工智能中臺、數(shù)據(jù)中臺和企業(yè)級知識庫構建企業(yè)大腦，下一步，如果不用通用人工智能構建企業(yè)大腦，絕對會落后一個檔次。所以，我認為大家應提前布局，在安全可控的前提下構建企業(yè)自主可進化的企業(yè)大腦。

　　這種布局還需要動用好生態(tài)的力量。5月6日以來，科大訊飛人工智能開放平臺新增了96萬名實名認證的開發(fā)者，6月9日以來，星火小助手用戶創(chuàng)建數(shù)超1萬。我們還跟行業(yè)龍頭進行合作，給行業(yè)龍頭賦能后按照合作共贏的模式產(chǎn)生新增加值。

　　我特別希望借助亞布力論壇這個平臺，讓中國企業(yè)在各個領域，將數(shù)據(jù)、算力、算法聯(lián)通起來，形成我們自己的生態(tài)優(yōu)勢，共同打贏這場通用人工智能時代的產(chǎn)業(yè)升級之戰(zhàn)，共同解放生產(chǎn)力、釋放想象力。