訊飛星火V4.0發(fā)布會(huì)劉慶峰演講實(shí)錄
訊飛星火V4.0發(fā)布會(huì)劉慶峰演講實(shí)錄
6月27日,北京,科大訊飛舉行訊飛星火升級(jí)發(fā)布會(huì),星火大模型V4.0亮相。
科大訊飛董事長劉慶峰全程演講,科大訊飛研究院院長劉聰真機(jī)實(shí)測(cè),他們?cè)诨卮饍蓚€(gè)關(guān)鍵問題:
今天,中國的大模型底座能力到底怎么樣?
今天,風(fēng)起云涌的大模型究竟如何應(yīng)用落地?
升級(jí)發(fā)布的訊飛星火不僅在底座能力上全面對(duì)標(biāo)GPT-4 Turbo,還落地各種應(yīng)用場(chǎng)景服務(wù)每個(gè)人和每個(gè)企業(yè)。
懂你學(xué)習(xí)的AI助手,讓每個(gè)孩子在一對(duì)一個(gè)性化教學(xué)中培養(yǎng)出主動(dòng)思考的終身學(xué)習(xí)能力;
懂你健康的AI助手,讓一家老小都能24小時(shí)被專業(yè)醫(yī)療守護(hù);
懂你汽車的AI助手,讓汽車“能說會(huì)聊”,把旅行枯燥的路途變成一路的歡樂;
懂你工作的AI助手,讓每一位員工快速提煉會(huì)議共識(shí)和決議,高效輸出盡早把工作完成;
懂你企業(yè)的AI助手,讓小團(tuán)隊(duì)也有大能力,深入企業(yè)經(jīng)營與服務(wù)場(chǎng)景,結(jié)合企業(yè)管理的真實(shí)情況,尋找業(yè)務(wù)痛點(diǎn),幫助每個(gè)企業(yè)健康發(fā)展,保持競(jìng)爭(zhēng)力。
這樣的訊飛星火是每個(gè)人身邊“懂你的AI助手”,是通用人工智能時(shí)代AI對(duì)每個(gè)人的表白。
“每一次人類文明進(jìn)步的背后都有一個(gè)了不起的助手,每一代助手都有它的使命。”劉慶峰說,訊飛星火的使命是解放生產(chǎn)力、釋放想象力,“希望通過我們的能力,成就每一個(gè)了不起的企業(yè),幫助每一個(gè)人都成為了不起的自己。”
以下為劉慶峰演講實(shí)錄:
尊敬的各位領(lǐng)導(dǎo)、各位合作伙伴、各位院士專家、各位媒體朋友、線上的朋友們,大家好!熱烈歡迎大家蒞臨訊飛星火V4.0的發(fā)布會(huì)現(xiàn)場(chǎng)。
這一年多來,以大模型為主要帶動(dòng)的通用人工智能浪潮在全球風(fēng)起云涌、高潮迭起。隨著大模型技術(shù)研發(fā)和產(chǎn)業(yè)應(yīng)用的不斷深入,大家越來越關(guān)注兩個(gè)非常關(guān)鍵的核心問題。
第一,今天中國大模型的底座能力到底怎么樣?在中美科技日益激烈的人工智能領(lǐng)域博弈下,去年10月17日,英偉達(dá)因?yàn)槊绹虅?wù)部的要求,對(duì)中國所有能訓(xùn)練大模型的智能算力全面斷供。就在6月25日,OpenAI也正式通知將從7月9日開始終止所有來自中國的API申請(qǐng)。在這個(gè)背景下,熱熱鬧鬧、風(fēng)起云涌的通用人工智能浪潮,到底有沒有自主可控的國產(chǎn)底座能力做支撐,這決定了我們?cè)谶@條路上到底能走多遠(yuǎn),決定了通用人工智能這一波浪潮;相當(dāng)于PC和互聯(lián)網(wǎng)的誕生,在人類歷史上有深刻的意義,而我們能不能享受這波紅利,能不能成為美國之后全球智慧涌現(xiàn)的第二極?
第二,大模型將會(huì)改變信息分發(fā)獲取的方式,改變?nèi)藱C(jī)交互方式,改變內(nèi)容生產(chǎn)方式,也會(huì)改變我們的整個(gè)產(chǎn)業(yè)形態(tài)和競(jìng)爭(zhēng)格局,改變科研范式,這是大家都能看到的大趨勢(shì)和未來。Gartner預(yù)測(cè),到2026年現(xiàn)在80%的企業(yè)都要用到通用人工智能,而今天這個(gè)數(shù)字是5%左右。
大模型在今天風(fēng)起云涌、如此大的投入下,究竟怎么落地?美好的未來擺在這里,當(dāng)前第一步該怎么以科學(xué)合理投入,才能讓大模型真正的剛需價(jià)值能夠落地,能夠看得見、摸得著,能夠用統(tǒng)計(jì)數(shù)據(jù)來證明應(yīng)用成效。我想關(guān)于底座技術(shù)、關(guān)于應(yīng)用落地,是今天所有的關(guān)心大模型、關(guān)心通用人工智能的研究機(jī)構(gòu)、企業(yè)、高校、科研院所以及政府部門共同關(guān)心的話題。今天訊飛星火V4.0的發(fā)布,我特別想跟大家分享我們這兩方面的看法,給出科大訊飛對(duì)這兩個(gè)問題的答案。
實(shí)際上,從去年5月6日訊飛星火V1.0發(fā)布之后,大模型的各項(xiàng)能力都在快速提升,我們幾乎每個(gè)月都會(huì)有一次非常重要的升級(jí)。以大家特別關(guān)注的文本寫作為例,今天星火大模型寫出來的東西已經(jīng)不僅僅能讓我們覺得不錯(cuò),很多時(shí)候還會(huì)給我們很大的觸動(dòng),給我們帶來驚喜,甚至是感動(dòng)。
今年6月7日上午,高考語文作文題新鮮出爐,當(dāng)天中午就有很多人,包括機(jī)構(gòu)、老師、投資人等,從各個(gè)角度來測(cè)星火在高考作文中的寫作能力如何。非常自豪的是,大家都給了訊飛星火很高的評(píng)價(jià)。在“重慶日?qǐng)?bào)新重慶客戶端”上發(fā)布這篇文章,是6月7日12:10讓大模型寫的,在人工智能圈一個(gè)大佬云集的微信群里,被大家專門拿出來作為一個(gè)經(jīng)典案例點(diǎn)贊。
大家可以看到,星火寫的內(nèi)容非常專業(yè),很好地運(yùn)用了排比、引用、論證等寫作手法。當(dāng)時(shí)有很多人給了評(píng)分,在滿分是60分的情況下,最低的給了52分。大家讀一下就會(huì)看到,在這中間有思辨的想法,引經(jīng)據(jù)典也都寫得非常好。這是沒有任何人工干預(yù)生成的結(jié)果,是大模型自己寫出來的,它的能力確實(shí)越來越強(qiáng)了。
當(dāng)然,大家還會(huì)關(guān)心說今天大模型寫作、寫詩、作畫能力在不斷提升,而要真正地解決人類剛需的一個(gè)非常重要的標(biāo)志就是科研,究竟大模型在賦能科研方面到底有沒有成效?
以我們和中國科學(xué)技術(shù)大學(xué)生命學(xué)院劉海燕教授團(tuán)隊(duì)的合作為例,我們用大模型中基于條件擴(kuò)散模型的蛋白質(zhì)主鏈設(shè)計(jì)算法SCUBA-D,能夠從頭生成自然界不存在的蛋白質(zhì)。實(shí)踐證明這種生成的蛋白質(zhì)在我們醫(yī)學(xué)特別需要的領(lǐng)域中,它的結(jié)合親和力與天然的蛋白質(zhì)相當(dāng),甚至更強(qiáng)。最重要的是,我們把設(shè)計(jì)成功率從原來的0.1%提升到64%,提升了640倍,原來需要6個(gè)月做的設(shè)計(jì),現(xiàn)在1天就做完了。這個(gè)已經(jīng)不是在簡單的科研驗(yàn)證階段了,目前已經(jīng)成功地設(shè)計(jì)了48個(gè)蛋白質(zhì),還在批量生產(chǎn)。這篇文章也在今年5月正式被《Nature》子刊接收,證明了我們?cè)跇I(yè)界的領(lǐng)先地位。
我想說的是,大模型不僅可以寫詩、作畫,在改變工業(yè)、改變科研范式等方面已經(jīng)實(shí)實(shí)在在發(fā)揮作用,包括我們和中國科學(xué)技術(shù)大學(xué)做的合成類的科學(xué)創(chuàng)新,比如說化學(xué);還有與合肥綜合性國家科學(xué)中心能源研究院合作,在推進(jìn)大模型賦能核聚變整個(gè)過程中更快地預(yù)測(cè)、更好地應(yīng)對(duì)各種各樣的異常情況,這些都在快速推進(jìn)之中,這是我們?cè)诳蒲猩厦娴母鞣N進(jìn)展。
每個(gè)人都能夠下載的訊飛星火APP,也正在給每個(gè)人帶來福利。
安徽日?qǐng)?bào)記者董一帆,她在使用訊飛智能辦公本和訊飛智能錄音筆之后,再結(jié)合星火大模型能力,就能夠自動(dòng)錄音、自動(dòng)轉(zhuǎn)成文字、自動(dòng)生成待辦事項(xiàng)、自動(dòng)生成新聞通稿。最后,她再給稿件注入一些“靈魂”和相應(yīng)必要的修改,原來需要4個(gè)小時(shí)完成的工作,現(xiàn)在1個(gè)小時(shí)就可以完成。董一帆說,有了星火后,她終于有時(shí)間帶家人一起去旅游了。
來自湖北的郭亮先生,他原來是個(gè)很活潑的人,但是因?yàn)樵诠ぷ鲘徫簧下犃κ軗p后,變得沉默寡言。自從孩子給他用了訊飛的智能助聽器,這個(gè)助聽器是由星火大模型在后臺(tái)賦能的,可以精準(zhǔn)地把背景噪音過濾掉,把聲音中的有效信息的音量提升,而且根本不用到線下的專業(yè)機(jī)構(gòu)檢測(cè)(聽損情況),坐在家里就能非常方便地檢測(cè)。同時(shí),助聽器的成本是國外相關(guān)助聽設(shè)備的十分之一,效果更好。郭亮先生和我們分享說,現(xiàn)在有了星火,他開始第一次出門和老朋友們談天說地,重新恢復(fù)到年輕時(shí)候的詼諧幽默、善于交際的狀態(tài)。
一位在重慶的70歲老人楊勇,他被朋友借走的養(yǎng)老錢遲遲得不到歸還,有了星火,從法律援助上星火大模型教他應(yīng)該怎么做,哪些應(yīng)該留痕、應(yīng)該如何獲得幫助、如何去起訴,最后在不懂法的情況下,訊飛星火幫他要回了欠款。這些事情真實(shí)發(fā)生在我們每個(gè)人身邊,可能將來就會(huì)關(guān)乎我們每個(gè)人或每個(gè)家庭中的某個(gè)親屬。
訊飛星火APP自去年9月正式全民開放后,目前在安卓端統(tǒng)計(jì)到已經(jīng)累計(jì)下載了1.31億次(安卓能夠統(tǒng)計(jì)到下載量,蘋果不公布下載量)。在安卓端,所有下載的大模型相關(guān)的APP中,訊飛星火APP的下載量在工具類排第一。工具類是指有通用大模型能力的APP,而不是娛樂相關(guān)的。訊飛星火APP中有寫作、編程、工作、學(xué)習(xí)、生活、親子、翻譯等各種各樣的助手,很多助手都是用戶用了幾百萬甚至幾千萬次的。
訊飛星火APP的使用高峰期不是周末,而是工作日;不是晚上,而是工作日的上午9:30和下午3:30。這說明大家真正用星火來解決工作中的剛需問題。我們一直說大模型應(yīng)該是解放生產(chǎn)力、釋放每個(gè)人想象力的,從這些數(shù)據(jù)就可以看到。
另外,科大訊飛開始不斷地把軟件和硬件結(jié)合。訊飛錄音筆、訊飛翻譯機(jī)、訊飛智能鼠標(biāo)、訊飛會(huì)議耳機(jī)等在今年的電商“618”上,銷量又同比增長了70%。這是為什么?就是因?yàn)榇竽P退鶐淼闹悄苡布谡嬲鉀Q剛需上又大大前進(jìn)了一步,所以現(xiàn)在已經(jīng)有很多用戶在享受通用人工智能時(shí)代的紅利。我們?cè)趺锤线@個(gè)時(shí)代,怎么最先享受這個(gè)時(shí)代的紅利?就得從這些看得見、摸得著的APP,看得見、摸得著的軟硬件產(chǎn)品入手。
訊飛星火V4.0七大核心能力全面提升
全面對(duì)標(biāo)GPT-4 Turbo
從去年5月6日的訊飛星火V1.0一路走到今天的訊飛星火V4.0的發(fā)布,有一點(diǎn)非常令我們自豪——訊飛星火大模型是基于全國產(chǎn)算力平臺(tái)訓(xùn)練出來的。
去年10月24日,我們與華為聯(lián)合軟硬件一體化,科大訊飛提供了大量的算子庫和算法資源,聯(lián)合在安徽發(fā)布了中國首個(gè)國產(chǎn)萬卡算力集群,這是中國第一個(gè)能訓(xùn)千億以上浮點(diǎn)參數(shù)大模型的硬件平臺(tái)。在這個(gè)硬件平臺(tái)上,訊飛星火是中國第一個(gè)基于國產(chǎn)算力訓(xùn)練出來的全民開放的大模型。
什么叫全民開放大模型?就是國家網(wǎng)信辦等八個(gè)部委聯(lián)合認(rèn)證,老百姓可以隨即下載使用的大模型。當(dāng)時(shí)是唯一的,今天訊飛星火V4.0發(fā)布還是唯一的,在全國產(chǎn)算力平臺(tái)上訓(xùn)練的大模型,所有算法都是我們自主可控的,每一行碼、每一個(gè)數(shù)據(jù)都是我們自己編寫、自己清洗出來的大模型。一定程度上,今天星火大模型V4.0的發(fā)布對(duì)完全自主可控的大模型究竟走到了什么樣的發(fā)展階段,具有非常重要的標(biāo)志意義。
那么在這個(gè)基礎(chǔ)上,訊飛星火V4.0到底到了什么水平?
這是基于認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室和中國科學(xué)院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟、長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟,在去年6月份聯(lián)合發(fā)布的國產(chǎn)通用認(rèn)知智能大模型測(cè)評(píng)體系。這個(gè)體系一共有7個(gè)主要方面,涵蓋了481個(gè)測(cè)試項(xiàng),所有數(shù)據(jù)都是“背靠背”測(cè)試,數(shù)據(jù)都是隨機(jī)動(dòng)態(tài)產(chǎn)生的。非常高興的是,訊飛星火V4.0已經(jīng)實(shí)現(xiàn)了(大家公認(rèn)最好的通用認(rèn)知大模型)GPT-4 Turbo的對(duì)標(biāo),我們?cè)谖谋旧?、語言理解、知識(shí)問答、邏輯推理、數(shù)學(xué)這些能力上都已經(jīng)實(shí)現(xiàn)超越,在代碼和多模態(tài)能力上還有差距。
代碼能力是我們非常關(guān)注的能力之一,因?yàn)樗婕拔磥淼漠a(chǎn)業(yè)信息化和信息產(chǎn)業(yè)化的核心,而ChatGPT去年2月份通過谷歌二級(jí)程序員測(cè)試,當(dāng)時(shí)的GPT-3.5用這個(gè)測(cè)試集只獲得了60多分,GPT-4 Turbo今年1月份測(cè)試大概在80分,現(xiàn)在到86分,也在快速迭代和進(jìn)步。我們預(yù)計(jì)在今年8月份,訊飛星火會(huì)達(dá)到現(xiàn)在86分以上的水平。
多模態(tài)能力還有所差距,是因?yàn)槲覀儺?dāng)前在文生視頻上還沒有算力,也不是下一步的核心重點(diǎn),但是有生態(tài)伙伴一起做。
但在多模態(tài)方面,有一個(gè)非常重要的應(yīng)用,就是圖文識(shí)別。無論是醫(yī)療領(lǐng)域,能不能看懂電子病歷、看懂體檢報(bào)告;還是教育領(lǐng)域,能不能看懂筆記、看懂考卷;以及在司法、金融、科研、辦公等各個(gè)領(lǐng)域的應(yīng)用,圖文識(shí)別能力都是至關(guān)重要的。
科大訊飛的圖文大模型以及星火大模型中的圖文能力,在國際上現(xiàn)在是先進(jìn)的。我們與GPT-4o做了對(duì)比,因?yàn)镚PT-4o在多模態(tài)方面,特別是圖文上面比GPT-4 Turbo要強(qiáng)。所以,我們與5月14日OpenAI發(fā)布的GPT-4o最新版本相比,各個(gè)專門領(lǐng)域訊飛星火V4.0的效果都比它好,不僅僅在OCR直接識(shí)別上,關(guān)于版面的自動(dòng)理解、更合理的版式認(rèn)知結(jié)構(gòu)等方面,我們都做得更強(qiáng),從而使得今天要給大家看到的很多應(yīng)用,它的落地更能夠解決剛需。
在中文領(lǐng)域,訊飛星火V4.0實(shí)現(xiàn)了對(duì)標(biāo)GPT-4 Turbo,那么在英文領(lǐng)域怎么樣?這是國際各種主流機(jī)構(gòu)給出來的,最主流的中英文測(cè)試集,絕大部分是英文,中間有理解推理、綜合考試、數(shù)學(xué)科學(xué)和代碼等維度的測(cè)試。大家可以看到,一共12項(xiàng)主流測(cè)試集,絕大部分是英文的,訊飛星火V4.0有8項(xiàng)實(shí)現(xiàn)了超越。這個(gè)數(shù)據(jù)大家可以直接調(diào)用我們的API自己去測(cè),這是很令我們自豪的進(jìn)展。
除了這些測(cè)試集,現(xiàn)在評(píng)判大模型技術(shù)的聰明程度,高考和中考也是最重要的例子。在剛結(jié)束的中高考,《中國科學(xué)報(bào)》做了一個(gè)各家大模型在高考語文、數(shù)學(xué)、英語中得分的綜合報(bào)道,訊飛星火是最好的。各大高校、媒體也對(duì)高考語文、英語、數(shù)學(xué)和物理做了測(cè)試,訊飛星火都是排在最前面的;各家大模型在2024北京中考的表現(xiàn),中國教育技術(shù)協(xié)會(huì)也做了評(píng)測(cè),在中考數(shù)學(xué)的答題完成率和準(zhǔn)確率上星火都是第一,語文、英語作業(yè)評(píng)價(jià)也非常高,均優(yōu)于GPT-4o 的表現(xiàn),這是最新鮮的實(shí)際對(duì)比的榜單。當(dāng)然,在這中間也看到,星火大模型在數(shù)學(xué)、物理上面還有很大的空間要提升。
隨著高考的題目越來越強(qiáng)調(diào)知識(shí)運(yùn)用能力和綜合素質(zhì),我們?cè)絹碓娇吹酱竽P桶l(fā)展和前進(jìn)的方向。今天其實(shí)除了給大家看這些結(jié)果,我們會(huì)通過一系列的演示讓大家從實(shí)際場(chǎng)景中看到我們大模型應(yīng)用的腳步。
我先舉幾個(gè)例子,比如說“復(fù)雜指令”,現(xiàn)在得到了很好的提升。我們要求它寫一篇文章,可以提非常多的要求。例如對(duì)標(biāo)題使用修飾手法、需要引經(jīng)據(jù)典的情況以及要用成語等,它全部都能理解,這就是“復(fù)雜指令”的跟隨能力。這項(xiàng)能力對(duì)大模型來說是很難的,大家如果去測(cè)就會(huì)發(fā)現(xiàn)星火的能力現(xiàn)在比GPT-4o和GPT-4 Turbo或其他大模型都要明顯領(lǐng)先,這也是星火大模型將來解決各種復(fù)雜場(chǎng)景工作的基本能力。
在“復(fù)雜推理”方面,數(shù)學(xué)競(jìng)賽愛好者喜歡做的這道推理題,大部分人看了會(huì)頭暈,機(jī)器也都可以做出來。
在“空間推理”方面,像這樣一個(gè)問題:你在客廳里面這個(gè)人走來走去,但是球放在杯子里,把杯子倒過來,然后再問大模型“球在什么地方?”它一定要理解如果倒過來球就掉下來了這一前提,同時(shí)還需要知道是在什么地方倒的,要能夠自己推測(cè)出來球在哪兒,這就是“空間推理”能力,也要進(jìn)一步提升,我們說的具身智能要依靠大模型底層能力的提升是非常重要的方面。
另外,還要有“多模理解”能力,比如說剛才說的OCR識(shí)別,不光識(shí)別具體的體檢報(bào)告、具體的筆記、具體的文書等,星火大模型還能夠把多張整合在一起去理解,關(guān)于邏輯關(guān)系的“多模理解”,我覺得這是非常重要的。這一次,訊飛星火V4.0也有了非常大的提升,已經(jīng)不僅僅是識(shí)別單張照片了。所以邏輯關(guān)系支撐下的多模理解,是下一步多場(chǎng)景切換的非常重要的底層能力。
還有一個(gè)非常重要的是大模型在學(xué)習(xí)和獲取知識(shí)方面以及長文本能力方面,這段時(shí)間在業(yè)界引發(fā)熱議。
什么叫長文本能力?給大模型一個(gè)非常多字的、很長的書籍或者一堆文章和資料內(nèi)容,就可以去讓它做要素抽取、做總結(jié)摘要,可以對(duì)它提問,還可以讓它生成。但現(xiàn)在無論是國內(nèi)各家還是GPT-4 Turbo、GPT-4o都面臨一個(gè)困難:把這么多文本給大模型后,對(duì)它提問,它會(huì)回答,但是回答中間總有那么一部分比例是不靠譜的,是一本正經(jīng)地胡說八道,但又沒辦法去核實(shí),除非把這本書從頭到尾看一遍,這樣我們的效率就降低了。
隨著星火長文本通用能力的提升,這一次我們?cè)跇I(yè)界首發(fā)內(nèi)容溯源功能。當(dāng)你向星火提問,它回答完,會(huì)告訴你為什么這么回答,是參考了哪一段內(nèi)容,這樣當(dāng)我們沒有時(shí)間看全文的時(shí)候,只要去核實(shí)它的溯源就行了,這使得大模型的“幻覺”得到極大的降低。當(dāng)然,不僅僅是長文本,也可以是長圖文、長語音、一大段錄音,拍的很多照片和文本放在一起,你可以隨便問,大模型可以組合在一起,進(jìn)行要素抽取、文檔總結(jié)、問答等。
特別想說一下關(guān)于“英文溯源”,星火大模型不是把英文翻譯成中文,然后去找對(duì)應(yīng)的關(guān)系,而是真正基于英文自動(dòng)訓(xùn)練出來的英文溯源能力。只有這樣,你才能未來真正在各種英文的歷史典籍、英文的科研資料中,真正地達(dá)到跟ChatGPT、OpenAI一樣地對(duì)我們的科研人員提供相關(guān)的長文本溯源的幫助,所以這是非常關(guān)鍵的一項(xiàng)。
很多人使用大模型是從一年前的陌生,到現(xiàn)在慢慢開始靠近、嘗試使用它。但在很多時(shí)候,我們發(fā)現(xiàn)無論是寫文章、問答,或者給我們進(jìn)行專業(yè)指導(dǎo)的時(shí)候,大多數(shù)只具備很強(qiáng)的通用性,它很正確但不具備針對(duì)性,可以說放之四海而皆準(zhǔn),但缺乏了個(gè)性化。當(dāng)要寫一封感謝信,回復(fù)一個(gè)郵件,或者要根據(jù)具體的工作資料寫一個(gè)相關(guān)的調(diào)研報(bào)告或分析報(bào)告,就需要有個(gè)性化。
從“通用AI助手”到“懂你的AI助手”
這一次星火大模型非常重要的底層能力是什么?要讓我們的通用人工智能從通用助手變成更懂你的AI助手,這中間的底層技術(shù)是什么?是需要能夠有基于用戶畫像的個(gè)性化表達(dá),要能夠使用你的歷史記憶學(xué)習(xí),知道你的特點(diǎn)、關(guān)注什么、最想表達(dá)什么。其中,基于個(gè)人資料的增強(qiáng)學(xué)習(xí)可以是個(gè)人的工作資料,也可以是隨時(shí)在網(wǎng)上找到的參考資料等。
這一次我們?cè)谛腔餉PP和DESK上全新升級(jí)的核心,一是星火APP變得更加方便快捷,更有針對(duì)性地理解每個(gè)人需求,剛才說的AI人設(shè),大家現(xiàn)在可以下載來體驗(yàn),在DESK上也一樣的。我們把大模型變得更加專業(yè)高效,其中一個(gè)非常重要的內(nèi)容就是增加了“個(gè)人空間”,讓你的文章寫得更有個(gè)人特點(diǎn),有人設(shè),我們可以自己存放自己的學(xué)習(xí)、工作、生活與健康等相關(guān)內(nèi)容,從而使得它更加個(gè)性化,更加具備自己的專業(yè)知識(shí)。
在訊飛星火APP上,還有一個(gè)叫智能體的功能,把我們每個(gè)人都關(guān)心的醫(yī)療助手、學(xué)習(xí)口語的英語聽說助手,數(shù)學(xué)解題、代碼等這些相關(guān)的、大家最喜歡用的功能全部都放在這里,做了非常方便快捷、可以調(diào)用的智能體。
另外,跟我們的智能硬件相結(jié)合,訊飛智能錄音筆、訊飛翻譯機(jī)等智能硬件和訊飛星火APP從數(shù)據(jù)貫穿、賬號(hào)互聯(lián)到操作聯(lián)動(dòng)都真正打通了。舉例來說,用訊飛智能辦公本錄下一段政府開會(huì)的會(huì)議錄音,馬上同步到訊飛星火上,它就能寫政府公文、寫工作PPT、可以生成待辦事項(xiàng),并且發(fā)送郵件給相關(guān)人員。
打造每個(gè)人更便捷的助手,今天我們會(huì)給大家展示一些典型行業(yè)的應(yīng)用,這些行業(yè)應(yīng)用既是大家在大模型時(shí)代特別關(guān)注的一些應(yīng)用,同時(shí)也給我們的合作伙伴、開發(fā)者更多的參考和借鑒。
星火醫(yī)療大模型再次升級(jí)
每個(gè)醫(yī)生的AI診療助理 每個(gè)人的AI健康助手
首先是醫(yī)療,訊飛星火醫(yī)療大模型再次升級(jí)了。產(chǎn)業(yè)發(fā)展都要有核心的夢(mèng)想來支撐。醫(yī)療領(lǐng)域的使命和愿景就是用人工智能打造每個(gè)醫(yī)生的AI診療助理,打造每個(gè)人的AI健康助手。這件事情在過去幾年之中,科大訊飛通過智醫(yī)助理幫助基層醫(yī)生進(jìn)行診療,累計(jì)已經(jīng)給出8.2億次的輔助診斷,涉及的電子病歷超過3億個(gè),一共修正了147萬次的錯(cuò)誤診斷,識(shí)別出來了7267萬的用藥錯(cuò)誤和不合理處方。在這些能力持續(xù)積累的基礎(chǔ)上以及訊飛星火V4.0不斷升級(jí)進(jìn)化,現(xiàn)在的醫(yī)療大模型始終走在業(yè)界前列。去年3月,GPT-4推出來的時(shí)候已經(jīng)達(dá)到了美國執(zhí)業(yè)醫(yī)師資格考試的條件,而我們現(xiàn)在與最新的GPT-4 Turbo相比,無論在醫(yī)學(xué)相關(guān)的知識(shí)問答、復(fù)雜的語義理解、專業(yè)文書生成,還是診斷治療以及多輪對(duì)話的各項(xiàng)指標(biāo)上,我們都已經(jīng)實(shí)現(xiàn)了超越。
去年10月24日,我們推出的每個(gè)人的健康助手訊飛曉醫(yī)APP,每個(gè)人都可以下載到自己手機(jī)上來使用,現(xiàn)在已經(jīng)累計(jì)有1200萬的下載量,用戶好評(píng)率有98.8%,用戶推薦率有42%,很多人表示訊飛曉醫(yī)APP已經(jīng)超出了預(yù)期。
舉個(gè)例子,看病前你可以問曉醫(yī),它會(huì)告訴你這個(gè)情況到底嚴(yán)不嚴(yán)重,如果要看病建議到哪些科室、找誰,還可以生成就醫(yī)小貼士。目前,訊飛曉醫(yī)APP已經(jīng)可以看1600種常見疾病。大家或許不知道,目前基層醫(yī)生能夠診斷的常見疾病是300種,有2000多種的常見癥狀,我們都可以自動(dòng)判斷;吃藥的時(shí)候問曉醫(yī),有的藥不能在一起吃,否則會(huì)有不良反應(yīng);一些有基礎(chǔ)疾病或者孕婦、孩子不能吃的藥,訊飛曉醫(yī)APP都能夠?qū)iT提醒。訊飛曉醫(yī)APP可以識(shí)別有2800多種常見藥品,理解26萬個(gè)藥品相互作用;體檢之后很復(fù)雜的體檢報(bào)告,我們看不懂的時(shí)候,可以直接問曉醫(yī),現(xiàn)在6000多種常見的檢查檢驗(yàn),訊飛曉醫(yī)APP都支持文字拍照的錄入。在這個(gè)基礎(chǔ)上,訊飛曉醫(yī)APP這次進(jìn)一步升級(jí)了,能夠把個(gè)性化的電子病歷檢查報(bào)告以及過去問診情況,在個(gè)人健康空間存下來,在看病、用藥、檢查時(shí),給我們更深入更具體的幫助。
訊飛曉醫(yī)已經(jīng)通過了國家信息系統(tǒng)安全等級(jí)保護(hù)三級(jí)認(rèn)證,也通過了中國泰爾實(shí)驗(yàn)室,國家信息通信研究院的數(shù)據(jù)安全檢驗(yàn)報(bào)告等,所以大家可以放心,我們會(huì)保護(hù)大家在曉醫(yī)后臺(tái)的個(gè)人體檢報(bào)告和其他信息的安全。
剛才看到的雖然是一個(gè)醫(yī)療的案例,但如果沒有我們OCR識(shí)別技術(shù)的進(jìn)步,沒有文本溯源能力,沒有針對(duì)指定內(nèi)容的文本生成能力,剛才那些工作是沒有辦法做成的,我們可以在醫(yī)療領(lǐng)域把這件事情變成現(xiàn)實(shí),在非常多的專用領(lǐng)域,我們一樣可以照著這個(gè)邏輯把它實(shí)現(xiàn)。
今天不想給大家展示我們通用的各項(xiàng)能力的單個(gè)案例,而是想把它整合在解決社會(huì)剛需中。訊飛曉醫(yī)每個(gè)人都可以下載免費(fèi)版,現(xiàn)在就可以試用,在星火APP中,我們專門的智能體中第一個(gè)就放了曉醫(yī),它是可以解決社會(huì)剛需的。
星火教育大模型再次升級(jí)
每個(gè)老師的AI教學(xué)助理 每個(gè)孩子的AI學(xué)習(xí)助手
訊飛星火這些能力的進(jìn)步,使星火教育大模型得到了提升。在教育中,讓AI成為老師的助理,成為孩子的助手。實(shí)際上,我們?cè)谥耙呀?jīng)推出了很多因材施教的教育解決方案,無論是語文、數(shù)學(xué)、英語課程的學(xué)習(xí),還是科學(xué)課、編程課以及心理健康等,科大訊飛有了一系列的解決方案。這一次,我們一方面提升大模型底座能力,一方面進(jìn)一步提升多模態(tài)能力,尤其是面向教育復(fù)雜場(chǎng)景的圖文識(shí)別效果,使我們能夠給學(xué)校的老師和孩子們做得更多。
大家可以看到無論是語文、數(shù)學(xué)、英語能力等方面,還是OCR識(shí)別方面,訊飛星火最新版本都比GPT-4o明顯要好,尤其在復(fù)雜公式的手寫體上。當(dāng)我們能夠?qū)?shù)學(xué)、物理進(jìn)行分析的時(shí)候,手寫如果不能識(shí)別是很難解決問題的。大家可以看到如此復(fù)雜的手寫公式,我們都可以高精度地識(shí)別出來。
星火智能批閱機(jī)重磅發(fā)布
有了這些能力,就能夠?yàn)槔蠋熀秃⒆觽儙硪粋€(gè)全新的重磅產(chǎn)品,就是我們的星火智能批閱機(jī),這個(gè)批閱機(jī)可以自動(dòng)批改,把老師批改消耗的精力釋放出來,讓老師只看那些他應(yīng)該看的錯(cuò)誤點(diǎn),批閱機(jī)通過批改自動(dòng)地找出全班學(xué)習(xí)情況,給出分析,給出每個(gè)孩子學(xué)習(xí)路徑的規(guī)劃,而且能夠軟硬件一體化。
我們今天就是要把這些技術(shù),從OCR識(shí)別到邏輯推理、知識(shí)圖譜、到最近發(fā)展區(qū)的所有教育相關(guān)的技術(shù),要整合在老師和同學(xué)們觸手可及的軟硬件產(chǎn)品中,其實(shí)這個(gè)設(shè)備一搬到教室,老師們就離不開了。老師節(jié)省了批改過程中的無效、低效、重復(fù)時(shí)間,就可以有時(shí)間分析孩子的狀態(tài),當(dāng)我們更精準(zhǔn)地對(duì)每個(gè)孩子的教學(xué)進(jìn)行指導(dǎo)時(shí),老師就可以騰出時(shí)間來關(guān)注孩子的心理健康,關(guān)注人的全面成長。陶行知提出的孩子的“六個(gè)自由”,最重要的是在師生減負(fù)的時(shí)候要讓他有時(shí)間上的自由,而星火智能批閱機(jī)就會(huì)帶來這方面的幫助。
大家可以看到,在這個(gè)技術(shù)上我們有很多專業(yè)的技術(shù)指標(biāo),自由排版不限格式,試題解析的準(zhǔn)確率大于99%,孩子們可以隨便涂抹等。多學(xué)科題型的智能批改都是95%以上的準(zhǔn)確率,可以跟老師進(jìn)行相應(yīng)的校驗(yàn)。留痕打印,無論是涂改、褶皺,或者拿亂了次序,隨便怎么排,它都可以自動(dòng)準(zhǔn)確打印出每個(gè)孩子的情況,因?yàn)槲覀兪且徽鬃詣?dòng)化識(shí)別的。
所以在這我們可以看到,星火智能批閱機(jī)帶來的幫助是批改減負(fù),原來90分鐘的作業(yè)批改時(shí)間可以變成5分鐘,60分鐘的學(xué)情統(tǒng)計(jì)時(shí)間可以變成1分鐘。孩子們?cè)谶@個(gè)過程中同樣做相應(yīng)的作業(yè),他的錯(cuò)題解決率從50%提到73%。孩子進(jìn)行做題學(xué)習(xí),我們可以針對(duì)這個(gè)孩子告訴他,你要做5道題,只需要16分鐘,不需要像原來那樣的40-50分鐘,因?yàn)槔蠋熆梢跃珳?zhǔn)地知道學(xué)生應(yīng)該學(xué)什么。通過星火智能批閱機(jī)的自動(dòng)批閱,把批閱、教研和個(gè)性化指導(dǎo)都聯(lián)動(dòng)在一起了。
訊飛AI學(xué)習(xí)機(jī) 啟發(fā)互動(dòng)式
AI 1對(duì)1答疑輔導(dǎo)全新升級(jí)
此外,我們給每個(gè)家庭、給孩子們的學(xué)習(xí)機(jī)也做了升級(jí)。星火大模型搭載的訊飛AI學(xué)習(xí)機(jī)一直在業(yè)界廣受歡迎,我們當(dāng)時(shí)也提出了做AI學(xué)習(xí)機(jī)的標(biāo)準(zhǔn):能夠?qū)W(xué)情做分析,能夠?qū)W(xué)習(xí)內(nèi)容做指導(dǎo),能夠讓孩子在學(xué)的過程中得到正反饋,從而學(xué)習(xí)更有自信心。大家可以看到,訊飛AI學(xué)習(xí)機(jī)獲得了很多的榮譽(yù),也是用戶凈推薦率排名行業(yè)第一的產(chǎn)品。這一次,我們基于訊飛星火V4.0語言理解、多輪交互、圖文識(shí)別能力的提升,以及訊飛在語音領(lǐng)域最新進(jìn)展,我們?cè)趯W(xué)習(xí)機(jī)上進(jìn)一步實(shí)現(xiàn)超擬人的答疑輔導(dǎo),訊飛AI學(xué)習(xí)機(jī)可以像一位老師、一位家長一樣,循循善誘地給你進(jìn)行相應(yīng)的輔導(dǎo)。
很多的年輕家長媽媽看了這個(gè)以后非常興奮,說這將是一個(gè)“最省媽媽”的學(xué)習(xí)機(jī)。不輔導(dǎo)的時(shí)候,都是母慈子孝,一輔導(dǎo)就雞飛狗跳。將來學(xué)習(xí)機(jī)不再是簡單的掃描、搜索給你一個(gè)答案,也不是簡單推一個(gè)視頻,而是基于我們最新的大模型能力的提升,可以實(shí)現(xiàn)超擬人的答疑輔學(xué)。給大家看一些數(shù)據(jù),目前使用超擬人答疑輔學(xué),孩子們獨(dú)立學(xué)習(xí)的學(xué)習(xí)完成率從67%可以提到90%,錯(cuò)題解決率,解題的視頻學(xué)習(xí)原來只有72%,而現(xiàn)在處理解決可以到93%。
大家可以看到家長們和孩子們的評(píng)價(jià),因?yàn)橛羞@樣一個(gè)主動(dòng)啟發(fā)式的學(xué)習(xí)功能,孩子們更愿意主動(dòng)思考,學(xué)習(xí)效率更高,自信心增強(qiáng)了,關(guān)鍵是家長不僅更放心,親子關(guān)系更和諧了。我們剛才講的AI答疑輔學(xué)功能,以及在教育領(lǐng)域落地的這些應(yīng)用,它不僅在教育和醫(yī)療領(lǐng)域,相關(guān)的邏輯在各個(gè)行業(yè)場(chǎng)景都是可以參照落地的。核心能力就是多模態(tài)理解、多輪對(duì)話、指令跟隨、語言理解、文本生成等,還有配合的數(shù)學(xué)能力。
星火語音大模型再升級(jí)
推動(dòng)萬物互聯(lián)時(shí)代人機(jī)交互革命
我們觀察到GPT-4o的發(fā)布,全世界都在進(jìn)一步關(guān)注語音,其實(shí)在去年11月份的時(shí)候,Whisper已經(jīng)發(fā)了他們OpenAI的整體語音技術(shù),并把語音做成一個(gè)非常重要的方向。最近蘋果的手機(jī)大家也看到了語音技術(shù)的進(jìn)步,手機(jī)廠商對(duì)語音技術(shù)進(jìn)一步產(chǎn)生了更大的關(guān)注,而且要用它來改變所有人機(jī)交互的方式。
人類社會(huì)進(jìn)入到了萬物智能互聯(lián)的時(shí)代,越來越多的設(shè)備沒有屏幕,離我們幾米之外,不方便用鍵盤,不方便觸摸。在越來越多的時(shí)候,我們需要更自然的人機(jī)對(duì)話,用戶才能夠得到更好地體驗(yàn),更迅速地學(xué)習(xí),獲得相關(guān)生活中的幫助,我們更需要語音。
星火語音大模型再次升級(jí),會(huì)使得萬物互聯(lián)時(shí)代下人機(jī)交互的革命進(jìn)一步落得更透,這也是科大訊飛在1999年創(chuàng)業(yè)時(shí)就提出來了要實(shí)現(xiàn)人機(jī)信息溝通的無障礙。過去10年,從深度神經(jīng)網(wǎng)絡(luò)出臺(tái)之后,科大訊飛一直引領(lǐng)著語音技術(shù)的發(fā)展。我們是全世界第一個(gè)讓語音識(shí)別超過了專業(yè)速記員水平的公司,像這種會(huì)議轉(zhuǎn)寫的情況,機(jī)器翻譯超過了99%的大學(xué)六級(jí)考生,通過了國家翻譯師資格考試;個(gè)性化語音合成也給央視的節(jié)目進(jìn)行配音;我們的多語種技術(shù)在2020年代表中國,在美國把訊飛列入實(shí)體清單之后,對(duì)中國極限施壓的背景下,多語種技術(shù)依然保持了全球領(lǐng)先,解決了我們的汽車、手機(jī)、智能家居等出海“卡脖子”問題。
我們非常榮幸在幾天前獲得了國家科技進(jìn)步獎(jiǎng)一等獎(jiǎng),這也是中國人工智能領(lǐng)域在深度神經(jīng)網(wǎng)絡(luò)之后的第一個(gè)國家科技進(jìn)步獎(jiǎng)一等獎(jiǎng),當(dāng)然也有中國科學(xué)技術(shù)大學(xué)、清華大學(xué)、華為、中國移動(dòng)等合作伙伴共同努力的結(jié)果。
技術(shù)進(jìn)一步發(fā)展使得我們?cè)谌f物互聯(lián)時(shí)代的人機(jī)交互標(biāo)準(zhǔn)被重新定義,它應(yīng)該要實(shí)現(xiàn)多語言多方言的交互,在遠(yuǎn)距離、高噪音場(chǎng)合下也能夠識(shí)別,能夠全雙工隨時(shí)隨地可以打斷,可以支持多模態(tài),語音、手勢(shì)、嘴型等結(jié)合。大家關(guān)注的Open AI發(fā)布的GPT-4o中最重要的一個(gè)全雙工功能,實(shí)際上使用的是科大訊飛2020年就在國際會(huì)議上提出來,在去年5月正式發(fā)布的國際標(biāo)準(zhǔn)。
目前,我們的語音識(shí)別在最主流的語種上已經(jīng)繼續(xù)保持了全球領(lǐng)先,這是多語種多方言免切換的演示,在相對(duì)安靜的手機(jī)等各種場(chǎng)景下,還有更極限的場(chǎng)合,例如強(qiáng)干擾情況下“雞尾酒會(huì)”的語音識(shí)別場(chǎng)景都能進(jìn)行識(shí)別。
伴隨著技術(shù)的最新進(jìn)步,我們也有個(gè)專門的訊飛同傳軟硬一體的翻譯系統(tǒng),這個(gè)系統(tǒng)戴上去,我在上面講話,你聽到的就是英語,當(dāng)然我們還有更多語種。同時(shí),這個(gè)翻譯系統(tǒng)是軟硬一體化的,我在后臺(tái)講話,通過語音識(shí)別、翻譯、語音合成,每個(gè)人戴著耳機(jī)就可以聽到,從而實(shí)現(xiàn)大會(huì)同傳、展廳同傳以及各種旅游同傳。一個(gè)人講話所有人聽,我們還會(huì)推出軟硬一體化的設(shè)備,讓各種語言混雜在一起可以隨意開會(huì),要把整個(gè)軟件和硬件結(jié)合在一起,來解決現(xiàn)在社會(huì)的剛需。
將來,我們?nèi)粘5臋C(jī)器人進(jìn)入到各種高噪音環(huán)境下,在各種各樣的服務(wù)場(chǎng)景下,有這樣的能力,我們就不怕機(jī)器聽不懂了。語音識(shí)別進(jìn)入到規(guī)?;褂?,當(dāng)年我們?cè)谑謾C(jī)輸入法上,在全球率先提出手機(jī)語音聽寫時(shí)代開始到來,它的標(biāo)志是85%以上的準(zhǔn)確率,到89%就可以全面使用了,現(xiàn)在我們的識(shí)別中,兩個(gè)人混疊場(chǎng)景準(zhǔn)確率已經(jīng)到了91%,遠(yuǎn)超國際競(jìng)品,三混疊場(chǎng)景準(zhǔn)確率更是完全不一樣,我們準(zhǔn)確率已經(jīng)到了85%以上,但其他的只有20%多。在-5dB的高噪場(chǎng)景,噪音已經(jīng)比我們?nèi)酥v話還要高不少的情況下,我們依然能做到90%以上的準(zhǔn)確率。
因?yàn)檫@些技術(shù)進(jìn)步,我們從去年底到今年的國際連續(xù)最權(quán)威的語音識(shí)別比賽,一個(gè)是國際多通道語音分離和識(shí)別大賽CHiME-7,我們繼續(xù)拿了全球第一;另一個(gè)是今年的上半年國際聲學(xué)、語音和信號(hào)處理會(huì)議ICASSP 2024(International Conference on Acoustics, Speech, and Signal Processing)的旗艦賽事——國際車載多通道語音識(shí)別挑戰(zhàn)賽(In-Car Multi-Channel Automatic Speech Recognition Challenge,ICMC-ASR) ,科大訊飛是全球第一,這個(gè)不是中文的,是英文和多語種的比賽。
今天,我們的語音交互已經(jīng)搭載了5700多萬輛的汽車,去年中國500多萬輛汽車出海,成為中國出海的“新三樣”,其中的多語種智能語音技術(shù)幾乎全是科大訊飛提供的。不僅僅是語音,我們還將語音與大模型結(jié)合,與紅旗、奇瑞、廣汽合作,包括最近又和一汽簽訂了戰(zhàn)略合作協(xié)議,越來越多的車企開始用我們“能聽會(huì)說、能理解會(huì)思考”的汽車方案。
今天我們又再一次升級(jí)了星火汽車智能座艙,智能座艙中可以實(shí)現(xiàn)全雙工交互,實(shí)現(xiàn)多語種多方言的免切換交流,多情感多模態(tài)的擬人交互,而且能夠多模態(tài)感知,知道我們的身體健康程度,是否疲勞、血壓過高、心跳過快;然后還可以貫穿內(nèi)外信源,在車上完成真正的任務(wù),因?yàn)槲覀冇辛苏Z言理解,就可以更自由地對(duì)接外部信源了。
還有個(gè)非常重要的一個(gè)功能,就是一句話復(fù)刻,我們說一句話,大模型馬上就可以模仿你的聲音,當(dāng)我們開車聽到了孩子聲音提醒我們注意安全,可能會(huì)給大家?guī)聿灰粯拥男睦砀惺埽嵝训酶袦囟取?/div>
這個(gè)能力在訊飛星火APP都可以去試了,只要一句話就可以模仿你的聲音。除了一句話復(fù)刻,在車內(nèi)還有更多真正解決剛需要求的功能。在我們舞臺(tái)的右側(cè)放了一輛汽車,這輛汽車是奇瑞的星紀(jì)元ET,為什么放奇瑞?因?yàn)槠嫒鹗侵袊囎灾髌放瞥隹谶B續(xù)20年排名第一的車企?,F(xiàn)在,我們就在這個(gè)真車上,把這一次語音技術(shù)和大模型對(duì)接的相關(guān)功能給大家做個(gè)演示。
除了急速的語音對(duì)話、多方言多語種之外,還有一個(gè)非常重要的功能就是多模態(tài)的識(shí)別,它可以了解到你的身體參數(shù),知道你是否疲勞駕駛、是否有異常情況。同時(shí),我們?cè)谄嚨囊粜线€有一個(gè)非常重要的特點(diǎn),通過AI大模型和音效結(jié)合,可以把十幾萬的國產(chǎn)車音效,做到比四五十萬的車的音效還好,40多萬的車可以超過柏林之聲的音效。不僅音效提升,開車時(shí)可以隨時(shí)要求去掉原唱,跟著它的伴唱、對(duì)唱、分享等,這些其實(shí)都是大模型帶來的功能,
還有一個(gè)特別重要的能力是和內(nèi)外部信息源進(jìn)行打通,剛才演示中的點(diǎn)餐是真的已經(jīng)點(diǎn)成了,發(fā)布會(huì)結(jié)束后就可以直接去吃飯了,真的讓汽車對(duì)我們生活辦公和娛樂空間做了非常好的拓展。
這種軟硬一體化的方案除了在汽車中落地,在現(xiàn)在家電中也開始落地了。云端通過大模型理解、識(shí)別,在端側(cè),通過語音交互和最快速的本地多模態(tài)的識(shí)別,可以形成非常好的新一代家電方案,能夠讓冰箱、彩電等各種各樣的家電變得更加易用、更加生動(dòng)、更好玩。大家可以看到去年我們的大模型,相關(guān)的語音技術(shù)和大模型賦能智能家居、智能家電和C端硬件已經(jīng)超過了2000萬臺(tái),可以看到,如今大模型賦能智能家居、家電產(chǎn)業(yè)帶來的蓬勃發(fā)展機(jī)會(huì)。
機(jī)器人超腦平臺(tái)2.0正式發(fā)布
今天,還有特別重要的事情是發(fā)布訊飛機(jī)器人超腦平臺(tái)2.0。隨著大模型具身智能的幫助,今天的陪伴機(jī)器人,尤其是人形機(jī)器人開始進(jìn)入到全新的發(fā)展階段,未來如果沒有陪伴機(jī)器人,老年社會(huì)的幸福是沒有辦法保障的。
通過大模型可以在后臺(tái)做理解、做規(guī)劃,在前端通過專門的硬件設(shè)備實(shí)現(xiàn)麥克風(fēng)陣列,實(shí)現(xiàn)人臉、手勢(shì)的各種識(shí)別,從而可以“聽說看認(rèn)”,最后再與機(jī)器人廠商共同來做具身模型,把這個(gè)能力開放給我們的合作伙伴。直接用科大訊飛的方案,每一個(gè)機(jī)器人廠商都可以定制自己的機(jī)器人超腦。我們?cè)趦赡昵熬屯瞥隽擞嶏w超腦平臺(tái),是專門給機(jī)器人的機(jī)器人超腦平臺(tái)1.0,現(xiàn)在已經(jīng)有410家機(jī)器人企業(yè),大概占了至少60%的機(jī)器人市場(chǎng)份額。
今天,機(jī)器人超腦平臺(tái)進(jìn)一步升級(jí)。升級(jí)的核心是后端星火超腦2.0的硬件版,能夠極大地提升具身智能和最后相關(guān)的理解能力,包括任務(wù)規(guī)劃和前端的攝像頭、麥克風(fēng)一體化的模塊。剛才大家看到的極限情況下的多人說話,就是既有麥克風(fēng)陣列又有攝像頭,大家會(huì)后有興趣可以自己去試。
星火大模型賦能企業(yè)
用智能體平臺(tái)打造每個(gè)崗位專屬助手
今天的最后一個(gè)環(huán)節(jié)是關(guān)于星火大模型賦能企業(yè),如何更好地解決企業(yè)大模型應(yīng)用的“最后一公里”問題。經(jīng)過和大量的央國企和行業(yè)合作伙伴的共同探討,我們覺得今天要用智能體平臺(tái)打造每個(gè)崗位專屬助手的時(shí)間已經(jīng)到來。
隨著訊飛星火V4.0的發(fā)布,通過智能體平臺(tái),星火大模型可以在企業(yè)落地,解決“人工智能+”行動(dòng)的“最后一公里”的問題,是前所未有的機(jī)遇。在這之前,星火已經(jīng)成功賦能了很多場(chǎng)景,無論是代碼、數(shù)字勞動(dòng)力,還是評(píng)標(biāo)、客戶、APP智能互動(dòng)。我們與太平洋保險(xiǎn)合作是從審計(jì)這個(gè)崗位做起的,包括客服和評(píng)標(biāo);此外,國家能源集團(tuán)、中國石油等公司選了科大訊飛作為合作伙伴;同時(shí),星火大模型賦能中國移動(dòng)APP幾億用戶,使中國移動(dòng)APP更加智能、交互更順暢。
通過這么多的場(chǎng)景可以看到,大模型賦能企業(yè)“人工智能+”行動(dòng)有兩個(gè)方面:一方面是大模型直接完成任務(wù),訊飛星火一開始啟用文本生成、語言理解、知識(shí)問答、邏輯推理和代碼能力對(duì)應(yīng)到下面相關(guān)的各種各樣的工具,它自己就完成了,不需要借助任何外力。還有一種模式是以認(rèn)知大模型為中心大腦,它調(diào)動(dòng)各種專用模型,比如說振動(dòng)的模型、味覺模型、氣體模型,濕度模型等各種模型,然后配合相應(yīng)的工具,再對(duì)接內(nèi)外部的各種信源和數(shù)據(jù),打通內(nèi)部的辦公OA、ERP系統(tǒng),再對(duì)接外部實(shí)時(shí)性來聯(lián)合完成任務(wù),相當(dāng)于用大模型來指揮調(diào)度一系列的能力,從而完成一個(gè)綜合的任務(wù)。
在去年9月份發(fā)布的GPT-4V,OpenAI大模型在圖文識(shí)別和理解分析能力上,上了一個(gè)大臺(tái)階,隨后11月推出語音識(shí)別大模型Whisper,今年2月又推出了文生視頻大模型Sora ,今年5月推出GPT-4o,看起來是一個(gè)又一個(gè)的熱點(diǎn),但實(shí)際上還是依托GPT-4的底層通用大模型能力。
以Sora為例,并不是外界所說的“對(duì)物理世界的認(rèn)知進(jìn)一步加強(qiáng)了”,而是通過GPT-4V的理解能力和生成能力,結(jié)合GPT-4V的“打標(biāo)簽”能力、傳統(tǒng)的文生視頻能力,用GPT方法做了重寫,從而實(shí)現(xiàn)了Sora。本質(zhì)上,與大模型在醫(yī)療領(lǐng)域做一個(gè)醫(yī)療專用模型,在教育領(lǐng)域做一個(gè)教育專用模型并沒有本質(zhì)差別,只要有算力、有數(shù)據(jù),其實(shí)沒有真正核心技術(shù)的壁壘。
我們要發(fā)展中國通用人工智能,整個(gè)產(chǎn)業(yè)一定要有大模型的底座能力,我們有很多人可以做專用系統(tǒng),很多人可以做我剛才說的大模型所調(diào)用的各種專用的小系統(tǒng)。但是國家不能沒有自主可控的通用大模型底座,這決定了我們本輪通用人工智能發(fā)展到底能走多遠(yuǎn)。我們這么熱熱鬧鬧的社會(huì)熱點(diǎn),這么多的投入,將來能不能真的走到紅利兌現(xiàn)那一天,我覺得底座能力是至關(guān)重要的。
今天所有的企業(yè)一定要科學(xué)地認(rèn)識(shí)到大模型能力的邊界,我們可以舉出很多成功的例子,也可以舉出很多的坑、很多不行的地方,每一家都是如此,所以我們要給統(tǒng)計(jì)數(shù)據(jù)。比如醫(yī)療八十幾分是什么概念,國家執(zhí)業(yè)醫(yī)師資格考試60分就可以通過了,我們要考協(xié)和醫(yī)學(xué)院等分?jǐn)?shù)最高的醫(yī)學(xué)院,七十幾分也就可以上了。大模型的能力并不是包治百病,并不是什么任務(wù)都能100%完成。但是可以大概把它分成這幾塊,一個(gè)是叫一般難度任務(wù),用通用大模型底座就直接可做,比如說代碼、文案、翻譯這些,會(huì)用到文本生成、摘要這些能力,直接用底座就可以滿足應(yīng)用。
中等難度任務(wù)涉及了知識(shí)庫、深度的客服,它需要定制優(yōu)化后才能用,這一般來說必須要做SFT的專門優(yōu)化,很多地方可以做到,現(xiàn)在在很多客服行業(yè)可以大幅提升效率。
還有很多高難度任務(wù),比如說高難度數(shù)學(xué)推理、多階的推理類的知識(shí)問答,以及開放域的通用智能體等,實(shí)際上是非常難的,需要更大的模型,還需要專門的算法去摸索,在這些領(lǐng)域中,它具有很強(qiáng)的不確定性。所以今天我們認(rèn)清這個(gè)邊界,每個(gè)企業(yè)就可以知道自己應(yīng)該怎么去做。
實(shí)際上,今天企業(yè)要探討的話題是我們?cè)趺茨苡酶俚乃懔?、更高的效率來打造我們的專屬模型和專屬?yīng)用。我們企業(yè)可以拿通用底座來做自己的專用行業(yè)模型,一般來說一個(gè)月就可以上線,在底座能力上進(jìn)一步提升。底座如果60分,專業(yè)模型可能會(huì)做到80分,然后有了專用的行業(yè)模型,每個(gè)企業(yè)或者企業(yè)的不同崗位,在針對(duì)私域的IT語料加上高質(zhì)量的微調(diào),又可以進(jìn)一步提升,一周就可以完成。所以,我們現(xiàn)在希望與很多龍頭企業(yè)打造行業(yè)模型,提供給行業(yè)內(nèi)所有上下游公司。
通用大模型可以用底座的基本能力給很多行業(yè)直接賦能,特別是在那些小規(guī)模的模型上,可以更好地為大家提供服務(wù)。所以今天要把它落實(shí),就需要看到不同尺寸的模型能夠滿足什么要求,從小的、到中等、到大的,同時(shí)必須要軟硬件一體化,才能解決剛需。
各種場(chǎng)景優(yōu)化定制怎么解決應(yīng)用的“最后一公里”?訊飛星火V4.0在智能體上的能力進(jìn)步,使我們這個(gè)目標(biāo)可以更好地照進(jìn)現(xiàn)實(shí)。這個(gè)是什么目標(biāo)?我能不能用一句話提要求,大模型就能理解我的意圖,然后分解出這句話所對(duì)應(yīng)的各個(gè)步驟的任務(wù),然后找到每個(gè)任務(wù)所對(duì)應(yīng)的工具,讓每個(gè)工具去調(diào)用內(nèi)外部的各種信息,有的是內(nèi)部信息,有的是外部信息,最后完成任務(wù)給出結(jié)果,這就叫智能體。簡單地說,就是叫它干一件事,它能自動(dòng)規(guī)劃,找到工具自動(dòng)完成。
大家可以看到,只要說一句話,系統(tǒng)就把后面所有東西都做了,已有工具的它調(diào)工具,沒有工具它自己做,然后把它整個(gè)串成一體。以后你只要有任何一張會(huì)議彩頁拍進(jìn)來,這個(gè)彩頁背后的所有你想關(guān)心的地方都可以給你找到。還比如,我想了解創(chuàng)始人的背景,想了解這個(gè)公司在國內(nèi)外的市場(chǎng)地位、技術(shù)水平,它都可以更深度地幫你把內(nèi)外部信息整合,給你答案。
一個(gè)又一個(gè)我們需要的專屬助手,都可以用這種方式快速搭建起來。
而搭建企業(yè)智能體平臺(tái)最重要的三項(xiàng)能力,一個(gè)是AI的原子能力,當(dāng)然最核心的還是大模型的底層能力,你要有很多原子能力,比如人工智能開放平臺(tái)上的各種各樣的專有能力,會(huì)成為工具被它調(diào)用;第二個(gè)是各種外部信源,比如剛才聯(lián)網(wǎng)搜了企查查上企業(yè)外部的各種信息,搜了互聯(lián)網(wǎng)上企業(yè)最新的各類新聞報(bào)道;最后要打通公司內(nèi)部系統(tǒng),比如剛才發(fā)送郵件給它,它要打通內(nèi)部系統(tǒng),要去內(nèi)部查詢與我們公司有沒有歷史上的合作等。這三個(gè)能力構(gòu)建起來,再有大模型能力,就可以搭建企業(yè)智能體了。在這方面,科大訊飛已經(jīng)走在了行業(yè)前列,我們不僅有了基本能力,現(xiàn)在AI的原子能力有400多項(xiàng),都來源于我們?nèi)斯ぶ悄荛_放平臺(tái),而且已經(jīng)集成了外部的90多個(gè)重要的信源,關(guān)乎到研、產(chǎn)、供、銷、服、管各個(gè)領(lǐng)域,天氣、股票、航班等這些全部都在。還打通了內(nèi)部IT、ERP財(cái)務(wù)、法務(wù)、OA等系統(tǒng)。
星火企業(yè)智能體平臺(tái)重磅發(fā)布
所以,今天我們將在這里重磅發(fā)布星火企業(yè)智能平臺(tái)。所有到現(xiàn)場(chǎng)的企業(yè),還有我們的合作伙伴,從今天開始都可以使用剛才說的我們有這么多能力的企業(yè)智能體平臺(tái)。除了有這個(gè)平臺(tái),讓大家自己快速去構(gòu)建各種應(yīng)用之外,我們也推出了首批32個(gè)企業(yè)從生產(chǎn)、科研、辦公到管理中特別需要的相關(guān)智能體,如商機(jī)、銷售、客服、科技情報(bào)以及編程等。
其實(shí)人工智能的編程上,我們的代碼智能體現(xiàn)在已經(jīng)可以在代碼生成、架構(gòu)設(shè)計(jì)、問答、測(cè)試、數(shù)據(jù)庫優(yōu)化以及審核6個(gè)場(chǎng)景上幫助我們,可以整合,也可以單獨(dú)使用?,F(xiàn)在,代碼在科大訊飛內(nèi)部的采納率已經(jīng)從去年10月份的30%,漲到了現(xiàn)在的52%。單元測(cè)試行覆蓋率從30%提到50%。除了我剛才講的各種代碼測(cè)試集,我們這些指標(biāo)在業(yè)內(nèi),目前是國內(nèi)領(lǐng)先的,跟國外相比還有差距,我們?cè)诮衲?月就會(huì)趕上現(xiàn)在GPT-4 turbo最新的水平。
在真實(shí)環(huán)境下的企業(yè)內(nèi)部采納率上,我們的數(shù)據(jù)指標(biāo)也是現(xiàn)在業(yè)界領(lǐng)先的。大家都說,代碼是連接虛擬世界和物理世界的橋梁,這個(gè)能力是中國大模型一定要搶占的核心能力。
給大家看兩個(gè)智能體的案例,也是在前期與大量合作伙伴和企業(yè)客戶溝通后,做出來的星火商機(jī)助手和星火評(píng)標(biāo)助手。
星火商機(jī)助手不僅是在外部找到各種各樣的商機(jī)線索,解決我們應(yīng)知盡知,更重要的是極大地提升了每個(gè)一線客戶經(jīng)理的效率,同時(shí)能夠自動(dòng)地把公司的管理要求轉(zhuǎn)換為對(duì)他工作的指導(dǎo),員工缺了哪些商機(jī)相關(guān)內(nèi)容沒有填充、有哪些需要考慮,我們都會(huì)在過程中指導(dǎo)他。
星火評(píng)標(biāo)助手,不光在過程中自動(dòng)評(píng)標(biāo),自動(dòng)解析投標(biāo)文件的關(guān)鍵內(nèi)容,自動(dòng)給出每一家投標(biāo)商資格證書有沒有造假、涂改,有沒有問題,然后根據(jù)各種各樣的技術(shù)要求和商務(wù)要求自動(dòng)評(píng)分,給出高低,還能夠在過程中找到投標(biāo)過程中可能潛在的異常點(diǎn)。另外,能夠?qū)τ谕獠績r(jià)格進(jìn)行自動(dòng)判斷,比如說我們預(yù)中標(biāo)的第一單位,它在歷史上跟公司合作的所有價(jià)格,這一次跟原來相比怎么樣,外部可公開找到的價(jià)格,它的價(jià)格怎么樣,都能夠自動(dòng)進(jìn)行判斷,不僅僅能夠進(jìn)行人工智能評(píng)標(biāo),給出第一名、第二名。星火評(píng)標(biāo)助手作為一個(gè)典型的人工智能應(yīng)用案例,已經(jīng)放在國資委網(wǎng)站上了。原來是幫助評(píng)標(biāo),現(xiàn)在能夠幫助在外部找到更適合的人來參與投標(biāo);原來是投標(biāo)的評(píng)標(biāo)過程,現(xiàn)在不光是給出結(jié)果,還能夠自動(dòng)對(duì)接外部信源判斷是否有異常、有虛假,找到疑似這些風(fēng)險(xiǎn)項(xiàng),給出最終簽單之前價(jià)格是否合理的內(nèi)外部信息分析,從而可以使我們能夠更好地降低采購成本。這個(gè)能力現(xiàn)在也已經(jīng)幾乎成為我們合作的所有央國企和行業(yè)客戶都特別想用的能力。
只有自主可控的繁榮生態(tài)
才有中國通用人工智能的大未來
今天人工智能技術(shù)的發(fā)展絕不是一家公司可以把所有事情都做完的,在這個(gè)時(shí)代,做帝國注定要衰落,只有生態(tài)才能生生不息;必須是自主可控的繁榮生態(tài),才有中國通用人工智能大未來。
我非常高興地向大家報(bào)告,從今年1月30日訊飛星火V3.5發(fā)布以來,我們的開發(fā)者團(tuán)隊(duì)持續(xù)高速增長,目前已經(jīng)增長到702萬,這都是實(shí)名認(rèn)證的開發(fā)者團(tuán)隊(duì)。海外開發(fā)者數(shù)量從34萬增加到40萬,大模型的直接相關(guān)開發(fā)者達(dá)到了57萬,這些數(shù)據(jù)都還在快速增長中。
面向下一階段的人工智能的發(fā)展,這一波通用人工智能浪潮,我們要打造新的生態(tài)。特別要關(guān)注到的,第一是源頭技術(shù)生態(tài)??拼笥嶏w針對(duì)幾百萬開發(fā)者團(tuán)隊(duì),我們希望只要有比較好的AI能力,不論是高校還是創(chuàng)業(yè)企業(yè),都可以集成在我們的底層平臺(tái)上,讓幾百萬開發(fā)者團(tuán)隊(duì)都能夠用起來。
過去18個(gè)月,用過我們?nèi)斯ぶ悄苣芰Φ莫?dú)立終端已經(jīng)突破40億。我們把源頭技術(shù)生態(tài)打開來,讓更多的英雄有用武之地。今天人工智能非常重要的一個(gè)特點(diǎn)是大平臺(tái)加上英雄主義,所以我們把源頭技術(shù)生態(tài)打開。智能體生態(tài)讓無論是企業(yè)每個(gè)崗位的人,可以做自己崗位的助手,也可以做自己的個(gè)性化助手,做完以后都可以分享出來。在我們的平臺(tái)上,我們將來會(huì)設(shè)計(jì)分享模式和商業(yè)機(jī)制,從而形成智能體的生態(tài)。只要你懂場(chǎng)景,只要你愿意自己去試,試完成功了,你就可以發(fā)布到我們的智能體生態(tài)上,讓所有的一線洞察能力和經(jīng)驗(yàn)成為整個(gè)商業(yè)體中的一環(huán)。還可以有應(yīng)用生態(tài),用原來的開發(fā)者生態(tài)來做各種應(yīng)用,無論是創(chuàng)業(yè),還是企業(yè)內(nèi)部的應(yīng)用。去年我們新增的幾百萬開發(fā)者團(tuán)隊(duì)中,有50%以上是企業(yè)應(yīng)用。
最后行業(yè)生態(tài)是希望跟各個(gè)行業(yè)里面的龍頭企業(yè)一道來打造整個(gè)行業(yè)模型,然后把這個(gè)行業(yè)模型提供給行業(yè)里面的生態(tài)伙伴來共享產(chǎn)業(yè)收益,目前我們已經(jīng)和現(xiàn)在很多龍頭企業(yè)在做這件事。
從源頭智能體開發(fā)到行業(yè)生態(tài),在推動(dòng)的過程中,特別重要的是一定要底座技術(shù)的完全自主可控,否則可能我們就把大樓建在別人的院子里,建在沙灘上,隨時(shí)會(huì)倒塌,要真正做到軟硬件一體化,才能更深度地落地。
在這樣大的發(fā)展過程中,我們一定要科學(xué)理性地認(rèn)識(shí)到中美科技的綜合差距。今天我們說訊飛星火V4.0對(duì)標(biāo)GPT-4 turbo是全方位對(duì)標(biāo)。但是我們同時(shí)要看到,一旦GPT-5發(fā)布,因?yàn)樗哪P统叽绺蟆⒂?xùn)練時(shí)間更長、數(shù)據(jù)更多,又會(huì)把這個(gè)差距給拉開,甚至拉到一年以上。
當(dāng)然,我們有信心快速追趕,而且是在完全國產(chǎn)算力自主可控算法和數(shù)據(jù)基礎(chǔ)上來追趕,保證不出現(xiàn)代差,保證極限情況下,能夠頂上扛上。我們既要認(rèn)識(shí)到差距,又要有充分的信心,要能夠科學(xué)理性地給出從源頭技術(shù)、到生態(tài)、到產(chǎn)業(yè)應(yīng)用落地的一整套打法,要以長期主義來打造真正自主可控的AI產(chǎn)業(yè)生態(tài)。
我們多語言的語音識(shí)別原來需要1萬小時(shí)數(shù)據(jù),現(xiàn)在只要100小時(shí)數(shù)據(jù)就能做到比原來1萬小時(shí)還好的效果。在中國,一定要考慮用更小的算力、更小的數(shù)據(jù),做出更優(yōu)質(zhì)的落地成果,這樣才能夠真正地在未來幾年打贏這一場(chǎng)人工智能紅利賦能產(chǎn)業(yè)的“仗”,但同時(shí),整個(gè)社會(huì)還要加強(qiáng)源頭技術(shù)創(chuàng)新的氛圍,一定要看到中美之間的差距,才能夠迎頭趕上,絕不能盲目自信,盲目地認(rèn)為我們都已經(jīng)超越了。差距還是很大的,需要大家有充分清晰而又理性地認(rèn)知。
在2017年國家的新一代人工智能規(guī)劃出臺(tái)之后,我們?cè)?jīng)專門做了一個(gè)企業(yè)宣傳片,叫做《AI向人類的表白》。情景假設(shè)到2045年,人工智能可以了解所有成長的秘密,但絕對(duì)不可能替代母親,了解所有教學(xué)的知識(shí),但不可能替代老師,因?yàn)槿祟愑蠥I所不具備的東西,那就是愛,就是同理心。隨著大模型的進(jìn)一步發(fā)展,到今天我們把大模型的基礎(chǔ)能力、個(gè)性化能力以及智能體的能力提升到能夠做更懂你的AI助手的時(shí)候,我們認(rèn)為AI可以再一次對(duì)人類表白了。就像我們開場(chǎng)視頻說的那樣,每一次人類文明進(jìn)步的背后都有一個(gè)了不起的助手,每一代助手都有它的使命。
今天,作為每個(gè)人的AI助手——“訊飛星火”,我們的使命就是要解放生產(chǎn)力、釋放想象力。通過我們的能力,成就每一個(gè)了不起的企業(yè),幫助每一個(gè)人都成為了不起的自己。我們期待著能夠同大家一道,頂天立地,星火燎原。謝謝大家!
*文中數(shù)據(jù)來源于實(shí)際應(yīng)用及第三方評(píng)測(cè)
咨詢?cè)斍椋?/strong>如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情,請(qǐng)加微信:ZiDongHuaX 。
微信聯(lián)盟:人工智能微信群、大模型微信群、機(jī)器人微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測(cè)儀器、智慧農(nóng)業(yè)在線監(jiān)測(cè)儀器 金葉儀器: 氣體/顆粒物/煙塵在線監(jiān)測(cè)解決方案
西凱昂:SMC氣動(dòng)元件、力士樂液壓元件、倍加福光電產(chǎn)品等 山東諾方: 顆粒物傳感器、粉塵濃度傳感器
深圳金瑞銘:RFID射頻識(shí)別、智能傳感器等物聯(lián)網(wǎng)解決方案 北京英諾艾智: 容錯(cuò)服務(wù)器、邊緣計(jì)算解決方案
微信聯(lián)盟:人工智能微信群、大模型微信群、機(jī)器人微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測(cè)儀器、智慧農(nóng)業(yè)在線監(jiān)測(cè)儀器 金葉儀器: 氣體/顆粒物/煙塵在線監(jiān)測(cè)解決方案
西凱昂:SMC氣動(dòng)元件、力士樂液壓元件、倍加福光電產(chǎn)品等 山東諾方: 顆粒物傳感器、粉塵濃度傳感器
深圳金瑞銘:RFID射頻識(shí)別、智能傳感器等物聯(lián)網(wǎng)解決方案 北京英諾艾智: 容錯(cuò)服務(wù)器、邊緣計(jì)算解決方案
我要收藏
個(gè)贊
評(píng)論排行