• 新推出的 Granite 3.0 8B 2B 模型,在寬松的 Apache 2.0 許可證下發(fā)布,在許多學(xué)術(shù)和企業(yè)基準(zhǔn)測試中表現(xiàn)出強(qiáng)大的性能,能夠超越或匹敵類似規(guī)模的模型。
  • 新推出的 Granite Guardian 3.0 模型提供了 IBM 最全面的護(hù)欄功能,以推進(jìn)安全且值得信賴的人工智能。
  • 新推出的 Granite 3.0 專家混合模型(Mixture-of-Experts models)可實(shí)現(xiàn)極其高效的推理和低延遲,適用于基于 CPU 的部署和邊緣計(jì)算
  • 全新的 Granite 時(shí)間序列模型在零樣本/少樣本預(yù)測中實(shí)現(xiàn)了最先進(jìn)的性能,超越了大10倍的模型。
  • IBM 推出了下一代基于 Granite 的 watsonx Code Assistant,適用于通用編碼;在 watsonx.ai 中首次推出用于構(gòu)建和部署 AI 應(yīng)用程序和智能體(Agents)的新工具。
  • 宣布 Granite 將成為 Consulting Advantage 的默認(rèn)模型,這是一個(gè)由 AI 驅(qū)動(dòng)的交付平臺(tái),IBM 的 160,000 名顧問使用該平臺(tái),可以更快地為客戶提供新解決方案。

 

 

在美國時(shí)間10月21日舉行的IBM(紐約證券交易所代碼:IBM)年度TechXchange大會(huì)上,IBM宣布推出其迄今為止最先進(jìn)的AI模型家族——Granite 3.0。IBM的第三代Granite旗艦語言模型在許多學(xué)術(shù)和行業(yè)基準(zhǔn)測試中均能超越或匹敵同類領(lǐng)先模型提供商的模型,展示出強(qiáng)大的性能、透明性和安全性。

IBM 推出 Granite 3.0:專為企業(yè)打造的高性能AI模型
IBM 推出 Granite 3.0:專為企業(yè)打造的高性能AI模型

與公司對開源 AI 的承諾一致,Granite 模型在寬松的 Apache 2.0 許可證下發(fā)布,它們憑借在性能、靈活性和自主性方面的獨(dú)特組合能夠?yàn)槠髽I(yè)客戶和整個(gè)社區(qū)提供服務(wù)。

IBM的Granite 3.0家族系列包括:

  • 通用/語言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • 護(hù)欄與安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • 專家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

新款 Granite 3.0 8B2B 語言模型被設(shè)計(jì)為企業(yè)級AI的"主力"模型,能夠在檢索增強(qiáng)生成(RAG)、分類、摘要、實(shí)體提取和工具使用等任務(wù)中提供強(qiáng)大的性能。這些緊湊的多功能模型旨在根據(jù)企業(yè)數(shù)據(jù)進(jìn)行微調(diào),并在各種業(yè)務(wù)環(huán)境或工作流程中無縫集成。

許多大型語言模型(LLM)是基于公開可用的數(shù)據(jù)進(jìn)行訓(xùn)練的,絕大多數(shù)企業(yè)數(shù)據(jù)仍然未被利用。通過將小型 Granite 模型與企業(yè)數(shù)據(jù)相結(jié)合,特別是使用 IBM 和 RedHat 在五月推出的革命性對齊技術(shù) InstructLab, IBM 相信企業(yè)可以實(shí)現(xiàn)與大型模型相媲美的特定任務(wù)性能,而成本只是其中的一小部分(基于在幾個(gè)早期概念驗(yàn)證中觀察到的成本比大型前沿模型低 3 到 23 倍的范圍[i])。

Granite 3.0 版本的發(fā)布重申了 IBM 對建立 AI 產(chǎn)品透明度、安全性和信任的承諾。Granite 3.0 技術(shù)報(bào)告和負(fù)責(zé)任使用指南提供了用于訓(xùn)練這些模型的數(shù)據(jù)集描述,詳細(xì)說明了所應(yīng)用的過濾、清洗和處理步驟,并全面展示了模型在主要學(xué)術(shù)和企業(yè)基準(zhǔn)測試中的性能結(jié)果。

至關(guān)重要的是,IBM 為 watsonx.ai 上的所有 Granite 模型提供知識產(chǎn)權(quán)賠償,旨在增強(qiáng)企業(yè)客戶將企業(yè)數(shù)據(jù)融入模型的信心。

提高標(biāo)準(zhǔn):Granite 3.0 基準(zhǔn)測試

Granite 3.0 語言模型在原始性能上也展示出良好的結(jié)果。

在 Hugging Face 的 OpenLLM 排行榜定義的標(biāo)準(zhǔn)學(xué)術(shù)基準(zhǔn)測試中,Granite 3.0 8B Instruct 模型的整體性能平均領(lǐng)先于 Meta 和 Mistral 中類似大小的開源模型的最先進(jìn)性能。在 IBM 的先進(jìn) AttaQ 安全基準(zhǔn)測試中,Granite 3.0 8B Instruct 模型在所有測量的安全維度上均領(lǐng)先于 Meta 和 Mistral 的模型[ii]。

在檢索增強(qiáng)生成(RAG)、工具使用和網(wǎng)絡(luò)安全領(lǐng)域的核心企業(yè)任務(wù)中,Granite 3.0 8B Instruct 模型的平均表現(xiàn)優(yōu)于Mistral 和 Meta 中類似規(guī)模的開源模型[iii]

Granite 3.0 模型是在超過 12 萬億個(gè)標(biāo)記上進(jìn)行訓(xùn)練的,這些數(shù)據(jù)來自 12 種不同的自然語言和 116 種不同的編程語言,采用了一種新穎的兩階段訓(xùn)練方法,利用了數(shù)千個(gè)旨在優(yōu)化數(shù)據(jù)質(zhì)量、數(shù)據(jù)選擇和訓(xùn)練參數(shù)的實(shí)驗(yàn)結(jié)果。到今年年底,預(yù)計(jì) 3.0 8B2B 語言模型將支持?jǐn)U展的 128K 上下文窗口和多模態(tài)文檔理解能力。

IBM 展示了性能和推理成本的完美平衡,提供了其 Granite 專家混合(MoE)機(jī)構(gòu)模型,Granite 3.0 1B-A400M 和 Granite 3.0 3B-A800M,這些較小且輕量級的模型可用于低延遲應(yīng)用程序以及基于 CPU 的部署。

IBM 還宣布了其預(yù)訓(xùn)練 Granite 時(shí)間序列模型的更新版本,早期版本于今年早些時(shí)候發(fā)布。這些新模型在 3 倍的數(shù)據(jù)上進(jìn)行訓(xùn)練,在所有三個(gè)主要時(shí)間序列基準(zhǔn)測試中表現(xiàn)出色,超越了來自 Google、Alibaba 等公司 10 倍更大模型的性能。更新后的模型還提供了更大的建模靈活性,支持外部變量和滾動(dòng)預(yù)測[iv]。

Granite Guardian 3.0:開啟負(fù)責(zé)任AI的新時(shí)代

作為此次發(fā)布的一部分,IBM 還推出了一個(gè)新的 Granite Guardian 模型系列,允許應(yīng)用程序開發(fā)人員通過檢查用戶提示和 LLM 響應(yīng)來實(shí)施安全護(hù)欄,以發(fā)現(xiàn)各種風(fēng)險(xiǎn)。Granite Guardian 3.0、8B 和 2B 型號提供了當(dāng)今市場上最全面的風(fēng)險(xiǎn)和危害檢測功能。

除了社會(huì)偏見、仇恨、毒性、褻瀆、暴力、越獄等危害維度外,這些模型還提供了一系列獨(dú)特的檢索增強(qiáng)生成(RAG)特定檢查,如基于事實(shí)性、上下文相關(guān)性和答案相關(guān)性。在針對 19 項(xiàng)安全性和 RAG 基準(zhǔn)的廣泛測試中,Granite Guardian 3.0 8B 模型在危害檢測方面的整體準(zhǔn)確性平均高于 Meta 的所有三代 Llama Guard 模型。它在幻覺檢測方面的整體性能也與專門的幻覺檢測模型 WeCheck 和 MiniCheck 相當(dāng)[v]。

雖然 Granite Guardian 模型派生自相應(yīng)的 Granite 語言模型,但它們可以與任何開放或?qū)S械?AI 模型一起使用,以實(shí)施安全保護(hù)措施。

Granite 3.0 模型的可用性

整個(gè) Granite 3.0 模型套件和更新的時(shí)間序列模型都可以在 HuggingFace 上根據(jù)寬松的 Apache 2.0 許可證下載。新的 Granite 3.0 8B2B 語言模型的指令(instruct)變體以及 Granite Guardian 3.0 8B2B 模型現(xiàn)已在 IBM 的 watsonx 平臺(tái)上提供商業(yè)用途。部分 Granite 3.0 模型也將作為 NVIDIA NIM 微服務(wù)提供,并通過 Google Cloud 的 Vertex AI Model Garden與 HuggingFace 的集成提供。

為給開發(fā)者提供多種選擇和易用性,并支持本地和邊緣部署,一套精選的 Granite 3.0 模型也可在 Ollama 和 Replicate 上獲得。最新一代 Granite 模型擴(kuò)展了 IBM 強(qiáng)大的開源 LLM 目錄。IBM 與 AWS、Docker、Domo、Qualcomm Technologies, Inc.(通過其 Qualcomm® AI Hub)、Salesforce、SAP 等生態(tài)系統(tǒng)合作伙伴合作,將多種 Granite 模型集成到這些合作伙伴的產(chǎn)品中,或在他們的平臺(tái)上提供 Granite 模型,為全球企業(yè)提供更大的選擇空間。

從助理(Assistants)到智能體(Agents):實(shí)現(xiàn)企業(yè)級AI 的未來 

IBM 正在通過一系列技術(shù)推進(jìn)企業(yè)級AI的發(fā)展,從模型和助理 (Assistants),到為公司獨(dú)特的數(shù)據(jù)和用例調(diào)優(yōu)和部署 AI 所需的工具。IBM 還在為未來能夠自我導(dǎo)向、反思并在動(dòng)態(tài)商業(yè)環(huán)境中執(zhí)行復(fù)雜任務(wù)的 AI 智能體(AI agents)鋪平道路。

IBM 不斷發(fā)展其 AI 助理(Assitants)技術(shù)組合,從幫助公司通過低代碼工具和自動(dòng)化構(gòu)建自己的助理的watsonx Orchestrate,到用于特定任務(wù)和領(lǐng)域(如客戶服務(wù)、人力資源、銷售和營銷)的各種預(yù)構(gòu)建助理。全球各地的組織已經(jīng)使用 watsonx Assistant 幫助他們構(gòu)建 AI 助理,用于回答客戶或員工的日常問題、實(shí)現(xiàn)大型機(jī)和傳統(tǒng) IT 應(yīng)用程序現(xiàn)代化、幫助學(xué)生探索潛在的職業(yè)路徑,或?yàn)橘彿空咛峁?shù)字抵押貸款支持等任務(wù)。

IBM 還公布了即將發(fā)布的下一代 watsonx Code Assistant,該版本由 Granite 代碼模型提供支持,能夠?yàn)?C、C++、Go、Java 和 Python 等語言提供通用編碼輔助,并為企業(yè)級 Java 應(yīng)用程序[vi]提供高級應(yīng)用程序現(xiàn)代化功能。Granite 的代碼功能現(xiàn)在也可以通過 Visual Studio Code 擴(kuò)展程序 IBM Granite.Code訪問。

IBM 還計(jì)劃發(fā)布新工具來幫助開發(fā)人員,利用watsonx.ai 更高效地構(gòu)建、定制和部署 AI,包括代理框架、與現(xiàn)有環(huán)境的集成以及用于常見用例(如 RAG 和智能體)的低代碼自動(dòng)化[vii]

IBM 專注于開發(fā)具有更高自主性、復(fù)雜推理能力和多步驟問題解決能力的 AI 智能體(AI Agents)技術(shù)。Granite 3.0 8B 模型的初始版本支持關(guān)鍵的智能體功能,如高級推理和用于實(shí)現(xiàn)工具使用工作流程的高度結(jié)構(gòu)化聊天模板和提示風(fēng)格。IBM 還計(jì)劃在 IBM watsonx Orchestrate 中引入新的 AI 智能體聊天功能,利用智能體功能協(xié)調(diào) AI 助理、技能和自動(dòng)化,幫助用戶提高整體的團(tuán)隊(duì)生產(chǎn)力[viii]。IBM 計(jì)劃在 2025 年繼續(xù)在其產(chǎn)品組合中構(gòu)建智能體功能,包括為特定領(lǐng)域和用例預(yù)構(gòu)建的智能體。

擴(kuò)展的 AI 驅(qū)動(dòng)的交付平臺(tái),以 AI 增強(qiáng) IBM 顧問的能力

IBM 還宣布大幅擴(kuò)展其 AI 驅(qū)動(dòng)的交付平臺(tái) IBM Consulting Advantage。該多模型平臺(tái)包含 AI 智能體、應(yīng)用程序和方法(如可重用的框架),賦能 16 萬名 IBM 顧問,以更低的成本、更好更快地為客戶提供價(jià)值。

作為擴(kuò)展的一部分,Granite 3.0 語言模型將成為 Consulting Advantage 的默認(rèn)模型。借助 Granite 的性能和效率, IBM Consulting 將能夠幫助最大限度地提高 IBM 客戶的生成式 AI 項(xiàng)目的投資回報(bào)。

擴(kuò)展的另一個(gè)關(guān)鍵部分是引入 IBM Consulting Advantage for Cloud Transformation and Management 和 IBM Consulting Advantage for Business Operations。每一項(xiàng)都包括特定領(lǐng)域的 AI 智能體、應(yīng)用程序和融合了 IBM 最佳實(shí)踐的方法,使 IBM 顧問能夠幫助客戶加速云和 AI 轉(zhuǎn)型任務(wù)(如代碼現(xiàn)代化和質(zhì)量工程),或跨領(lǐng)域(如財(cái)務(wù)、人力資源和采購)實(shí)施轉(zhuǎn)型和運(yùn)營。

了解有關(guān) Granite 和 IBM 的 AI for Business 戰(zhàn)略的更多信息,請?jiān)L問https://www.ibm.com/granite

關(guān)于IBM

IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個(gè)國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000 家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺(tái)和 Red Hat OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請?jiān)L問:https://www.ibm.com/cn-zh

 

 


 

[i] 成本計(jì)算基于 IBM watsonx 的開放模型和 openAI 的 GPT4 模型(假設(shè) 80% 輸入,20% 輸出)的每 100 萬個(gè)代幣的 API 成本定價(jià),用于客戶概念驗(yàn)證。
[ii] IBM Research technical paper: Granite 3.0 Language Models
[iii] IBM Research technical paper: Granite 3.0 Language Models
[iv] The Tiny Time Mixer: Fast Pre-Trained Models for Enhanced Zero/Few Shot Forecasting on Multivariate Time Series
[v] Evaluation results published in Granite Guardian GitHub Report
[vi] Planned availability for Q4 2024
[vii] Planned availability for Q4 2024
[viii] Planned availability for Q4 2024