技術(shù)文章區(qū)

源2.0大模型適配LLaMA-Factory框架微調(diào)訓(xùn)練快捷高效

時間：2024-01-18 22:39:02 發(fā)布：來源：LLaMA-Factory 第一對焦：人工智能

近日，源2.0開源大模型與LLaMA-Factory框架完成全面適配，用戶通過LLaMA-Factory，即可快捷、高效地對不同參數(shù)規(guī)模的源2.0基礎(chǔ)模型進(jìn)行全量微調(diào)及高效微調(diào)，輕松實現(xiàn)專屬大模型。

LLM（大語言模型）微調(diào)，是指在大模型的基礎(chǔ)上，針對特定任務(wù)或領(lǐng)域進(jìn)行調(diào)整和優(yōu)化，以提升模型的性能和表現(xiàn)，有效的微調(diào)方案與工具也正是解決基礎(chǔ)大模型落地私有領(lǐng)域的一大利器?；陂_源大模型的微調(diào)，不僅可以提升LLM對于指令的遵循能力，也能通過行業(yè)知識的引入，來提升LLM在專業(yè)領(lǐng)域的知識和能力。

當(dāng)前，業(yè)界已經(jīng)基于LLM開發(fā)及實踐出了眾多的微調(diào)方法，如指令微調(diào)、基于人類反饋的強化學(xué)習(xí)（RLHF，Reinforcement Learning from Human Feedback）、直接偏好優(yōu)化（DPO，Direct Preference Optimization）等。以高效微調(diào)（PEFT，Parameter-Efficient Fine-Tuning）方案為例，可有效解決內(nèi)存和計算資源的制約，通過LoRA、QLoRA等高效微調(diào)技術(shù)，在單張GPU上完成千億參數(shù)的微調(diào)訓(xùn)練。因此，一個能夠?qū)崿F(xiàn)上述功能的簡潔、高效且易用的微調(diào)框架正是開展LLM微調(diào)工作的最佳抓手。

LLaMA-Factory是零隙智能（SeamLessAI）開源的低代碼大模型訓(xùn)練框架，旨在為開發(fā)者提供可視化訓(xùn)練、推理平臺及一鍵配置模型訓(xùn)練?；贚LaMA-Factory, 用戶可輕松選擇業(yè)界最全面的微調(diào)方法和優(yōu)化技術(shù)，通過使用私域數(shù)據(jù)，或是LLaMA-Factory內(nèi)置的中文數(shù)據(jù)集（GPT-4優(yōu)化后的alpaca中文數(shù)據(jù)集、ShareGPT數(shù)據(jù)集和llama-factory提供的模型認(rèn)知數(shù)據(jù)集），對源2.0進(jìn)行輕松微調(diào)，基于有限算力完成領(lǐng)域大模型的定制開發(fā)。實測數(shù)據(jù)顯示，在一臺搭載8顆GPU的主流AI服務(wù)器NF5468M7，7小時內(nèi)即可實現(xiàn)千億模型（Yuan2.0- 102B）的高效指令微調(diào)，10分鐘即可完成Yuan2.0-2B參數(shù)的指令微調(diào)，輕松實現(xiàn)即調(diào)即用。