国产精品美女久久久免费,国产欧美一区二区精品久久久

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

大語言模型：LLM的高階應(yīng)用「模型微調(diào)」

長(zhǎng)弓PM

2024-11-08

1 評(píng)論 1536 瀏覽 4 收藏

9 分鐘

在人工智能的疆域中，大語言模型（LLM）正以其強(qiáng)大的語言理解能力，引領(lǐng)著技術(shù)的新浪潮。文章《大語言模型：LLM的高階應(yīng)用「模型微調(diào)」》深入探討了如何通過模型微調(diào)來優(yōu)化LLM，使其更精準(zhǔn)地適應(yīng)特定任務(wù)。正如阿蘭·圖靈所預(yù)見的，機(jī)器不僅能夠計(jì)算，還能學(xué)習(xí)和適應(yīng)。本文將帶您深入了解模型微調(diào)的藝術(shù)，探索AI的無限可能。

上節(jié)我們介紹了LLM如何通過工具和插件來擴(kuò)展能力。今天我們來介紹另外一種擴(kuò)展LLM能力的方式：模型微調(diào)。

一、模型微調(diào)的概念

模型微調(diào)是指在LLM模型的基礎(chǔ)上，針對(duì)特定的任務(wù)或領(lǐng)域，通過進(jìn)一步訓(xùn)練來調(diào)整模型參數(shù)的過程。

這個(gè)過程通常涉及到在特定任務(wù)的數(shù)據(jù)集上進(jìn)行額外的訓(xùn)練，使得模型能夠更好地適應(yīng)新的任務(wù)或領(lǐng)域。

微調(diào)某種程度上也可以看作是一種遷移學(xué)習(xí)（Transfer Learning）的形式，它利用了預(yù)訓(xùn)練模型在語言理解方面的通用能力，并將其適配到特定的應(yīng)用場(chǎng)景中。

二、模型微調(diào)的方法

全參數(shù)微調(diào)：全參數(shù)微調(diào)是指在微調(diào)過程中，模型的所有參數(shù)都會(huì)根據(jù)新任務(wù)的數(shù)據(jù)進(jìn)行更新。這種方法適用于新任務(wù)與預(yù)訓(xùn)練任務(wù)差異較大，或者新任務(wù)的數(shù)據(jù)量較大的情況。

凍結(jié)層微調(diào)：在凍結(jié)層微調(diào)中，模型的一部分參數(shù)（通常是預(yù)訓(xùn)練模型的底層參數(shù)）被凍結(jié)，不參與微調(diào)過程，而只有頂層的參數(shù)會(huì)被更新。這種方法適用于新任務(wù)與預(yù)訓(xùn)練任務(wù)相似度較高，或者新任務(wù)的數(shù)據(jù)量較小的情況。

適應(yīng)性微調(diào)：適應(yīng)性微調(diào)是一種更為靈活的方法，它允許模型在微調(diào)過程中動(dòng)態(tài)地調(diào)整哪些參數(shù)需要更新。這種方法可以根據(jù)新任務(wù)的特定需求，有選擇性地更新模型參數(shù)。

三、模型微調(diào)的流程

以GPT模型的API來微調(diào)LLM，具體流程包括：準(zhǔn)備數(shù)據(jù)、上傳數(shù)據(jù)、執(zhí)行微調(diào)任務(wù)、微調(diào)模型調(diào)用，4個(gè)步驟：

1、準(zhǔn)備數(shù)據(jù)：

更新LLM需要提供一個(gè)包含示例的數(shù)據(jù)集。該數(shù)據(jù)集應(yīng)該是一個(gè)JSONL文件，其中每一行對(duì)應(yīng)一個(gè)提示詞?補(bǔ)全文本對(duì)。

{“prompt”: “<prompt text>”, “completion”: “<completion text>”}

{“prompt”: “<prompt text>”, “completion”: “<completion text>”} …

JSONL文件是文本文件，其中每一行表示一個(gè)單獨(dú)的JSON對(duì)象。有點(diǎn)兒類似于MangoDB之類的文檔數(shù)據(jù)庫(kù)類型。

如果你有足夠的數(shù)據(jù)，那么該工具會(huì)詢問你是否要將數(shù)據(jù)分為訓(xùn)練集和驗(yàn)證集。這是一種推薦的做法。算法將使用訓(xùn)練集來微調(diào)模型參數(shù)。驗(yàn)證集則用于衡量模型在未用于更新參數(shù)的數(shù)據(jù)上的性能。

對(duì)LLM的微調(diào)受益于高質(zhì)量示例，最好由專家審核。當(dāng)使用已有數(shù)據(jù)集進(jìn)行微調(diào)時(shí)，請(qǐng)確保對(duì)數(shù)據(jù)進(jìn)行篩查，以排除具有冒犯性的內(nèi)容或不準(zhǔn)確的內(nèi)容。如果數(shù)據(jù)集過大而無法手動(dòng)審核所有內(nèi)容，則可以檢查隨機(jī)樣本。

2、上傳數(shù)據(jù)

準(zhǔn)備好數(shù)據(jù)后，需要將其上傳到OpenAI服務(wù)器。OpenAI API提供了不同的函數(shù)來操作文件。上傳文件的方法如下：

openai.File.create(

file=open(“out_openai_completion_prepared.jsonl”, “rb”),

purpose=’fine-tune’

)

兩個(gè)參數(shù)是必需的：file和purpose。在微調(diào)時(shí)，將purpose設(shè)置為fine-tune。這將驗(yàn)證用于微調(diào)的下載文件格式。此函數(shù)的輸出是一個(gè)字典，你可以在id字段中檢索文件ID。

刪除文件：openai.File.delete(“file-z5mGg(…)”)，file_id參數(shù)是必需的。

列出所有已上傳的文件：openai.File.list()

3、執(zhí)行微調(diào)的任務(wù)

微調(diào)已上傳文件是一個(gè)簡(jiǎn)單的過程。端點(diǎn)openai.FineTune.create在OpenAI服務(wù)器上創(chuàng)建一個(gè)作業(yè)，以根據(jù)給定的數(shù)據(jù)集優(yōu)化指定的模型。該函數(shù)的響應(yīng)包含排隊(duì)作業(yè)的詳細(xì)信息，如作業(yè)的狀態(tài)、fine_tune_id，以及過程結(jié)束時(shí)模型的名稱。

列出微調(diào)作業(yè)：openai.FineTune.list()

取消微調(diào)作業(yè)：openai.FineTune.cancel()

4、微調(diào)模型的調(diào)用

當(dāng)模型完成微調(diào)作業(yè)后，調(diào)用微調(diào)后的模型名稱，即可使用微調(diào)后的模型，這個(gè)模型會(huì)使用訓(xùn)練數(shù)據(jù)的領(lǐng)域知識(shí)，來進(jìn)行對(duì)話輸出。