近年來,大型語言模型(LLM)的誕生刺激了對即插即用人工智能系統的需求不斷增長,而在各種人工智能技術中,Prompt工程,即通過不斷調整給予大模型的指令以優化大模型生成結果顯得尤為重要。
然而,由于陡峭的學習曲線和大量的時間投入,用戶在編寫提示時經常面臨挑戰,就連目前最熟練的“提示工程師”也很難保證調試出最優化的提示,而這限制了大模型實際落地的效果。同時,現有的自動提示工程(APE)模型可能難以使用。
為了解決這個痛點,來自北京大學的團隊提出了一套“即插即用”的提示自動增強系統——PAS,一種基于LLM的即插即用APE系統。PAS 利用在高質量、自動生成的即時補充數據集上進行訓練的大語言模型,從而實現了卓越的性能。它不僅實現了超過6個層次的效果提升,更重要的是,它真正實現了“全自動化”的效果,將“提示工程師”從繁瑣的調試工作中解放出來,為大模型的應用打開了新的篇章,接下來本文將簡單介紹一下這個系統。
近年來,大語言模型(LLM)的快速發展凸顯了數據管理和人工智能系統在利用這些技術方面的重要性,作為提升LLMs性能的關鍵技術之一,自動提示工程(Automatic Prompt Engineering,APE)的目標是通過自動化的方式增強提示(prompts),以改善LLMs在特定任務的性能,并減少人工干預和時間成本。
然而,現有的提示工程方法,包括鏈式思考(Chain of Thought)和思維樹(Tree of Thought)等策略,雖然在編程上提高了邏輯的一致性和準確性,但缺乏可擴展性。此外,近期的一些其他提示工程研究,包括從優化器視角自動尋找提示的方法,以及將演化算法引入到特定領域的離散提示優化中,雖然表現出了一定的潛力,但在實際應用中面臨著明顯的挑戰,如評估每個提示的適應度需要大量資源,而探索多組提示的適應度會帶來巨大的負擔。
本文介紹的即插即用系統(Plug-and-Play Systems,PAS)因其在不同機器學習工作流程中的模塊化和易集成性而受到重視,這些系統允許快速靈活地增強功能,輕松添加或替換新的處理模塊,而無需重新設計整個算法。由于它們能夠無縫增強現有AI系統的功能,隨著LLM技術的快速發展,對即插即用系統的需求也在不斷增長。本文提出的PAS方法,正是基于即插即用系統所實現的,通過簡單地增強輸入提示,并充分了利用底座LLM的優勢,不僅成本效益高,而且使得計算資源的利用更加優化。
本文從LMSYS-1M數據集和WildChat數據集中選擇高質量的Prompt,數據選擇過程包括三個主要步驟:
首先,使用SimCSE模型通過嵌入對Prompt進行去重,然后應用HNSW聚類算法對這些嵌入進行分組,并從每個聚類中提取少量數據以減少冗余。
隨后,進行質量篩選,使用BaiChuan 13b模型對數據進行評分,從而篩選出低質量的樣本,提高整體數據質量。
最后,利用BaiChuan內部標記的6萬個分類數據對BaiChuan 13b模型進行微調,然后使用該分類模型將Prompt歸類為常用的類別,如問答(Q&A)和編碼。這一系列步驟確保了數據的多樣性、質量和準確分類。
在自動補充Prompt數據生成階段,本文設計了一個基于少樣本學習(FewShot Learning)的自動化數據生成Pipeline。該算法主要包括兩個階段:
首先,在“數據生成”階段,研究者們利用一組精選的golden數據對上述每個類別中的Prompt進行少樣本學習(FewShot Learning),以生成相應的補充Prompt。這些golden數據包含了每個類別的少量示例,它們作為生成高質量(Prompt,補充Prompt)對的基礎。生成的“Prompt-補充Prompt”對隨后被添加到生成的數據集中。
為確保數據集的質量,在“數據選擇和再生”階段,每個生成的“Prompt-補充Prompt”對都會經過評估,以確定其正確性。如果評估結果不正確,該對會被移除,并重新進入“數據生成”階段,利用少樣本學習重新生成答案,直至生成正確答案。這一過程不斷迭代,直到所有的“Prompt-補充Prompt”對都達到預期的質量標準。
通過這一自動化的數據生成和嚴格的選擇再生流程,最終生成的數據集包含了大約9000個高質量的(Prompt,補充Prompt)對,這些數據被分為14個類別,每個類別包含大約500個數據,覆蓋了絕大多數常見的Prompt類別。
前述的數據生成Pipeline創建的高質量(Prompt,補充Prompt)數據對被用于微調選定的LLMs,以賦予它們自動生成補充Prompt的能力,從而得到PAS模型。當得到補充Prompt后,將其與原始Prompt進行拼接,輸入到下一個LLMs當中,生成最終的答案。
作為一個自動的提示補充工具,PAS可以集成到任何可用的LLMs中,通過公共API或開放參數進行集成。這種靈活性使得PAS能夠在不同的平臺和系統中廣泛應用,增強現有LLMs的能力,而無需進行廣泛的重新訓練或修改。
隨著LLM技術的應用和實踐經驗的不斷積累,“如何編寫Prompt”也逐步形成了一套新的方法論。然而,實際操作過的人可能都會有這樣的體驗:即使“理想再美好”,LLM實際輸出的結果往往與我們的預期存在一定的“小差距”。因此,不斷地調整和優化Prompt以縮小這些“小差距”無疑是一項既耗時又耗力的任務。
而本文提出的PAS系統就旨在解決這一痛點,通過自動化的Prompt補充,顯著提高了LLMs的性能,與之前最先進的模型BPO相比實現了超過6個百分點的提升。而PAS這一成果的取得也僅僅只使用了BPO 不到65%的微調數據量,進一步展示了PAS在數據效率上的優勢,為APE的研究和拓展提供了一個強有力的指導方向。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/131137.html
摘要:日前,活字格應用生成平臺發布版本,首次公開插件機制,強大的擴展性和系統集成能力,引起業內矚目。活字格也應運而生,伴隨強勢發布。 日前,活字格Web 應用生成平臺發布V4.0版本,首次公開插件機制,強大的擴展性和系統集成能力,引起業內矚目。 活字格是由西安葡萄城自主研發的 Web 應用生成平臺,提供易用的類Excel可視化設計器和靈活的定制能力,幫助使用者以無代碼或少寫代碼的方式,快速自...
摘要:關注的目標就是在代碼提交之后,順利且迅速的把新的功能部署到產品環境上。由于是,那么單元測試,回歸測試,集成測試,都是實現的手段。高質量的產品需求書和高質量的自動化集成測試用例毫無疑問,是高質量軟件的保證之一。 showImg(https://segmentfault.com/img/remote/1460000006877091?w=800&h=600); 什么是Test-Driven...
摘要:自制,即插即用微信網頁授權模塊,修改配置文件即可使用,開發測試版本倉庫歡迎交流和關注。因為它需要在文件中緩存和。 自制,即插即用微信網頁授權模塊,修改配置文件即可使用,開發測試版本CodeIgniter 3.0.6 Github倉庫: CodeIgniter-Weixin_Library歡迎交流和關注。 README.md CodeIgniter-Weixin_Library 即插即...
閱讀 2887·2025-01-02 11:25
閱讀 427·2024-12-10 11:51
閱讀 424·2024-11-07 17:59
閱讀 380·2024-09-27 16:59
閱讀 517·2024-09-23 10:37
閱讀 600·2024-09-14 16:58
閱讀 375·2024-09-14 16:58
閱讀 593·2024-08-29 18:47