News information
【開云電競智能科技】據開云電競了解,2月7日,騰訊科技(深圳)有限公司申請的“大語言模型的訓練方法、裝置、計算機設備及存儲介質”專利正式公布。這一技術通過在模型訓練中引入多重摘要文本的對比學習機制,顯著提升了模型的泛化能力與生成準確性,為AI語言處理領域提供了新的方向。

根據專利摘要,騰訊的新方法創新性地引入“第一摘要文本”與“第二摘要文本”,兩者信息量不同且前者包含正確與錯誤語句的混合。模型通過對比這兩種摘要,學習區分正確與錯誤表達,同時減少單一數據源導致的過擬合問題。這種設計不僅擴展了模型的學習維度,還通過動態調整優化了生成結果的可靠性。


開云電競注意到,該方法與近年來對比學習在文本摘要領域的應用趨勢相契合。此前研究顯示,對比學習通過構造正負樣本調整模型表示空間,已在提升摘要質量、緩解暴露偏差等方面取得成效。騰訊此次將對比學習框架融入大語言模型訓練,進一步拓展了該技術的應用邊界。
有媒體分析稱,騰訊的專利通過多樣化摘要文本及對比機制,為模型提供了更貼近真實應用的學習環境,尤其對智能客服、內容生成等需高精度輸出的領域具有直接意義。此外,該技術或能加速大模型落地進程。例如,在短文本對話場景中,騰訊曾推出基于混合注意力機制的對話模型專利,若結合新訓練方法,有望進一步提升回復的相關性與豐富性。
可以看到,騰訊近年來在大語言模型領域動作頻頻,從2023年的微調方法專利到此次訓練框架創新,顯示出其全鏈條技術布局的野心。
版權所有,未經許可不得轉載
-開云電競