天眼查財產線索信息顯示,5月9日,科大訊飛股份有限公司申請的“領域問答大模型訓練及問答方法、相關設備及程序產品”專利公布。
摘要顯示,本申請引入了裁判模型,能夠對輸入的答案進行偏好打分,評估答案的質量?;陬I域知識庫提取領域問答數(shù)據(jù),在對初始大模型進行迭代訓練時由裁判大模型對初始大模型生成的領域問題對應的第一答案,和領域問答數(shù)據(jù)中的第二答案分別打分,基于打分結果選取滿足偏好要求的答案與領域問題組成目標訓練數(shù)據(jù),利用目標訓練數(shù)據(jù)對初始大模型進行訓練,得到最終的領域問答大模型,其采用了高質量的領域問答訓練數(shù)據(jù)進行訓練。本申請不需要人工對提取的領域問答數(shù)據(jù)進行校對即可得到高質量的目標訓練數(shù)據(jù),節(jié)省了人工成本,提高了訓練效率。