(資料圖片)
據(jù)證券時報報道,日前,度小滿開源國內(nèi)首個千億級中文金融大模型“軒轅”。
據(jù)介紹,該大模型在金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等任務(wù)上,效果相較于通用大模型大幅提升。
度小滿有關(guān)人員表示,為提升軒轅大模型對金融領(lǐng)域問題的理解能力,該公司將自身業(yè)務(wù)中積累的金融領(lǐng)域的千億tokens的中文預(yù)訓(xùn)練數(shù)據(jù)集用來訓(xùn)練模型。該數(shù)據(jù)集涵蓋了金融研報、股票、基金、銀行、保險等各個方向的專業(yè)知識。
度小滿工作人員稱,經(jīng)過清洗和標注的高質(zhì)量數(shù)據(jù)集,不僅在通用性方面與ChatGPT達到持平成為可能,且顯著提升了模型在金融垂直領(lǐng)域的性能。