近日,西安電子科技大學(xué)計算機科學(xué)與技術(shù)學(xué)院沈玉龍教授團(tuán)隊在密碼大模型方面取得突破性進(jìn)展。研究成果以“玄知大模型”命名在西部網(wǎng)絡(luò)安全大會上正式發(fā)布。
2025年8月15日,第四屆西部網(wǎng)絡(luò)安全大會在陜西周至召開。西安電子科技大學(xué)計算機科學(xué)與技術(shù)學(xué)院沈玉龍教授團(tuán)隊發(fā)布了一款全球首個面向密碼學(xué)領(lǐng)域的大語言模型——玄知大模型(CryptoLLM)。該模型的發(fā)布標(biāo)志著密碼學(xué)進(jìn)入智能化發(fā)展新階段,為密碼算法分析、協(xié)議設(shè)計與工程實現(xiàn)提供了全流程的智能支持,開啟密碼學(xué)AI應(yīng)用新紀(jì)元。
大會現(xiàn)場(西安電子科技大學(xué)供圖)
玄知大模型由西電NSS實驗室沈玉龍教授團(tuán)隊研發(fā),基于國產(chǎn)開源大模型構(gòu)建,融合超百億級密碼學(xué)專業(yè)數(shù)據(jù)與分階段精調(diào)策略,在三大關(guān)鍵能力上實現(xiàn)突破:密碼算法智能分析:自動識別算法缺陷,輔助安全性驗證與漏洞定位;密碼協(xié)議智能設(shè)計:支持協(xié)議設(shè)計與安全推理,提升協(xié)議生成效率與質(zhì)量;密碼工程高效實現(xiàn):實現(xiàn)密碼庫集成、自動代碼生成及部署優(yōu)化。
當(dāng)前,全球密碼技術(shù)競爭已上升至國家戰(zhàn)略博弈層級,直接關(guān)乎國家安全、科技話語權(quán)乃至未來國際秩序重塑。掌握密碼核心技術(shù),即掌握數(shù)字時代的主導(dǎo)權(quán)。傳統(tǒng)研究范式已難以應(yīng)對快速演進(jìn)的安全威脅。
西安電子科技大學(xué)作為我國密碼學(xué)研究的發(fā)源地,擁有軍外唯一國家級密碼學(xué)重點學(xué)科,被譽為“密碼學(xué)黃埔軍!保瑸閲遗囵B(yǎng)大批頂尖人才。傳承先輩使命,西電NSS團(tuán)隊以玄知大模型為支點,肩負(fù)起智能時代密碼學(xué)創(chuàng)新的歷史責(zé)任,推動密碼技術(shù)從“護(hù)衛(wèi)國家安全”向“賦能數(shù)字文明”跨越。
發(fā)布現(xiàn)場(西安電子科技大學(xué)供圖)
為打造玄知大模型的核心競爭力,團(tuán)隊組建超百人專項數(shù)據(jù)工程組,歷時6個月攻堅,建成規(guī)模達(dá)50Btokens的垂直領(lǐng)域知識池——全面覆蓋密碼學(xué)權(quán)威著作、頂會論文、開源協(xié)議庫、算法代碼庫及技術(shù)博客等多元高價值數(shù)據(jù)源。
團(tuán)隊自主研發(fā)全棧式數(shù)據(jù)處理平臺,實現(xiàn)多模態(tài)數(shù)據(jù)的深度結(jié)構(gòu)化解析:論文智能解析系統(tǒng):精準(zhǔn)提取公式、圖表及算法描述語義,突破非結(jié)構(gòu)化數(shù)據(jù)處理瓶頸;代碼知識蒸餾引擎:自動構(gòu)建調(diào)用鏈拓?fù),完成安全關(guān)鍵點的形式化驗證; 跨模態(tài)語義對齊:實現(xiàn)文本、代碼、數(shù)學(xué)符號的聯(lián)合表征建模。
基于此構(gòu)建的千萬級精標(biāo)指令數(shù)據(jù)集,通過雙輪人工校驗機制,確保指令集兼具場景覆蓋廣度與專業(yè)認(rèn)知深度,為模型訓(xùn)練提供高價值知識基座。
在模型訓(xùn)練中,基于國產(chǎn)開源千問2.5通用模型,采用了分階段微調(diào)策略。該策略通過四個遞進(jìn)階段:沉淀行業(yè)知識、淬煉行業(yè)技能、對話交互增強、強化人類偏好,全面提升了模型在密碼學(xué)領(lǐng)域的通用能力基礎(chǔ),并在特定密碼任務(wù)上達(dá)到專家級水平。最終模型不僅能精準(zhǔn)解析密碼學(xué)專業(yè)語言,更能進(jìn)行類人推理、設(shè)計與優(yōu)化,為密碼學(xué)領(lǐng)域提供強大的智能解決方案。
西安電子科技大學(xué)同步發(fā)布全球首個密碼學(xué)專業(yè)測評基準(zhǔn)CryptoBench,填補領(lǐng)域空白。該基準(zhǔn)覆蓋密碼算法/協(xié)議/工程三大板塊、12個核心方向、74個細(xì)分領(lǐng)域,包含10,000+道精編題目,實現(xiàn)能力邊界精準(zhǔn)探測。建立版本迭代流程,持續(xù)適配密碼技術(shù)演進(jìn)需求。
在權(quán)威測評基準(zhǔn)CryptoBench的全面評估中,玄知大模型(CryptoLLM)展現(xiàn)出全球領(lǐng)先的密碼學(xué)專業(yè)能力:其綜合性能超越當(dāng)前最優(yōu)模型GPT-4o達(dá)8.8%,并在密碼算法分析(+8.6%)、協(xié)議設(shè)計(+6.8%)、工程實現(xiàn)(+5.1%)三大核心維度全面領(lǐng)先GPT-4o、Claude4.0、Gemini2.5等國際頂尖產(chǎn)品。
在對稱加密、安全模型證明等12個細(xì)分方向中的11項顯著優(yōu)于國際競品。值得注意的是,該成果基于僅32B參數(shù)的國產(chǎn)基座模型實現(xiàn),驗證了專領(lǐng)域深度定制,能夠帶來小領(lǐng)域中質(zhì)的飛躍。
玄知大模型聚焦密碼工程實際應(yīng)用,面向產(chǎn)業(yè)界提供開放API與SDK工具包,顯著降低密碼技術(shù)應(yīng)用門檻。模型已支持在安全多方計算、隱私計算等核心領(lǐng)域廣泛應(yīng)用。(西安電子科技大學(xué)供稿)

關(guān)注精彩內(nèi)容