彰顯AI科技能力！汽車之家倉頡大模型獲SuperCLUE汽車知識測評最高分

2025

08/15

11:08

評論

近日，專業(yè)中文大模型測評機構(gòu)SuperCLUE發(fā)布最新一期《SuperCLUE-AutoQA 中文大模型汽車知識測評基準總榜》。在此次測評中，汽車之家自研“倉頡大模型”以72.96分的總成績位居6個參評大模型榜首，較第二名領(lǐng)先13.63 分，優(yōu)勢尤為突出。這一佳績不僅充分印證了倉頡大模型在汽車垂直領(lǐng)域的卓越性能，為其在更多終端場景的應(yīng)用落地筑牢基礎(chǔ)，更直觀展現(xiàn)了汽車之家“ALL in AI”戰(zhàn)略轉(zhuǎn)型的堅定決心與階段性突破成果。

據(jù)了解，本次測評內(nèi)容涵蓋汽車咨詢、汽車對比、汽車推薦、汽車資訊、用車問題5個一級維度及11個二級子維度，旨在為中文大模型汽車知識領(lǐng)域的評估提供全面且多維的參考。測試題目由SuperCLUE機構(gòu)獨立開發(fā)，分為客觀題與主觀題兩類，通過兩輪測試綜合考量大模型在信息時效性、事實準確性、答案一致性和理解用戶意圖等方面的能力。測評結(jié)果顯示，在5個一級維度中，汽車之家倉頡大模型在汽車咨詢、汽車對比、汽車推薦、汽車資訊4個維度均位居第一；用車問題維度雖位列第二，但差距不足一分。

/tmp/webword_1008654665/upload_post_object_v2_3552302216

優(yōu)異成績的背后，是汽車之家倉頡大模型在模型能力、知識架構(gòu)和數(shù)據(jù)資源層面構(gòu)筑的三重壁壘。

著眼真實場景打造三大優(yōu)勢能力

深耕汽車行業(yè)20年，汽車之家對行業(yè)發(fā)展和用戶行為已有深刻理解，并以此為基礎(chǔ)重點優(yōu)化倉頡大模型的三項核心能力，使其更適應(yīng)當(dāng)下真實交互場景，為用戶提供更具價值的回應(yīng)。

首先，“懂用戶，善理解”。隨著汽車消費市場逐漸成熟，用戶向大模型咨詢選購建議時，通常會提出包含多個條件的明確需求，例如“家里有兩個小孩，預(yù)算20萬左右，想要空間大的SUV，最好是今年新款，有什么推薦嗎？”。這要求大模型具備在多條件中提取、整合并推理正確答案的能力。測評結(jié)果顯示，面對這類問題時，倉頡大模型的答案準確性顯著更高。

其次，“不順從，懂澄清”。新車型更新速度快，消費者難以及時掌握全部準確信息，提問中可能夾帶過時或錯誤內(nèi)容。測評記錄顯示，與通用大模型往往順應(yīng)用戶表述不同，倉頡大模型會先依據(jù)自身知識庫核實信息，識別其中不準確之處并向用戶澄清，確保回答基于真實有效的數(shù)據(jù)。

最后，“不編造，給解法”。實際交流中，部分提問本身不存在有效答案，例如用戶詢問“一款已停產(chǎn)車型的最新優(yōu)惠政策”。面對這種情況，倉頡大模型不會隨意編造答案，而是明確告知車型已停售，補充相關(guān)二手車行情信息，同時推薦具有類似特點的在售車型，幫助用戶獲得更具參考價值的選擇。

提升信息質(zhì)量構(gòu)建專業(yè)知識圖譜

對于大模型而言，調(diào)用信息的質(zhì)量直接影響輸出結(jié)果。為提升回答準確度、最大程度降低AI幻覺出現(xiàn)概率，汽車之家發(fā)揮垂直領(lǐng)域優(yōu)勢，為倉頡大模型構(gòu)建了全新的信息檢索鏈路。

目前，通用大模型較多采用對用戶提問即時檢索、擴散搜索的方式，即全網(wǎng)搜索包含相關(guān)信息的網(wǎng)頁，再從網(wǎng)頁中提煉、分析和推理后給出回復(fù)。在自媒體盛行的當(dāng)下，互聯(lián)網(wǎng)信息質(zhì)量良莠不齊，采用這一方式的大模型難免接觸大量噪音信息，這也是通用大模型幻覺率較高的主要原因。

而汽車之家依托完備的車型庫體系、海量專業(yè)測評結(jié)果、真實口碑信息和全面汽車百科，為倉頡大模型搭建了完整的結(jié)構(gòu)化汽車領(lǐng)域知識庫和知識圖譜。因此，倉頡大模型在回答用戶提問時，僅需在這些高質(zhì)量信息中篩選總結(jié)，排除了絕大部分干擾信息，既提升了信息處理效率，又有效保障了回答準確率。

挖掘數(shù)據(jù)資產(chǎn) 筑起專有信息壁壘

數(shù)據(jù)量是影響大模型推理結(jié)果的另一重要因素。QuestMobile發(fā)布的《2025中國移動互聯(lián)網(wǎng)半年大報告》顯示，2025年6月，汽車之家全景生態(tài)總用戶量達5.02億，日均用戶量達8151.91萬。龐大的用戶體量疊加20年積累，為倉頡大模型提供了豐厚的數(shù)據(jù)資產(chǎn)，其中大量私有化數(shù)據(jù)更是價值顯著。

不可否認，汽車之家網(wǎng)站發(fā)布的公開信息，通用大模型也可獲取。因此，正是私有化數(shù)據(jù)的加持，讓倉頡大模型在汽車知識領(lǐng)域?qū)崿F(xiàn)“遙遙領(lǐng)先”——用戶瀏覽行為、最新成交底價、真實續(xù)航里程等未經(jīng)加工的、通用大模型無法獲得的數(shù)據(jù)筑起牢固的信息壁壘，使倉頡大模型相比通用大模型能更深刻理解業(yè)務(wù)場景、更準確識別用戶意圖、更全面進行推理思考，最終給出更具價值的回答。

通過本次測評，也能發(fā)現(xiàn)倉頡大模型在部分方面仍有提升空間。對此，汽車之家CTO項碧波表示：“成立20年以來，汽車之家一直堅持‘用戶第一’的價值觀，不斷在內(nèi)容、產(chǎn)品、技術(shù)、服務(wù)上投入，優(yōu)化用戶看車、買車、用車、換車的體驗。在AI時代，汽車之家敏銳意識到AI技術(shù)有機會幫助我們跨越式提升用戶體驗，因此在2025年將‘ALL in AI’作為公司核心戰(zhàn)略。倉頡大模型正是為更好解決汽車領(lǐng)域問題而專門研發(fā)的行業(yè)大模型，我們始終認為‘行業(yè)問題需要用行業(yè)大模型來解決’。感謝SuperCLUE的測評和反饋，其全面、務(wù)實的評價體系讓我們對自研的倉頡大模型有了更客觀的認識。倉頡大模型在汽車知識領(lǐng)域取得的領(lǐng)先優(yōu)勢，堅定了我們持續(xù)投入的信心；同時評測反饋的問題也讓我們更清晰地認識到需要提升的方向。汽車之家將繼續(xù)依托20年行業(yè)深耕和全景生態(tài)數(shù)據(jù)優(yōu)勢，不斷迭代模型的理解力、推理力與執(zhí)行力，讓AI真正懂車、懂用戶、懂場景，并將倉頡大模型的能力應(yīng)用到各個業(yè)務(wù)場景中，為所有買車用戶提供選車省心、買車省錢的智能服務(wù)。”

據(jù)了解，SuperCLUE是大模型時代CLUE基準的發(fā)展與延續(xù)。后者發(fā)起于2019年，是一項致力于科學(xué)、客觀、中立的語言模型測評基準。SuperCLUE基于多年測評經(jīng)驗，結(jié)合通用大模型在學(xué)術(shù)、產(chǎn)業(yè)與用戶側(cè)的廣泛應(yīng)用，構(gòu)建了多層次、多維度的綜合性測評基準，其測評結(jié)果在業(yè)內(nèi)廣受認可并被廣泛引用。

THE END

廣告、內(nèi)容合作請點擊這里尋求合作

免責(zé)聲明：本文系轉(zhuǎn)載，版權(quán)歸原作者所有；旨在傳遞信息，不代表砍柴網(wǎng)的觀點和立場。

国产乱了高清露脸对白-日韩高清在线一区-激情三级hd中文字幕,亚洲一区二区视频免费观看,亚洲精品色综合av网站,女性私密紧致按摩电影

彰顯AI科技能力！汽車之家倉頡大模型獲SuperCLUE汽車知識測評最高分

相關(guān)熱點

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產(chǎn) Apple Car 汽車電池

關(guān)注我們