飛象原創(魏德齡/文)通用大語言模型使用得越多,就越會發現它的不專業。即便是搜索行業資料,也可能會讓某一領域的知識與毫不相干的內容產生邏輯推理關聯,甚至會把多個數據當成一道道應用題,從而在幻覺中編造數據,讓人誤以為真。
通用大模型之于電信領域自然也出現了專業性的問題,在真實的電信環境中,認知局限性問題使其還難以真正應用于行業。
通用大模型的局限性
今年2月份的一項測試表明,GPT-4在專門評估電信知識的TeleQnA數據集上得分不到75%,在基于3GPP標準文檔的3GPPTdocs Classification數據集上得分甚至低于40%。微軟的輕量模型Phi-2在包含500道通用數學題的MATH500基準測試中僅取得10%的得分。
SK電訊此前在開發網絡操作助手的過程中也發現,盡管作為一項風險最低的任務,但在使用通用大語言模型+RAG的情況下,準確率卻低于60%,無法達到商用標準。另外,將通用LLM應用于客服場景的多項任務時,調查顯示滿意度僅為約40%。
在AI與通信領域的融合成為行業未來方向的大背景之下,LLM在處理電信技術知識、合規要求以及網絡故障排查方面顯然暴露出了能力不足的問題。
其中的原因在于,電信網絡擁有著復雜且深入的專業知識。開發人員需要將分散的復雜知識整合為統一數據庫,構建電信專業大語言模型及嵌入模型所需的訓練數據集。數據類型可能包括專業知識、設備手冊、標準文檔、應急處理文檔和行業術語。
英偉達此前在GTC大會上又這樣解釋電信大模型與通用大模型所存在的本質區別,關鍵在于語言信息內容的不同,網絡數據超越了文本、視頻和圖像,還包括日志、模擬信息、架構圖等信息。為了能夠助力人工智能理解電信網絡中每天產生的百萬連接與超3800TB的數據,就需要訓練能夠理解網絡語言的專用電信模型。
聚焦電信大模型
基于此,電信大模型自然成為行業聚焦點,對于這一概念在模型的命名上不同的廠商盡管有所差異,但又殊途同歸,例如,SK電訊自研的電信大語言模型(Telco LLM),英偉達的產品為多模態大語言模型LTM(Large Telco Model),其中電信與模型成為核心關鍵詞。
GSMA也已經推出GSMA Open-Telco LLM Benchmarks,旨在提升大語言模型(LLM)在電信領域應用表現的開源社區。該社區提供了業內首個用于評估AI模型在真實電信用例中表現的框架,并得到了Hugging Face、哈利法大學、Linux基金會以及多家領先的移動網絡運營商和廠商的支持。支持該項目發布的電信運營商包括Deutsche Telekom、LG Uplus、SK電訊和土耳其電信,以及技術供應商華為。
SK電訊的Telco LLM的微調流程從一個預訓練的基礎模型開始,例如Claude或GPT,在數萬億個Token上進行訓練后,通過電信任務數據和指令數據對基礎模型進行微調得到。據稱該模型對電信領域具有深入理解,是一個強大的領域專用基礎模型。之后,可以進一步基于特定用例的數據與人工反饋數據進行精調,使其更易快速集成至具體產品和服務中。
英偉達專門為電信行業定制的多模態大語言模型LTM能夠作為網絡AI智能體的核心組成部分,自動化復雜的決策流程、提高運營效率與員工效率,并增強網絡性能。該模型利用NVIDIA AI Enterprise軟件平臺中的NVIDIA NIM和NeMo微服務,推動新一代AI在網絡運營中的應用。LTM能夠使AI智能體掌握電信網絡的專屬語言,理解實時網絡事件、預測故障,并自動化解決方案。借助NVIDIA NIM微服務,LTM能夠高效、精準、低延遲地針對電信工作負載進行優化。
電信大模型在實際業務中的工作職責與其他行業AI相似,目前也是先從助手的角色做起。
先從助手做起
客服助手是目前很多運營商所選擇的AI率先落地領域。由于電信知識和業務邏輯已嵌入在模型中,不再需要冗長、復雜、難維護的提示,從而大幅降低服務成本。客服人員可以在日常對話的過程中,即時獲得大模型所給出的提示,AI依據用戶的對話可以提取出關鍵詞與主題,再與專業知識庫中的內容相結合,帶來準確、有邏輯、貼近業務需求的輔助提示。
電信運營商還會對電信大語言模型進行分詞器優化,使得模型能夠更好地理解和處理文本的含義,并且符合服務地語言的語境和表達方式,讓其所服務的當地語種也能達到與Llama3和GPT-4相近的性能表現。
在網絡優化方面,不久前軟銀也曾演示過關于體育場突發流量的優化案例,操作人員只需通過對話敘述“明天將會在東京某體育場舉行棒球比賽,我需要如何準備?”的網絡需求情況,該模型作為NVIDIA NIM微服務的一部分,便可根據網絡流量的變化自動調整網絡配置,從而在幾分鐘內實現對網絡資源的分配。而這項任務在過去最長可能需要幾天來進行。
面向未來,電信大模型還會驅動智能體從而扮演網絡優化中的不同角色,包括網絡規劃代理、網絡規劃代理、網絡健康代理、網絡運營中心代理、網絡保障代理與網絡部署代理。例如,通過NVIDIA AI Enterprise提供的額外工具所構建的網絡AI智能體,能夠實現包括減少宕機時間、優化客戶體驗與增強安全性等能力。AI智能體可以通過預測故障來減少宕機時間,從而提升網絡韌性。同時,AI驅動的優化能夠加快網絡速度、減少故障,確保用戶享受無縫連接。此外,AI還能持續掃描網絡威脅,并實時降低網絡攻擊風險,全面增強網絡安全性。
從目前的試水情況來看,“助手”一職顯然還證明處在AI處在極早期的階段,電信大模型還有很長的路要走,證明該領域絕非簡單灌注數據就能標榜為“專業”,AI想要助力電信業突破香濃極限,還要先能夠做到專業知識的融會貫通,而非簡單的班門弄斧。