數據分析與AI丨在企業環境中利用知識圖譜賦能生成式 AI

如今,各行各業對生成式人工智能(GenAI)的參與度遠超以往。GenAI 發展迅猛,不斷帶來新的機遇與價值。然而,對企業而言,實施 GenAI 常面臨諸多挑戰,或覺其難以駕馭,或擔憂風險過高。

盡管存在一定局限,但技術的進步以及知識圖譜等工具的出現,正不斷強化 GenAI 的數據分析能力。在用戶 AI 環境中引入知識圖譜,能夠讓模型輸出更精準、一致,且具備可追溯性,同時保障數據安全與隱私。

Gartner 分析師指出,知識圖譜是企業構建更先進 GenAI 解決方案的關鍵基礎設施。知識圖譜包含語義層,即ontology(本體論),它能賦予企業特有數據在專業領域的清晰、全面業務含義。這一本體可作為基礎上下文,為分析處理及數據建立終端用戶問題與數據之間的映射關系。此外,大語言模型(LLM)與知識圖譜技術相結合,可以使用概念模型作為上下文提供可信、經過驗證的輸出。

數據分析與AI丨在企業環境中利用知識圖譜賦能生成式 AI的圖1

01.GenAI 的局限性

GenAI 并非完美無缺,在實際應用中仍然存在不少限制和挑戰:

? 精確性不足:

在對精確性要求極高的場景下,GenAI 通常表現欠佳。許多模型在處理簡單數學和邏輯問題時會遇到困難,比如讓 LLM 輸出圓周率小數點后幾百位,往往難以得到正確結果。

在圖像生成方面,即便能生成部分細節正確的圖片,但需要微調的細節也很難達到理想效果。

? 易產生幻覺:

LLM 看似知識淵博,實則不然。其知識源于訓練數據、字母組合概率等,響應是基于訓練學習路徑和相似概念生成,并非來自結構化知識庫或數據庫。

而且,在沒有使用新數據訓練時,LLM 也無法提供最新信息,信息局限于訓練截止日期。這使得 LLM 容易產生看似可信但實際錯誤的 “幻覺” 信息,誤導對相關領域了解不足的用戶。

? 存在偏見:

LLM 依據數據模式生成響應,缺乏真正的理解,這導致其訓練數據易受偏見和限制影響,進而使輸出響應也帶有同樣的問題,而不會考慮用戶感受。

不過,也有應對這些局限的方法。例如,當在提示中包含上下文基礎時,GenAI 的表現會有所提升。將 LLM 生成的響應限制在給定上下文信息內,若上下文準確,響應也可能更準確,這種技術被稱為檢索增強生成(RAG)技術。

很多主流搜索引擎已開始將 RAG 技術與現有搜索索引結合,以有效生成對搜索問題的答案,通常還會提供用于為LLM提供上下文的網頁參考URL。知識圖譜作為 RAG 的重要新形式,為生成或利用上下文基礎的技術提供支持。

即使在上下文基礎不太具體且更依賴于從訓練數據中獲得現實世界知識的場景下,GenAI 也能發揮作用,如生成營銷內容、創作詩歌故事、頭腦風暴創意等無標準答案的任務。目前,大多數 GenAI 解決方案采用結合多種方法的技術組合。

02.知識圖譜如何強化企業數據并支持 GenAI 解決方案

知識圖譜不僅能可視化數據,更重要的是,其語義建模和描述為企業數據賦予了有意義的上下文。本體論作為概念模型,以業務用戶和領域專家熟悉的術語描述數據,簡化數據集成,促進語義層的形成,方便添加和連接新數據,提升數據發現、理解和重用的效率,推動業務價值。

對知識圖譜的查詢提供了數據基礎,為不同的用戶提供了定制化的服務和體驗。知識圖譜既是集成數據源的工具,也是應用本體模型的結果,構建起全面且可操作的知識資源。

目前,知識圖譜主要通過以下方式賦能 GenAI 解決方案:

? 提供豐富上下文:

知識圖譜將數據源整合到多維模型中,提供比傳統數據庫更深入的信息,有助于 AI 理解復雜的現實世界和特定領域主題,提升 AI 模型準確性和輸出相關性。

? 本體驅動對齊:

以抽象且人類可讀的語言描述數據,使 LLM 與文本語言訓練方式一致,促進更加精確的上下文感知 AI 解決方案,還能輔助生成更準確的圖形查詢。

? 捕獲復雜關系與推理:

知識圖譜可捕捉復雜數據關系并進行高級推理,提取關聯信息,為用戶的臨時性問題生成相關且有深度的答案。

? 具備擴展性與語義精度:

知識圖譜持續發展,包含實時分析和聚合計算所需數據,確保 AI 輸出的時效性和準確性。

? 助力微調或訓練 LLM:

訓練對于將內部數據融入解決方案至關重要。讓 LLM 學習本體和參考數據,可提升其輸出質量。

? 支持 RAG:

知識圖譜通過創建文本片段并矢量化,支持 RAG 方法。LLM 利用向量嵌入檢索相關信息,為響應輸出提供寶貴的上下文內容。

? 提供實時計算的上下文基礎:

當數據訪問需要動態變化時,知識圖譜可提供即時計算的上下文基礎,使 LLM 響應根據輸入實時調整,確保準確性。

? 融合向量嵌入與圖形屬性:

數據庫中的向量將統一資源標識符(URIs)作為元數據存儲,與圖形屬性融合的向量嵌入豐富了數據表示,提升 AI 的基礎上下文理解和決策能力。

? 提示編排:

像Langchain、LlamaIndex和Haystack一樣,基于GenAI的解決方案通過開源框架提供。這些框架利用知識圖譜技術,根據用戶需求和解決方案對企業的作用,通過一系列提示和工具調用不同技術,編排利用知識圖譜數據。

? 打造對話界面:

用戶可與知識圖譜中的運營數據進行交互式對話。對話界面依托本體,使 LLM 能以文本、表格和圖表形式回答用戶問題。

03.結論

知識圖譜與 GenAI 的結合是現代數據堆棧的重要組成部分。二者的融合能夠挖掘企業數據生態系統中的潛在價值。

知識圖譜讓數據更易獲取和理解,既有利于常規分析,也為 GenAI 提供堅實基礎。企業用戶可利用知識圖譜提升數據質量和準確性,整合新舊數據以理解復雜關系,將傳統數據庫升級為多維框架。

Altair? Graph Studio?作為企業級數據發現和集成工具集,可用于托管知識圖譜。用戶能夠清理、協調和互連多源數據,簡化對結構化和非結構化數據的訪問。

Graph Studio 擁有集成多數據源的統一數據層,可快速解答用戶的臨時性問題,將分散的數據整合為企業專屬的互連數據架構。

如您對Altair Graph Studio感興趣

歡迎掃描二維碼申請產品咨詢

數據分析與AI丨在企業環境中利用知識圖譜賦能生成式 AI的圖2



欲了解有關Altair Graph Studio的更多信息,請訪問:https://altair.com/altair-graph-studio。

欲了解有關 Altair RapidMiner的更多信息,請訪問:https://altair.com/altair-rapidminer-platform-zh-cn。

關于 Altair 澳汰爾

Altair 是計算智能領域的全球領導者之一,在仿真、高性能計算 (HPC) 和人工智能等領域提供軟件和云解決方案。Altair 能使跨越廣泛行業的企業們在連接的世界中更高效地競爭,并創造更可持續的未來。

公司總部位于美國密歇根州,服務于16000多家全球企業,應用行業包括汽車、消費電子、航空航天、能源、機車車輛、造船、國防軍工、金融、零售等。

欲了解更多信息,歡迎訪問:

www.altair.com.cn

數據分析與AI丨在企業環境中利用知識圖譜賦能生成式 AI的圖3

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP