【自動對焦:知識圖譜】1、知識圖譜(Knowledge Graph),在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發(fā)展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯(lián)系。
知識圖譜,是通過將應用數(shù)學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現(xiàn)分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發(fā)展歷史、前沿領域以及整體知識架構達到多學科融合目的的現(xiàn)代理論。
2、Neo4j知識圖譜擅長繪制復雜、相互關聯(lián)的供應鏈,即使應對海量數(shù)據也能保持高性能。固有的以關系為中心的方法使他們能夠更好地管理、讀取數(shù)據并實現(xiàn)可視化。與傳統(tǒng) SQL 數(shù)據庫相比,Neo4j圖數(shù)據庫的查詢響應速度通???00倍。

 

 

應勢而為 圖數(shù)據科學在中國大行其道

 

 

作者:Neo4j大中華區(qū)總經理方俊強

 

呈指數(shù)級增長的大數(shù)據已然超過了傳統(tǒng)數(shù)據庫的管理范疇。信息不僅在數(shù)量上增加,而且也更加復雜。企業(yè)正在構建與運營和客戶相關的龐大數(shù)據存儲庫,每個實體都有多個信息點和信息層。問題在于如何以有意義和及時的方式存儲、處理和分析數(shù)據。

 

許多企業(yè)正轉向圖數(shù)據科學存儲數(shù)據并產生洞察力。對圖數(shù)據科學的需求不斷增加,遍及各行各業(yè),包括金融服務、旅游、零售、公共部門和醫(yī)療保健等,希望解決其復雜的問題。

 

數(shù)據庫平臺 vs 圖數(shù)據科學平臺

 

如今,通過二維或電子表格顯示客戶數(shù)據庫是一種極其有限的方法。這種方法可以存儲和查詢數(shù)據,但在數(shù)千行和單元格中,查詢模式并不是一個簡單或快速的過程。實現(xiàn)不同領域數(shù)據的關聯(lián)極其困難:例如,不僅要確定客戶是誰,還包括他們購買了什么、如何購買、在哪里購買以及為何購買。

 

Neo4j圖數(shù)據科學利用數(shù)十億甚至數(shù)萬億個數(shù)據點之間的關聯(lián)和關系,讓連接的數(shù)據“自己說話”,例如運行無監(jiān)督圖算法在噪聲中發(fā)現(xiàn)信號。通過客戶數(shù)據庫,可以顯示客戶在社區(qū)如何互動,對數(shù)據分類提供有用信息。

 

使用圖捆綁產品和服務可以實現(xiàn)數(shù)據價值最大化,建立每個產品和服務的統(tǒng)一數(shù)據庫及其規(guī)則和關系,以確保捆綁適當?shù)姆铡碛蠳eo4j圖數(shù)據庫使企業(yè)更容易管理其商業(yè)產品線層次結構。

 

另一個實例是一家主流汽車制造商通過創(chuàng)建用于測試數(shù)據的知識圖譜可以縮短新車的上市時間。來自不同領域的工程師一直在以多種方式進行測試,并使用不同工具以各種格式存儲測試數(shù)據。這導致了數(shù)據的不一致和孤立,對其他團隊毫無用處。相反,Neo4j知識圖譜關聯(lián)了所有的產品驗證生命周期數(shù)據,并允許在企業(yè)內整合領域和功能,定義關鍵元數(shù)據,例如測試類型、測量特征和測量條件。為測試、子測試和測量定義明確的語義,使工程師能夠跨域和平臺溝通。

 

預測而非應對的方法

 

在競爭激烈的行業(yè)中,企業(yè)需要領先一步。 例如,金融機構通常會在欺詐已經發(fā)生時才來解決。借助Neo4j圖數(shù)據科學,個人和實體之間的可疑關聯(lián)變得可見,可以更早地實施干預。知識圖譜可以識別鏈接個體的鏈條和環(huán),對與可疑實體有關聯(lián)的關系做質量、數(shù)量和距離的評分。

 

當識別出一個欺詐圈時,也可以使用相似度算法來識別數(shù)據中其他潛在欺詐圈。一旦確定了預測特定結果的模型,即可在未來生成更精準的預測。

 

某財政部正使用Neo4j圖數(shù)據科學繪制約150,000個人、公司和文件,以及這些實體之間的約750,000個關系。如果檢測到可疑交易,則會分析圖中所有與案例相關的信息和文件。法律專家還可以發(fā)現(xiàn)僅在第二或第三層次上才明顯的關系,而不是只關注表層關系。

 

解鎖供應鏈

 

過去幾年,供應鏈面臨極大挑戰(zhàn)。上海和香港等許多港口都強烈感受到這一點,這些港口是全球主要的樞紐和貨物運輸中轉站。解鎖極其復雜的路線和參與者網絡,嘗試重新安排每天穿越海洋的數(shù)萬艘集裝箱船只的路線是一項極具挑戰(zhàn)性的任務。

 

就本質而言,供應鏈管理是動態(tài)的,有許多變化的環(huán)節(jié),并且可能在任何給定點出現(xiàn)瓶頸。但傳統(tǒng)數(shù)據庫生成的數(shù)據量大、細節(jié)多,缺乏實時、準確的信息處理能力。

 

相比較,Neo4j知識圖譜擅長繪制復雜、相互關聯(lián)的供應鏈,即使應對海量數(shù)據也能保持高性能。固有的以關系為中心的方法使他們能夠更好地管理、讀取數(shù)據并實現(xiàn)可視化。與傳統(tǒng) SQL 數(shù)據庫相比,Neo4j圖數(shù)據庫的查詢響應速度通常快100倍。

 

圖數(shù)據科學對中國企業(yè)而言擁有巨大的應用潛力,中國占全球人口的1/5,不僅人口眾多,也是經濟增長最快的地區(qū)之一。通過圖數(shù)據科學等技術充分利用大數(shù)據潛力的企業(yè)理當成為其所在領域的領導者。