【文章導(dǎo)讀】:1、知識圖譜是人工智能 (AI) 以及人類知識發(fā)展的基礎(chǔ)支柱之一,是對人、物、位置、事件和概念等實體的相互關(guān)聯(lián)世界的真實描述,為數(shù)據(jù)集成、管理和分析提供框架。
隨著關(guān)聯(lián)數(shù)據(jù)、人工智能以及數(shù)據(jù)分析日益發(fā)展,知識圖譜技術(shù)的應(yīng)用不斷增加,成為各個行業(yè)業(yè)務(wù)的主流需求。IDC預(yù)測,全球 65%的GDP將實現(xiàn)數(shù)字化,2022年至2023年將推動超過6.8萬億美元的支出。而到2023年,亞太地區(qū)20%的商業(yè)智能將整合知識圖譜。
Neo4j知識圖譜尋找隱藏在復(fù)雜關(guān)聯(lián)事件中的模式,在更短的間隔內(nèi)以可擴展的方式從具有復(fù)雜上下文情景的大量數(shù)據(jù)中獲取有價值的信息,用戶可以對基礎(chǔ)數(shù)據(jù)進行推理并自信地使用其進行復(fù)雜的決策。
 
2、整體而言,數(shù)據(jù)科學(xué)家并不喜歡數(shù)據(jù)庫,他們更加鐘愛數(shù)據(jù)。而圖數(shù)據(jù)庫是個例外,越來越多的數(shù)據(jù)科學(xué)家對圖數(shù)據(jù)庫青睞有加。數(shù)據(jù)科學(xué)家使用圖形算法處理數(shù)據(jù),再通過圖將數(shù)據(jù)輸入機器學(xué)習(xí)管道中,從而為機器學(xué)習(xí)模型和預(yù)測提供關(guān)系型信號。由此,圖數(shù)據(jù)庫成為機器學(xué)習(xí)管道中的核心部分。
不同于關(guān)系型數(shù)據(jù)庫,圖數(shù)據(jù)庫以事物的連接方式為中心,強調(diào)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,它將數(shù)據(jù)間的聯(lián)系視為和數(shù)據(jù)本身同等重要。圖數(shù)據(jù)平臺讓用戶能夠在圖數(shù)據(jù)庫上開發(fā)和運行應(yīng)用程序,它直接將關(guān)系和數(shù)據(jù)在物理層面上一并存儲下來,使得訪問數(shù)據(jù)結(jié)點和關(guān)系的操作能夠以線性時間復(fù)雜度完成。在普通PC機上的測試結(jié)果表明,Neo4j圖數(shù)據(jù)庫的查詢引擎能夠在一秒內(nèi)輕松遍歷百萬級的關(guān)系/邊。
 
 
 
 
知識圖譜賦能企業(yè)數(shù)字化轉(zhuǎn)型
 
 
 
 
 
 
 
作者:Neo4j大中華區(qū)總經(jīng)理方俊強
 
相互關(guān)聯(lián)是大數(shù)據(jù)時代的鮮明特征。激增且日益復(fù)雜的海量數(shù)據(jù)正通過各種方式對企業(yè)發(fā)展產(chǎn)生重要影響。如何正確理解和解讀數(shù)據(jù),發(fā)掘其內(nèi)在價值,從而推動企業(yè)的智能決策備受關(guān)注。
 
在當(dāng)今的商業(yè)世界或者日常生活中,無論是企業(yè)還是個人都自覺或不自覺地使用知識圖譜,將解決問題的想法和過程相互關(guān)聯(lián)。知識圖譜技術(shù)可以讓其更加明確,為實現(xiàn)智能決策的數(shù)字化經(jīng)濟提供支持和保障。
 
知識圖譜是人工智能 (AI) 以及人類知識發(fā)展的基礎(chǔ)支柱之一,是對人、物、位置、事件和概念等實體的相互關(guān)聯(lián)世界的真實描述,為數(shù)據(jù)集成、管理和分析提供框架。
 
隨著關(guān)聯(lián)數(shù)據(jù)、人工智能以及數(shù)據(jù)分析日益發(fā)展,知識圖譜技術(shù)的應(yīng)用不斷增加,成為各個行業(yè)業(yè)務(wù)的主流需求。IDC預(yù)測,全球 65%的GDP將實現(xiàn)數(shù)字化,2022年至2023年將推動超過6.8萬億美元的支出。而到2023年,亞太地區(qū)20%的商業(yè)智能將整合知識圖譜。
 
Neo4j知識圖譜尋找隱藏在復(fù)雜關(guān)聯(lián)事件中的模式,在更短的間隔內(nèi)以可擴展的方式從具有復(fù)雜上下文情景的大量數(shù)據(jù)中獲取有價值的信息,用戶可以對基礎(chǔ)數(shù)據(jù)進行推理并自信地使用其進行復(fù)雜的決策。
 
Neo4j知識圖譜將智能融入數(shù)據(jù),顯著提升整體價值,用例從管理遍布到分析乃至機器學(xué)習(xí),使人工智能/機器學(xué)習(xí)獲得更好的預(yù)測,連接數(shù)據(jù)孤島,為數(shù)據(jù)結(jié)構(gòu)和數(shù)字孿生等創(chuàng)新應(yīng)用奠定基礎(chǔ)。
Neo4j知識圖譜的應(yīng)用極其廣泛,覆蓋網(wǎng)絡(luò)安全、金融服務(wù)、醫(yī)療保健、生命科學(xué)、供應(yīng)鏈和物流、零售、電信和制造等眾多行業(yè),適用于從欺詐檢測和實時推薦到患者旅程、數(shù)字孿生、材料清單等各種用例。以下將以網(wǎng)絡(luò)安全、醫(yī)療和電信行業(yè)為例做具體介紹。
 
整合網(wǎng)絡(luò)事件,強化網(wǎng)絡(luò)安全
亞太地區(qū),中國、澳大利亞和新加坡的聯(lián)邦及中央政府在網(wǎng)絡(luò)安全方面的支出處于領(lǐng)先地位。到2025年,他們在增強網(wǎng)絡(luò)安全的智能解決方案上的投資將超過7.24 億美元。
網(wǎng)絡(luò)世界正在快速發(fā)展,惡意軟件世界也是如此。IT和OT系統(tǒng)(數(shù)據(jù)庫、門戶網(wǎng)站、邊緣設(shè)備、操作系統(tǒng)等)可能受到潛在攻擊而發(fā)生異質(zhì)性變化,從而使網(wǎng)絡(luò)安全任務(wù)變得更加復(fù)雜。知識圖譜能夠整合網(wǎng)絡(luò)安全相關(guān)事件,并且可以通過機器學(xué)習(xí)方法進一步加以利用。
 
發(fā)現(xiàn)隱藏模式,支持個性醫(yī)療
臨床知識圖譜是一個開源平臺,包含大約2000萬個節(jié)點和2.2億個可用實驗數(shù)據(jù)、公共數(shù)據(jù)和文獻之間的關(guān)系。其規(guī)模不斷擴大,允許使用統(tǒng)計分析和機器學(xué)習(xí)來提高生物醫(yī)學(xué)研究的效率,例如生物標(biāo)志物研究。知識圖譜加快了對生物標(biāo)志物、個體基因和代謝過程之間關(guān)聯(lián)的探索,以支持個性化醫(yī)療的發(fā)展。
 
2020 年,中國長沙的醫(yī)院與四所中國大學(xué)合作,研究腫瘤生物標(biāo)志物的藥物不良反應(yīng) (ADR)。知識圖譜應(yīng)用于現(xiàn)有文獻,連接腫瘤、生物標(biāo)志物、藥物和 ADR 之間的關(guān)聯(lián)。結(jié)果在臨床實驗中得到驗證,證實了比傳統(tǒng)的共現(xiàn)方法更好的模型性能,支持進一步?jīng)Q策。
 
智能電信網(wǎng)絡(luò),應(yīng)對復(fù)雜運營
亞太區(qū)的電信公司預(yù)計在2022年將花費超過5.84億美元用于網(wǎng)絡(luò)優(yōu)化和預(yù)防性維護。電信公司在越來越復(fù)雜的供應(yīng)商生態(tài)系統(tǒng)中運營,服務(wù)必須跨各種硬件和環(huán)境進行交互。這給電信支持團隊帶來了重大問題,因為多供應(yīng)商支持需要更高的能力來理解技術(shù)層之間的交互。
 
物聯(lián)網(wǎng)和邊緣設(shè)備的激增繼續(xù)在網(wǎng)絡(luò)拓撲中產(chǎn)生變化,使得進行故障診斷和實施基于規(guī)則的策略變得越來越困難。知識圖譜可以幫助電信公司捕獲和對流程、子網(wǎng)絡(luò)、設(shè)備和事件進行建模,以識別單點故障并支持SDN。
 
越來越多的公司將在數(shù)字優(yōu)先經(jīng)濟中面臨全新的挑戰(zhàn),需要以更大的敏捷性擴展解決方案流程。Neo4j知識圖譜是一個非常全面、豐富而且成熟的產(chǎn)品,包括負責(zé)數(shù)據(jù)存儲的Neo4j圖數(shù)據(jù)庫,致力數(shù)據(jù)分析的圖數(shù)據(jù)科學(xué) (GDS) 以及負責(zé)數(shù)據(jù)挖掘和探索的數(shù)據(jù)可視化工具Neo4j Bloom。作為圖數(shù)據(jù)平臺的領(lǐng)導(dǎo)者,Neo4j的企業(yè)愿景就是在不同的行業(yè)場景,幫助客戶深入分析高度關(guān)聯(lián)的復(fù)雜數(shù)據(jù),使業(yè)務(wù)數(shù)據(jù)變?yōu)樯虡I(yè)智能,提高數(shù)據(jù)的應(yīng)用價值,賦能企業(yè)智能決策和數(shù)字化轉(zhuǎn)型。
 
 
 
 
 

 

 

Neo4j CEO Emil Eifrem 解讀圖數(shù)據(jù)平臺引領(lǐng)數(shù)據(jù)庫未來十年的發(fā)展

 

 

(ChinaIT.com訊)萌芽于20世紀(jì)60年代的數(shù)據(jù)庫技術(shù)在剛剛興起的十年并沒有大行其道。而在過去短短的十年,信息世界快速發(fā)展,面臨極其復(fù)雜、互聯(lián)、動態(tài)、不斷變化的數(shù)據(jù)洪流,數(shù)據(jù)庫平臺如雨后春筍般涌現(xiàn),市場上的選擇增加到 350 多個。多年來,數(shù)據(jù)庫市場都以每年5 %至6%的速度高速擴張,市場體量未來4到5年有望從現(xiàn)在的500 億美元攀升至 1,000 億美元。
 
過去兩年,數(shù)據(jù)庫行業(yè)的發(fā)展趨勢呈現(xiàn)三大特征。
 
首先是融合,隨著新型數(shù)據(jù)的大規(guī)模創(chuàng)新,高速擴展的數(shù)據(jù)庫市場再次呈現(xiàn)出融合的局面,數(shù)百家數(shù)據(jù)庫廠商逐漸歸入到包括文檔數(shù)據(jù)庫、圖數(shù)據(jù)庫、時序數(shù)據(jù)庫、NewSQL數(shù)據(jù)庫在內(nèi)的四個全新且穩(wěn)定的數(shù)據(jù)庫陣營中。在不同細分領(lǐng)域中,僅有有限的幾家公司在領(lǐng)軍之路上引吭高歌,如圖領(lǐng)域的Neo4j 和文檔領(lǐng)域的 MongoDB。
 
第二,向云轉(zhuǎn)移成為整個行業(yè)的長期趨勢。2017年前后一些大型云供應(yīng)商和獨立云供應(yīng)商開始涌現(xiàn)。雖然曾因數(shù)據(jù)重力和監(jiān)管等因素的影響進展放緩,而今這一趨勢再次氣勢如虹。數(shù)據(jù)向云服務(wù)轉(zhuǎn)移在很大程度上成為數(shù)據(jù)庫平臺的發(fā)展驅(qū)動要素。
 
第三,數(shù)據(jù)科學(xué)家方興未艾。整體而言,數(shù)據(jù)科學(xué)家并不喜歡數(shù)據(jù)庫,他們更加鐘愛數(shù)據(jù)。而圖數(shù)據(jù)庫是個例外,越來越多的數(shù)據(jù)科學(xué)家對圖數(shù)據(jù)庫青睞有加。數(shù)據(jù)科學(xué)家使用圖形算法處理數(shù)據(jù),再通過圖將數(shù)據(jù)輸入機器學(xué)習(xí)管道中,從而為機器學(xué)習(xí)模型和預(yù)測提供關(guān)系型信號。由此,圖數(shù)據(jù)庫成為機器學(xué)習(xí)管道中的核心部分。
 
以供應(yīng)鏈為例,10 年前供應(yīng)鏈應(yīng)用并不是圖數(shù)據(jù)庫的最佳用例。因為在當(dāng)時任何生產(chǎn)實物產(chǎn)品的制造公司可能只擁有一個 2 到 3 個級別的供應(yīng)鏈,關(guān)系型數(shù)據(jù)庫完全能滿足企業(yè)的需求。如果需要分析,加入2至3個節(jié)點即可。
時至今日,制造業(yè)企業(yè)不僅業(yè)務(wù)分布廣泛,橫跨不同大陸,而且還要應(yīng)對此起彼伏的突發(fā)事件,制造業(yè)企業(yè)需要了解這種事件對供應(yīng)鏈乃至業(yè)務(wù)產(chǎn)生的影響,擁有確保供應(yīng)鏈安全的能力,行之有效的解決方案就是實現(xiàn)供應(yīng)鏈數(shù)字化。如今,企業(yè)面臨的數(shù)據(jù)分析不再是 2至3次的跳轉(zhuǎn)挖掘,而是 20、30甚至40次跳轉(zhuǎn)挖掘。數(shù)據(jù)庫尤其是在多次跳轉(zhuǎn)方面表現(xiàn)卓越的圖數(shù)據(jù)庫成為必然之選。
 
不同于關(guān)系型數(shù)據(jù)庫,圖數(shù)據(jù)庫以事物的連接方式為中心,強調(diào)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,它將數(shù)據(jù)間的聯(lián)系視為和數(shù)據(jù)本身同等重要。圖數(shù)據(jù)平臺讓用戶能夠在圖數(shù)據(jù)庫上開發(fā)和運行應(yīng)用程序,它直接將關(guān)系和數(shù)據(jù)在物理層面上一并存儲下來,使得訪問數(shù)據(jù)結(jié)點和關(guān)系的操作能夠以線性時間復(fù)雜度完成。在普通PC機上的測試結(jié)果表明,Neo4j圖數(shù)據(jù)庫的查詢引擎能夠在一秒內(nèi)輕松遍歷百萬級的關(guān)系/邊。
 
未來十年,將是圖數(shù)據(jù)平臺成為主流并大放異彩的十年,這不僅引起了行業(yè)專家對圖技術(shù)的重新思考,對于開發(fā)人員而言也是一件幸事。開發(fā)者驅(qū)動是Neo4j的文化,Neo4j的成功離不開對開發(fā)者生態(tài)的建設(shè)。Neo4j重視對開發(fā)者的投資并致力為開發(fā)者服務(wù),除了定期舉辦培訓(xùn)、會議等各種活動,還出版大量相應(yīng)的技術(shù)書籍,來輔助開發(fā)者不斷成長。
 
自2018年起Neo4j就活躍在中國市場。如今,Neo4j 的業(yè)務(wù)足跡遍布北京、上海和深圳并與業(yè)內(nèi)合作伙伴建立了良好的關(guān)系。今年6月,Neo4j在F輪風(fēng)險投資中獲得3.25億美元的融資,創(chuàng)造了私營數(shù)據(jù)庫公司單筆最高融資紀(jì)錄,投后估值超過20億美元。除了繼續(xù)投資圖數(shù)據(jù)庫和數(shù)據(jù)科學(xué)外,Neo4j還將重點擴展中國市場,幫助越來越多的中國企業(yè)通過圖數(shù)據(jù)平臺來挖掘數(shù)據(jù)的價值。