作者:Neo4j圖數據科學產品管理高級總監(jiān) Alicia Frame博士
計算機人工智能的發(fā)展已經跨越了若干階段,從計算智能到感知智能不斷演化。如今,我們迎來了難度最大的人工智能階段——認知智能。如何利用錯綜復雜的關聯數據,實現理解、推理和可解釋的認知智能并幫助企業(yè)更加精準地預測,成為企業(yè)在數據管理領域面臨的挑戰(zhàn)。
如今的企業(yè)需要將圖分析加入現有的分析能力中,圖分析技術最重要的貢獻在于幫助企業(yè)發(fā)掘數據中沒有被意識到或者認為不存在的隱藏關系和模式。圖分析是人工智能和機器學習跨越到新階段的關鍵,為機器學習提供高度可信和精準的關系模型和預測。認知智能階段,關聯以知識圖譜的方式呈現,并在知識圖譜上運行,獲得可解釋的結果、數據以及算法,從而進行預測。這就是圖數據科學(Graph Data Science)受到極大關注并日漸流行的主要原因之一。
Neo4j 圖數據科學產品管理高級總監(jiān) Alicia Frame 博士
預測關系演化, 解答關鍵問題
圖數據科學在事物關系上進行數據科學類的研究和分析,通過分析關系以及數據關聯得到新的答案。圖數據科學是讓關聯的數據“自己說話”。它可以通過運行一種無監(jiān)督圖算法在噪聲中發(fā)現信號,還可以基于客戶圖顯示其社區(qū)如何互動以及對數據分割有用的信息。
圖數據科學是關于利用數十億甚至數萬億數據點之間的關聯。用于數據科學的圖利用這些關聯確定什么是重要和有意義的。
企業(yè)可以通過在圖上進行監(jiān)督機器學習來更進一步。通過這種方式,他們可以預測圖未來如何變化。圖數據科學讓企業(yè)可以從圖結構中學習——不僅僅是相互關聯的人,而是整體圖,以預測接下來這些關系如何演化。
Neo4j圖數據科學是一個圖分析和建模平臺。它結合了現有數據中關系和網絡結構的預測能力,解答之前難以解決的問題并提高預測準確性。使用圖算法和機器學習,數據科學家可以識別模式和行為,改進他們的模型,以在引擎推薦、欺詐檢測、路線優(yōu)化和客戶360場景中使用,通過改進預測來實現更優(yōu)決策和創(chuàng)新。
知識圖譜提升數據價值
Neo4j圖數據科學分為知識圖譜、圖數據分析、圖數據特征工程、圖嵌入和圖神經元網絡五大發(fā)展階段。作為圖數據科學的首要階段,知識圖譜把大量現有的關系型以及非結構化數據以圖的方式進行存儲、轉化和處理。
Neo4j相信知識圖譜對于企業(yè)應對業(yè)務挑戰(zhàn)至關重要。語義是知識圖譜的關鍵組成部分和優(yōu)勢之一。每個語義都有自己的特定含義,這使得每個知識圖譜也具備獨一無二的特性。語義與圖數據同步編碼,這就是知識圖如何將智能引入數據并顯著提高其價值的方式。
Neo4j的絕大多數客戶都是從知識圖譜開始,進而了解他們擁有哪些信息、信息與其他概念的關系以及與業(yè)務問題之間的關聯。知識圖譜建立后,圖數據科學項目就要判斷客戶試圖解決何種問題,他們想問什么問題,以及他們如何將其所知轉化為準確的預測。
超60種算法提供全面預測
Neo4j圖數據科學提供業(yè)界最健全的圖算法和機器學習方案,支持用戶按需創(chuàng)建各類預測模型和擴展各類圖應用。Neo4j圖數據科學提供了包括路徑發(fā)現、中心度、社區(qū)檢測、監(jiān)督機器學習、鏈接預測、相似度在內的五大類超過60種算法。
Neo4j圖算法支持高度并行處理并已在數百億個節(jié)點上進行測試,確保算法能夠完成并提供正確且易使用的答案。企業(yè)將成熟的數據庫產品與創(chuàng)新的數據科學相結合,將獲得全面的預測功能及處理能力。Neo4j的服務已達到了成熟、可擴展、快速和未來完整性的標準。
助力企業(yè)更優(yōu)決策
數字化社會中很多企業(yè)擁有數十億的節(jié)點和邊的數據。借助Neo4j圖數據科學,醫(yī)療企業(yè)可以讓在藥品研發(fā)中收集的百億條數據發(fā)揮最大價值,挖掘藥品和基因之間的關聯,根據病患經歷找到相似案例、病患集群并決定最佳的介入時機和方式;在線內容推送服務商能夠識別匿名用戶的喜好傾向并做出精準實時推送,大大增加用戶粘性;金融企業(yè)可以更好地應對欺詐檢測挑戰(zhàn),在巨量數據庫中實時發(fā)現欺詐案例。
以Neo4j為一家大型全球制藥公司客戶提供的預測建模為例。該公司建立了電子病歷,為每個患者提供相應的數據,這是他們在醫(yī)療保健過程所執(zhí)行的步驟。客戶感興趣的是獲取數據并從信息中學習:誰像是某些干預措施的受益者?誰是這種藥物的獲益者?將來誰會從這種藥物受益?然后他們知道將成為藥物受益者的圖模式是什么樣的。他們還可以找到具有相似特征的患者,并進行早期干預以改善患者的療效。
此外,全球領先的在線內容推薦商將Neo4j圖數據科學用于身份消歧,在4.4TB數據(140億節(jié)點)中高效建立連接,應用圖算法,根據訪問行為識別唯一用戶,從而建立1.63億個唯一的用戶畫像,包含豐富且更長時間的數據,為潛在客戶提供精準內容,實現了612%的回頭客增長。
另一個成功案例是金融服務客戶需要加快審查流程,要在短時間內檢測出復雜的欺詐圈。Neo4j幫助該機構將人工審核時間從8分鐘縮短到3分鐘。使用 Neo4j解決方案還幫助該機構發(fā)現了以前被忽視的欺詐活動。
Neo4j是全球領先的圖數據平臺領導者,在企業(yè)級數據庫基礎之上建立了一個超級強大的可擴展數據科學平臺。Neo4j圖數據科學不僅提供全面豐富的功能,更大大簡化數據科學家的工作流程,讓數據科學家通過綜合的圖分析技術輕松實現更精準的預測。