国产在线视频二区,国产精品成人免费福利,国产成人在线小视频

在選擇數據庫的路上，我們遇到過哪些坑？

責任編輯：editor004

2016-08-16 14:21:02

摘自：數據分析精選

如果要在特定的節點屬性上進行檢索，在節點上設置一個索引會是個好辦法，即使這會占用磁盤空間。可以暫停整個數據庫

你會怎么選擇數據庫，是關系數據庫、XML 數據庫、資源描述框架(RDF)，還是圖形數據庫? 本文的第1部分深入而生動地探討了各種選擇。在第2部分，將深入介紹使用 Neo4j 的注意點。文章系國內 ITOM 管理平臺 OneAPM 編譯呈現。

過渡到 Neo4j 之后的經驗和教訓

下面介紹一些有關運行 Neo4j 的實用技巧：

1. 如果你是 Java 商城，請嵌入式地運行 Neo4j

Neo4j 是本地 Java 平臺，我們又是 Java 商城，用 Neo4j 相當合適。嵌入 Neo4j 讓我們不用再進行 REST 調用，這對于安全來說確實很重要。有關進行 REST 調用的進一步危害，請觀看這段有關 REST 安全漏洞的 JavaOne 討論。

嵌入式地運行 Neo4j 還為我們大幅降低了復雜性。我們可以直接在進程中調用 Neo4j API，從而快速了解Cypher 語言，以便運行 Cypher 和 Java API 這兩者的結合體。同時我們再也不需要托管和非托管的擴展了。

2. 摸清自己的優勢

摸清自己的優勢和所選擇的工具的優勢，這一點極為重要。用工具來做不適當的事，效果會大打折扣。

本地圖形數據庫在關系方面的表現確實很好;在圖形中找到切入點，然后按照需要深入地研究各種關系，這在 Neo4j 中快得驚人。但如果想要在單個節點之外進行復雜的多值屬性全文檢索，效果就大打折扣了 —— 但我們選擇圖形數據庫并不是為了做這個。

3. 了解查詢時會發生哪些事情

了解查詢時會發生哪些事情，這一點也極為重要，這能夠優化 Cypher 語言。

請看下面這個非常簡單的查詢。我想要找到 Franklin Country 所有擁有狩獵執照的男性，并且執照上的地址需要和此人的家庭住址相匹配，以便我們確認這是同一個人。

我有一個人員節點，一個執照節點，還有一個位置節點，每個節點上都有各種不同屬性：

數據庫

數據庫要做的第一件事就是找到切入點(可能有多個切入點)，然后圖形從切入點展開搜索。尋找切入點通常是個讓人頭痛的問題。為此要使用帶有靜態索引集的基于規則的規劃程序，這一軟件已于近期升級為基于費用。這雖然還不夠完美，但無疑已經朝著正確的方向前進了一大步。

索引

索引基本上會復制數據庫中的信息片段，這樣有利于它迅速找到節點。在本例中，只使用信息片段來確定切入點。雖然不是必須要使用索引，但它確實能派上用場。如果要在特定的節點屬性上進行檢索，在節點上設置一個索引會是個好辦法，即使這會占用磁盤空間。

索引分為兩種：schema 和 legacy。Schema 索引是最新版，使用內部自定義的 Neo4j 內置索引，目前是默認設置。

一旦利用 Cypher 或 Java API 創建 schema 索引后，這些索引就會自動由數據庫維護。例如，如果你想在每個帶有“人員”標簽和“性別”屬性的節點上創建索引，當你創建新節點、更改節點值或刪除節點時，數據庫將自動對其進行更新。這時你也可以設置限定條件，比如必須存在屬性或屬性必須是唯一的。

Legacy 索引是 Lucene 索引，是較早的版本但尚未棄用。可以通過配置文件、Neo4j 屬性文件、Java API 或 Cypher 來設置 legacy 索引。Legacy 索引使用的是 Lucene 而非 Neo4j 專有索引機制。我們在用 Neo4j 時幾乎沒有什么漏洞，而每次遇到的漏洞基本都和 legacy 索引有關。即使是這樣，有時候這些索引也是必要的。

Apache Luke 是一款非常不錯的開源工具，用戶可以用它直接查看和搜索 Lucene 索引。這也幫助我們修復了 legacy 索引中的異常行為。

自動索引與手動索引

Legacy 索引有兩種用法：自動索引和手動索引。我建議使用自動索引，因為它更容易維護。基本上只要設置一次(可以在配置文件中設置也可以通過 API 設置)，然后設為在特定類型的節點上為特定類型的屬性編寫索引。自動索引還能夠在必要時輕松重建索引。

但是用戶無法指定是哪種類型的索引。在 Lucene 中，schema 存在不同索引類型，例如字符串、區分大小寫，以及數值，這些都是物理上獨立的索引。

如果你在查詢 Lucene 時想要使用這些索引，必須要做的第一件事就是告訴 Lucene 要使用哪個索引。但如果進行自動索引，Neo4j 可以根據你要編寫索引的第一個對象來選擇使用哪個索引。例如，如果你設置的第一個索引是藍色，Neo4j 就會明白藍色是字符串，然后會永久性地將藍色放在字符串索引中。

如果你能很好地控制收到的數據，這一索引方式效果會很不錯。但我們的系統沒有這樣。我們從許多不同的來源接收數據，所以收到的“blue”(藍色)屬性可能會指年齡。但如果這一屬性是最先收到的，Neo4j 就會把年齡作為基于字符串的屬性而不是數值屬性來編寫索引，如此一來，之后就沒法按照我希望的方式展開進一步比對和排列了。在這種情況下，只能手動創建索引。

使用自動索引的另一個好處是，如果目錄無故損壞，很容易就能修復目錄。可以暫停整個數據庫，進入 Lucene 索引目錄，刪除此目錄，重啟數據庫，然后 Neo4j 會為所有節點重新編寫索引。但如果已經進行了手動索引，你只能返回，然后為所有節點重新編寫索引。

范圍查詢

下面一系列幻燈片顯示了范圍查詢：