摘要:理想情況下,單一文檔將成為項目所有信息的唯一來源。然而,卻沒有相等的事務(wù)去更新不同的文檔。許多的問題已經(jīng)被曝光,但大部分還是歸結(jié)為一個問題知識。
聲明:本文譯自SQL vs NoSQL The Differences,如需轉(zhuǎn)載請注明出處。
SQL(結(jié)構(gòu)化查詢語言)數(shù)據(jù)庫作為一個主要的數(shù)據(jù)存儲機制已經(jīng)超過40個年頭了。隨著web應(yīng)用和像MySQL、PostgreSQL和SQLite這些開源項的興起,SQL使用量大大增加。
NoSQL數(shù)據(jù)庫在20世紀60年代就已經(jīng)出現(xiàn)了,但最近因為MongoDB、CouchDB,Redis和Apache Cassandra等才受到廣泛的關(guān)注。
你會發(fā)現(xiàn)很多教程都會解釋如何根據(jù)你的興趣選擇去使用SQL還是NoSQL,但是很少討論為什么應(yīng)該去選擇它。我希望能夠填補這一空白。在這篇文章中,我們將介紹基本的差異。在稍后的后續(xù)的文章中,我們將查看一些典型的場景,并確定最佳的選擇。
大多數(shù)的例子都適用于目前流行的MySQL SQL和MongoDB NoSQL數(shù)據(jù)庫系統(tǒng)。其他SQL/NOSQL數(shù)據(jù)庫都是類似的,但會有細微的差別和語法特征。
SQL和NoSQL的圣戰(zhàn)在我們開始之前,先糾正一些所謂的神話…
神話1:NoSQL將取代SQL
這么說就好比說船將被車取代,因為它是新的技術(shù)。SQL和NoSQL做的是相同的事:數(shù)據(jù)存儲。它們采取的方法不同,這可能回幫組或阻礙你的項目。盡管感覺技術(shù)更新,并經(jīng)常在最近上頭條,NoSQL不是SQL的替代品——而是一種選擇。
神話2:NoSQL比SQL更好或更壞
一些項目更適合使用SQL數(shù)據(jù)庫,一些更適合NoSQL,而一些可以兩者交替使用。這邊文章不會是SitePoint Smackdown,因為你不能在所有方面都應(yīng)用相同的廣泛性假設(shè)。
神話3:SQL和NoSQL天壤之別
這不一定是個事實。一些SQL數(shù)據(jù)庫采用NoSQL的特點,反之亦然。選擇可能會變得越來越模糊,NewSQL混合數(shù)據(jù)庫可能會在將來提供一些有趣的選擇。
神話4:語言/框架決定了使用什么樣的數(shù)據(jù)庫
我們已經(jīng)習(xí)慣了技術(shù)堆,比如——
LAMP: Linux, Apache, MySQL (SQL), PHP
MEAN: MongoDB (NoSQL), Express, Angular, Node.js
.NET, IIS and SQL Server
Java, Apache and Oracle.
有實踐的、歷史的和商業(yè)的原因來解釋這些stack的發(fā)展——但不能認為它們就是規(guī)則。你可以在你的PHP或.NET項目中使用MongoDB NoSQL數(shù)據(jù)庫。你可以在Node.js中連接MySQL或者SQL服務(wù)器。你可能沒有找到很多教程和資源,但是是你的需求決定數(shù)據(jù)庫的類型——而不是所謂的語言。
(有句話是這么說的,不要讓生活有目地為難自己!選擇一個不尋常的技術(shù)組合或者SQL和NoSQL組合是可行的,但困難的是找到支持和聘請有經(jīng)驗的開發(fā)者)
有了這樣的想法,我們來看看主要的差異。
SQL表VS NoSQL文檔SQL數(shù)據(jù)庫提供相關(guān)數(shù)據(jù)表的存儲。例如,如果你有一個網(wǎng)上書店,圖書的信息將會被添加到一個book的表中:
每一行是一個不同的記錄。設(shè)計是剛性的;你不能使用同一個表來存儲不同的信息,或者在一個數(shù)字格式輸入字符。
NoSQL數(shù)據(jù)庫存儲JSON格式的字段值對文檔,比如:
{
ISBN: 9780992461225, title: "JavaScript: Novice to Ninja", author: "Darren Jones", format: "ebook", price: 29.00
}
相似的文檔可以存儲于一個集合里,這類似于一個SQL表。然而你可以存儲任何數(shù)據(jù)在任何文檔里;而NoSQL數(shù)據(jù)庫永遠不會抱怨,例如:
{
ISBN: 9780992461225, title: "JavaScript: Novice to Ninja", author: "Darren Jones", year: 2014, format: "ebook", price: 29.00, description: "Learn JavaScript from scratch!", rating: "5/5", review: [ { name: "A Reader", text: "The best JavaScript book I"ve ever read." }, { name: "JS Expert", text: "Recommended to novice and expert developers alike." } ]
}
SQL表創(chuàng)建一個嚴格的數(shù)據(jù)模板,因此很難犯錯誤。NoSQL更加的靈活和寬容,但能夠存儲任何數(shù)據(jù)可能會導(dǎo)致一致性的問題。
在一個SQL數(shù)據(jù)庫中,除非你在指定模式中定義了表格和字段格式,不然不可能添加數(shù)據(jù)。該模式還可以包含其他的信息,例如——
主鍵——唯一的標識符,如ISBN,適用于單個記錄。
索引——通常被查詢的字段,用來幫助快熟搜索。
關(guān)系——數(shù)據(jù)字段之間的邏輯連接
功能——如觸發(fā)器和存儲過程
你的數(shù)據(jù)模式必須在任何商業(yè)邏輯可以被開發(fā)去處理數(shù)據(jù)前被設(shè)計出來并實現(xiàn)。完成后可以行進一些更新,但不能完成大的改變。
在一個NoSQL數(shù)據(jù)庫,數(shù)據(jù)可以隨時隨地被添加。沒有必要去制定一個文檔設(shè)計,甚至集合前端。例如在MongoDB,下面的語句將在新的book集合創(chuàng)建一個新的文檔,如果這個文檔之前沒有被創(chuàng)建過:
db.book.insert(
ISBN: 9780994182654, title: "Jump Start Git", author: "Shaumik Daityari", format: "ebook", price: 29.00
);
(MongoDB會給每個集合內(nèi)的文檔自動添加唯一的_id值。你可能任然想要定義索引,如果需要的話可以稍后進行。)
如果一個項目初始數(shù)據(jù)要求很難去確定,那么NoSQL數(shù)據(jù)庫可能更加的適合。有句話說,不要為懶散而制造困難:忽略了在項目中設(shè)計適合的數(shù)據(jù)庫的重要性將會在之后導(dǎo)致很多的麻煩。
SQL規(guī)范化VS NoSQL反規(guī)范化假設(shè)我們要向書店數(shù)據(jù)庫中添加出版商信息。一個單一的出版商可以提供多個標題,在一個SQL數(shù)據(jù)庫里,我們創(chuàng)建一個新的publisher表:
我們接下來可以增加publisher_id到book表,這個表是publisher.id引用。
這最大限度的減少數(shù)據(jù)的冗余;我們不用重復(fù)每本書的出版商信息——僅僅只用索引。這種技巧可以稱作規(guī)范化,并有實際的好處。我們只用更新單一的出版商而不用改變整個book數(shù)據(jù)。
在NoSQL中,我們也可以使用規(guī)范化技巧。在book集中的文檔——
{
ISBN: 9780992461225, title: "JavaScript: Novice to Ninja", author: "Darren Jones", format: "ebook", price: 29.00, publisher_id: "SP001"
}
——在一個出版商集合中引用一個文檔:
{
id: "SP001" name: "SitePoint", country: "Australia", email: "feedback@sitepoint.com"
}
然而,這并不總是可行的,原因在下面很明顯。我們可能選擇反規(guī)范化我們的文檔,重復(fù)每本書的出版商信息:
{
ISBN: 9780992461225, title: "JavaScript: Novice to Ninja", author: "Darren Jones", format: "ebook", price: 29.00, publisher: { name: "SitePoint", country: "Australia", email: "feedback@sitepoint.com" }
}
這可以加快查詢的速度,但在多個記錄中更新出版商信息將會顯著變慢。
SQL查詢提供了一個強大的JOIN條款。我們可以使用單個SQL語句獲取不同表中的相關(guān)數(shù)據(jù)。例如:
SELECT book.title, book.author, publisher.name
FROM book
LEFT JOIN book.publisher_id ON publisher.id;
這將返回所有的書名、作者和相關(guān)出版商名稱。
NoSQL沒有等效的JOIN,有SQL的經(jīng)驗的可能會驚訝. 如果我們使用上述的規(guī)范化集合,我們將需要獲取所有的book文檔,檢索所有的相關(guān)publisher文檔,并手動在程序邏輯中連接兩者。這就是反規(guī)范化常常是必不可少的一個原因。
SQL VS NoSQL數(shù)據(jù)完整性大多數(shù)SQL數(shù)據(jù)庫允許你使用外鍵約束去強制性數(shù)據(jù)完整性(除非你仍在使用舊的,在MySQL已不存在的MyISAM存儲引擎)。我們的書店可以——
? 確保所有的書都有一個有效的publisher_id編碼,這個編碼在 publisher表中都有匹配的條目
? 如果一個或多個書被分配給它們,則出版商不能被刪除。
模式強制數(shù)據(jù)庫遵循這些規(guī)則。開發(fā)者或用戶則不能增加、編輯或者移除可能引起無效數(shù)據(jù)或孤立的數(shù)據(jù)
相同數(shù)據(jù)完整性選項在NoSQL數(shù)據(jù)庫中不可用;你可以存儲所有你想存儲的東西。理想情況下,單一文檔將成為項目所有信息的唯一來源。
SQL VS NoSQL事務(wù)在SQL數(shù)據(jù)庫中,兩個或多個更新可以在同一個事務(wù)中執(zhí)行——一個all-or-nothing的封裝保證成功或失敗。例如,假設(shè)我們的書店包含了order和stock表。當一本書被訂購時,我們在order表添加一條記錄并減少stock表中的庫存數(shù)。如果我們分別地執(zhí)行這兩個更新,一個可能成功另外一個會失敗——因此我們的數(shù)據(jù)會不同步。在一個事務(wù)中放置相同更新可以保證同時成功或失敗。
在NoSQL數(shù)據(jù)庫中,單個文檔的修改是微小的。換句話說。如果你正在文檔中更新三個值,要不三個值都是成功的,要不三個值都保持不變。然而,卻沒有相等的事務(wù)去更新不同的文檔。有類似的選項,但是,在寫這些的時候,必須在你的代碼中手動處理。
SQL VS NoSQL CRUD 語法創(chuàng)建、讀取更新和刪除數(shù)據(jù)是上所有數(shù)據(jù)庫系統(tǒng)的基礎(chǔ)。本質(zhì)上——
? SQL是一個輕量級的陳述性語言。這是非常強大的,并已經(jīng)成為一個國際化的標準,雖然大多數(shù)系統(tǒng)實現(xiàn)略有不同的語法。
? NoSQL數(shù)據(jù)庫使用與JSON類似 JavaScripty-looking查詢!基本操作很簡單,但嵌套的JSON對于復(fù)雜的查詢會變得更加的繁雜。
簡單的比較:
這也許是最有爭議的比較,NoSQL經(jīng)常被認為比SQL更快。這并不奇怪;NoSQL更加簡單的反規(guī)范化存儲允許你使用單個請求去在所有信息中查詢一個特定的項目。不需要使用相關(guān)的JSON或復(fù)雜的SQL查詢。
也就是說,你的項目設(shè)計和數(shù)據(jù)要求將產(chǎn)生最大的影響。一個良好設(shè)計的SQL數(shù)據(jù)庫必然會比一個設(shè)計很差的NoSQL表現(xiàn)要好,反之亦然。
SQL VS NoSQL縮放隨著你的數(shù)據(jù)的增長,你可能會發(fā)現(xiàn)在多個服務(wù)器之前分配負載是很必要的。這對于SQL為基礎(chǔ)的系統(tǒng)可能很棘手。如何分配相關(guān)的數(shù)據(jù)呢?聚類可能是最簡單的選擇;多個服務(wù)器訪問相同的中央存儲——但即使這樣也會存在挑戰(zhàn)。
NoSQL的簡單數(shù)據(jù)模型可以讓這個過程容易很多,許多一開始就建立了縮放功能。這是一個概論性的,所以如果碰到這種情況請去咨詢專家意見。
SQL VS NoSQL實用性最后,我們來考慮安全和系統(tǒng)的問題。最有名的NoSQL數(shù)據(jù)庫才存在了幾年;他們比更成熟的SQL產(chǎn)品更易出現(xiàn)問題。許多的問題已經(jīng)被曝光,但大部分還是歸結(jié)為一個問題:知識。
開發(fā)人員和系統(tǒng)管理員對于新的數(shù)據(jù)庫系統(tǒng)有較少的經(jīng)驗,所以錯誤常常發(fā)生。選擇NoSQL是因為它感覺會更快,或因為你想去避免架構(gòu)設(shè)計而導(dǎo)致之后的問題。
SQL VS NoSQL的總結(jié)SQL和NoSQL數(shù)據(jù)庫用不同的方式做同樣的事情。從一個切換到另一個是可能的,但是一點計劃可以節(jié)約很多的時間和金錢。
更適合SQL的項目:
可預(yù)先確定的邏輯關(guān)系離散數(shù)據(jù)的要求 數(shù)據(jù)完整性是必不可少的 有良好開發(fā)經(jīng)驗和支持的標準基礎(chǔ)技術(shù)
更適合NoSQL的項目:
不相關(guān)的、不確定或不斷變化的數(shù)據(jù)要求 更加簡單寬松的項目對象,可以立即編碼 速度和擴展性是必要的
在這個書店例子的背景下,SQL數(shù)據(jù)庫是最實用的選項——特別是當我們引進電商設(shè)施,需要強大的事務(wù)支持。
由于我們云巴是做跨設(shè)備平臺的消息服務(wù)的,對數(shù)據(jù)存取的速度和擴展要求非常高,NoSQl對我們來說是最合適的。關(guān)于Couchbase和 Redis 可以看我們往期的文章。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/18777.html
閱讀 4029·2021-11-11 10:58
閱讀 3430·2021-09-26 09:46
閱讀 1977·2019-08-30 15:55
閱讀 1039·2019-08-30 13:52
閱讀 2049·2019-08-29 13:11
閱讀 3083·2019-08-29 11:27
閱讀 1572·2019-08-26 18:18
閱讀 2726·2019-08-23 14:17