成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專(zhuān)欄INFORMATION COLUMN

數(shù)據(jù)庫(kù)的最簡(jiǎn)單實(shí)現(xiàn)

legendaryedu / 3210人閱讀

摘要:二叉查找樹(shù)是一種查找效率非常高的數(shù)據(jù)結(jié)構(gòu),它有三個(gè)特點(diǎn)。二叉查找樹(shù)的結(jié)構(gòu)不適合數(shù)據(jù)庫(kù),因?yàn)樗牟檎倚逝c層數(shù)相關(guān)。樹(shù)是對(duì)二叉查找樹(shù)的改進(jìn)。備份機(jī)制保存數(shù)據(jù)庫(kù)的副本。

轉(zhuǎn)載自:阮一峰的網(wǎng)絡(luò)日志

  

所有應(yīng)用軟件之中,數(shù)據(jù)庫(kù)可能是最復(fù)雜的。
MySQL的手冊(cè)有3000多頁(yè),PostgreSQL的手冊(cè)有2000多頁(yè),Oracle的手冊(cè)更是比它們相加還要厚。
但是,自己寫(xiě)一個(gè)最簡(jiǎn)單的數(shù)據(jù)庫(kù),做起來(lái)并不難。Reddit上面有一個(gè)帖子,只用了幾百個(gè)字,就把原理講清楚了。下面是我根據(jù)這個(gè)帖子整理的內(nèi)容。

數(shù)據(jù)以文本形式保存

    

第一步,就是將所要保存的數(shù)據(jù),寫(xiě)入文本文件。這個(gè)文本文件就是你的數(shù)據(jù)庫(kù)。
為了方便讀取,數(shù)據(jù)必須分成記錄,每一條記錄的長(zhǎng)度規(guī)定為等長(zhǎng)。比如,假定每條記錄的長(zhǎng)度是800字節(jié),那么第5條記錄的開(kāi)始位置就在3200字節(jié)。
大多數(shù)時(shí)候,我們不知道某一條記錄在第幾個(gè)位置,只知道主鍵(primary key)的值。這時(shí)為了讀取數(shù)據(jù),可以一條條比對(duì)記錄。但是這樣做效率太低,實(shí)際應(yīng)用中,數(shù)據(jù)庫(kù)往往采用B樹(shù)(B-tree)格式儲(chǔ)存數(shù)據(jù)。

什么是B樹(shù)?

  

要理解B樹(shù),必須從二叉查找樹(shù)(Binary search tree)講起。

二叉查找樹(shù)是一種查找效率非常高的數(shù)據(jù)結(jié)構(gòu),它有三個(gè)特點(diǎn)。

1. 每個(gè)節(jié)點(diǎn)最多只有兩個(gè)子樹(shù)。
2. 左子樹(shù)都為小于父節(jié)點(diǎn)的值,右子樹(shù)都為大于父節(jié)點(diǎn)的值。
3. 在n個(gè)節(jié)點(diǎn)中找到目標(biāo)值,一般只需要log(n)次比較。
  

二叉查找樹(shù)的結(jié)構(gòu)不適合數(shù)據(jù)庫(kù),因?yàn)樗牟檎倚逝c層數(shù)相關(guān)。越處在下層的數(shù)據(jù),就需要越多次比較。極端情況下,n個(gè)數(shù)據(jù)需要n次比較才能找到目標(biāo)值。對(duì)于數(shù)據(jù)庫(kù)來(lái)說(shuō),每進(jìn)入一層,就要從硬盤(pán)讀取一次數(shù)據(jù),這非常致命,因?yàn)橛脖P(pán)的讀取時(shí)間遠(yuǎn)遠(yuǎn)大于數(shù)據(jù)處理時(shí)間,數(shù)據(jù)庫(kù)讀取硬盤(pán)的次數(shù)越少越好。
B樹(shù)是對(duì)二叉查找樹(shù)的改進(jìn)。它的設(shè)計(jì)思想是,將相關(guān)數(shù)據(jù)盡量集中在一起,以便一次讀取多個(gè)數(shù)據(jù),減少硬盤(pán)操作次數(shù)。

B樹(shù)的特點(diǎn)也有三個(gè)。

1. 一個(gè)節(jié)點(diǎn)可以容納多個(gè)值。比如上圖中,最多的一個(gè)節(jié)點(diǎn)容納了4個(gè)值。
2. 除非數(shù)據(jù)已經(jīng)填滿(mǎn),否則不會(huì)增加新的層。也就是說(shuō),B樹(shù)追求"層"越少越好。
3. 子節(jié)點(diǎn)中的值,與父節(jié)點(diǎn)中的值,有嚴(yán)格的大小對(duì)應(yīng)關(guān)系。一般來(lái)說(shuō),如果父節(jié)點(diǎn)有a個(gè)值,那么就有a+1個(gè)子節(jié)點(diǎn)。比如上圖中,父節(jié)點(diǎn)有兩個(gè)值(7和16),就對(duì)應(yīng)三個(gè)子節(jié)點(diǎn),第一個(gè)子節(jié)點(diǎn)都是小于7的值,最后一個(gè)子節(jié)點(diǎn)都是大于16的值,中間的子節(jié)點(diǎn)就是7和16之間的值。
  

這種數(shù)據(jù)結(jié)構(gòu),非常有利于減少讀取硬盤(pán)的次數(shù)。假定一個(gè)節(jié)點(diǎn)可以容納100(a)個(gè)值,那么3(n)層的B樹(shù)最大可以容納1030300((a+1)^(n-1)*a)個(gè)數(shù)據(jù),如果換成二叉查找樹(shù),則需要20層!假定操作系統(tǒng)一次讀取一個(gè)節(jié)點(diǎn),并且根節(jié)點(diǎn)保留在內(nèi)存中,那么B樹(shù)在100萬(wàn)個(gè)數(shù)據(jù)中查找目標(biāo)值,只需要讀取兩次硬盤(pán)。

索引

    

數(shù)據(jù)庫(kù)以B樹(shù)格式儲(chǔ)存,只解決了按照"主鍵"查找數(shù)據(jù)的問(wèn)題。如果想查找其他字段,就需要建立索引(index)。
所謂索引,就是以某個(gè)字段為關(guān)鍵字的B樹(shù)文件。假定有一張"雇員表",包含了員工號(hào)(主鍵)和姓名兩個(gè)字段??梢詫?duì)姓名建立索引文件,該文件以B樹(shù)格式對(duì)姓名進(jìn)行儲(chǔ)存,每個(gè)姓名后面是其在數(shù)據(jù)庫(kù)中的位置(即第幾條記錄)。查找姓名的時(shí)候,先從索引中找到對(duì)應(yīng)第幾條記錄,然后再?gòu)谋砀裰凶x取。
這種索引查找方法,叫做"索引順序存取方法"(Indexed Sequential Access Method),縮寫(xiě)為ISAM。它已經(jīng)有多種實(shí)現(xiàn)(比如C-ISAM庫(kù)和D-ISAM庫(kù)),只要使用這些代碼庫(kù),就能自己寫(xiě)一個(gè)最簡(jiǎn)單的數(shù)據(jù)庫(kù)。

高級(jí)功能

  

部署了最基本的數(shù)據(jù)存?。òㄋ饕┮院?,還可以實(shí)現(xiàn)一些高級(jí)功能。
(1)SQL語(yǔ)言是數(shù)據(jù)庫(kù)通用操作語(yǔ)言,所以需要一個(gè)SQL解析器,將SQL命令解析為對(duì)應(yīng)的ISAM操作。
(2)數(shù)據(jù)庫(kù)連接(join)是指數(shù)據(jù)庫(kù)的兩張表通過(guò)"外鍵",建立連接關(guān)系。你需要對(duì)這種操作進(jìn)行優(yōu)化。
(3)數(shù)據(jù)庫(kù)交易(transaction)是指批量進(jìn)行一系列數(shù)據(jù)庫(kù)操作,只要有一步不成功,整個(gè)操作都不成功。所以需要有一個(gè)"操作日志",以便失敗時(shí)對(duì)操作進(jìn)行回滾。
(4)備份機(jī)制:保存數(shù)據(jù)庫(kù)的副本。
(5)遠(yuǎn)程操作:使得用戶(hù)可以在不同的機(jī)器上,通過(guò)TCP/IP協(xié)議操作數(shù)據(jù)庫(kù)。
(完)

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/17449.html

相關(guān)文章

  • 你想不到的最簡(jiǎn)單php操作MySQL

    摘要:千鋒出品之天龍八部操作必須先開(kāi)啟擴(kuò)展函數(shù)庫(kù)首先先開(kāi)啟開(kāi)啟成功呢我就可以開(kāi)始連接數(shù)據(jù)庫(kù)了,第一步連接數(shù)據(jù)庫(kù)服務(wù)器地址用戶(hù)名,密碼第二步判斷連接數(shù)據(jù)庫(kù)是否成功連接錯(cuò)誤號(hào)連接錯(cuò)誤信息第三步選擇數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)名稱(chēng)第四步設(shè)置字符集第五步準(zhǔn)備語(yǔ)句表名第六  千鋒PHP出品之天龍八部: Php操作mysql必須先開(kāi)啟mysq擴(kuò)展函數(shù)庫(kù)   首先先開(kāi)啟extension = mysqli_dll;   ...

    pkhope 評(píng)論0 收藏0
  • 單源點(diǎn)最短路徑(Bellman-Ford)原理及js實(shí)現(xiàn)

    摘要:說(shuō)明算法運(yùn)行結(jié)束后,會(huì)得到從源節(jié)點(diǎn)到其它所有節(jié)點(diǎn)的最短路徑,同時(shí)得到每個(gè)節(jié)點(diǎn)的前驅(qū)節(jié)點(diǎn),不能包含負(fù)權(quán)回路如圖但可以包含圖,這里所說(shuō)的負(fù)權(quán)環(huán)路是指環(huán)路的權(quán)值總和為正或?yàn)樨?fù)圖圖松弛操作概念松弛操作針對(duì)的操作對(duì)象是圖中的邊,對(duì)圖中任意一條邊, 1. 說(shuō)明 Bellman-Ford算法運(yùn)行結(jié)束后,會(huì)得到從源節(jié)點(diǎn) s 到其它所有節(jié)點(diǎn)的最短路徑,同時(shí)得到每個(gè)節(jié)點(diǎn)的前驅(qū)節(jié)點(diǎn),Bellman-Ford...

    Michael_Lin 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<