明輝手游網(wǎng)中心:是一個免費提供流行視頻軟件教程、在線學習分享的學習平臺!

什么是數(shù)據(jù)庫索引?數(shù)據(jù)庫索引詳細說明

[摘要]索引是什么?數(shù)據(jù)庫中查找操作非常普遍,索引就是提升查找速度的一種手段。索引分類B+樹索引 它就是傳統(tǒng)意義上的索引,它是最常用、最有效的索引。哈希索引 哈希索引是一種自適應的索引,數(shù)據(jù)庫會根據(jù)表的使用情況自動生成哈希索引,我們?nèi)藶槭菦]辦法干預的。全文索引 用于實現(xiàn)關(guān)鍵詞搜索。但它只能根據(jù)空格分詞,因...


索引是什么?

數(shù)據(jù)庫中查找操作非常普遍,索引就是提升查找速度的一種手段。

索引分類

  1. B+樹索引
    它就是傳統(tǒng)意義上的索引,它是最常用、最有效的索引。

  2. 哈希索引
    哈希索引是一種自適應的索引,數(shù)據(jù)庫會根據(jù)表的使用情況自動生成哈希索引,我們?nèi)藶槭菦]辦法干預的。

  3. 全文索引
    用于實現(xiàn)關(guān)鍵詞搜索。但它只能根據(jù)空格分詞,因此不支持中文。
    若要實現(xiàn)搜索功能,可選擇lucene。

  4. RTree索引
    在mysql很少使用,僅支持geometry數(shù)據(jù)類型;相對于BTREE,RTREE的優(yōu)勢在于范圍查找。

B+樹索引

數(shù)據(jù)庫以頁為存儲單元,一個頁是8K(8192Byte),一頁可以存放N條記錄。
頁在B+樹中分為:數(shù)據(jù)頁和索引頁。
B+樹的高一般為2-4層,因此查找某一鍵值的行記錄只需2-4次IO,效率較高。

聚集索引 和 非聚集索引

不管是聚集索引還是非聚集索引,它們的邏輯結(jié)構(gòu)都一棵是B+樹,它們的唯一區(qū)別在于:

  • 聚集索引的數(shù)據(jù)頁存放的是完整的記錄;也就是說,聚集索引決定了表的物理存儲順序;

  • 非聚集索引的數(shù)據(jù)頁只存指向記錄的地址信息,它真正的數(shù)據(jù)已經(jīng)在聚集索引中存儲了。

聯(lián)合索引 和 覆蓋索引

  1. 聯(lián)合索引
    當查詢條件涉及多列時,可以使用聯(lián)合索引。

  2. 覆蓋索引
    只需通過輔助索引就能獲取要查詢的信息,而無需再次通過聚集索引查詢具體的記錄信息。
    由于覆蓋索引并不包含整行的記錄,因此它的大小遠遠小于聚集索引。
    它比較適合做一些統(tǒng)計操作。

MyISAM索引實現(xiàn)

  1. 主鍵索引
    在主鍵索引中,索引頁中存放的是主鍵和指向數(shù)據(jù)頁的偏移量;數(shù)據(jù)頁中存放的是主鍵和該主鍵所屬行記錄的地址空間。

  2. 輔助索引
    在MyISAM中,主索引和輔助索引(Secondary key)在結(jié)構(gòu)上沒有任何區(qū)別,只是主索引要求key是唯一的,而輔助索引的key可以重復。

綜上所述,在MyISAM中,索引文件和數(shù)據(jù)文件分開存放,不管是主鍵索引還是輔助索引,都屬于非聚集索引。

InnoDB索引實現(xiàn)

  1. 主鍵索引
    索引頁仍然存放主鍵和和指向數(shù)據(jù)頁的偏移量,但數(shù)據(jù)頁存放的是完整的記錄。
    也就是在InnoDB中,數(shù)據(jù)和主鍵索引是存放在一起的。

  2. 輔助索引
    索引節(jié)點存放的內(nèi)容一樣,仍然是鍵值信息和指向數(shù)據(jù)頁的偏移量;但數(shù)據(jù)頁中存放的是鍵值信息和該鍵值對應的主鍵。然后通過主鍵查詢主鍵索引就能找到該條記錄。

綜上所述:

  • 聚集索引這種實現(xiàn)方式使得按主鍵的搜索十分高效,但是輔助索引搜索需要檢索兩遍索引:首先檢索輔助索引獲得主鍵,然后用主鍵到主索引中檢索獲得記錄。

  • InnoDB的輔助索引也會包含主鍵列,所以,如果主鍵定義的比較大,其他索引也將很大。如果想在表上定義 、很多索引,則爭取盡量把主鍵定義得小一些。InnoDB 不會壓縮索引。

索引的優(yōu)點

  • 第一,通過創(chuàng)建唯一性索引,可以保證數(shù)據(jù)庫表中每一行數(shù)據(jù)的唯一性。

  • 第二,可以大大加快數(shù)據(jù)的檢索速度,這也是創(chuàng)建索引的最主要的原因。

  • 第三,可以加速表和表之間的連接,特別是在實現(xiàn)數(shù)據(jù)的參考完整性方面特別有意義。

  • 第四,在使用分組和排序子句進行數(shù)據(jù)檢索時,同樣可以顯著減少查詢中分組和排序的時間。

  • 第五,通過使用索引,可以在查詢的過程中,使用優(yōu)化隱藏器,提高系統(tǒng)的性能。

索引的缺點

  • 第一,創(chuàng)建索引和維護索引要耗費時間,這種時間隨著數(shù)據(jù)量的增加而增加。

  • 第二,索引需要占物理空間,除了數(shù)據(jù)表占數(shù)據(jù)空間之外,每一個索引還要占一定的物理空間,如果要建立聚簇索引,那么需要的空間就會更大。

  • 第三,當對表中的數(shù)據(jù)進行增加、刪除和修改的時候,索引也要動態(tài)的維護,這樣就降低了數(shù)據(jù)的維護速度。

哪些情況需要加索引?

  • 在經(jīng)常需要搜索的列上,可以加快搜索的速度;

  • 在作為主鍵的列上,強制該列的唯一性和組織表中數(shù)據(jù)的排列結(jié)構(gòu);

  • 在經(jīng)常用在連接的列上,這些列主要是一些外鍵,可以加快連接的速度;

  • 在經(jīng)常需要根據(jù)范圍進行搜索的列上創(chuàng)建索引,因為索引已經(jīng)排序,其指定的范圍是連續(xù)的;

  • 在經(jīng)常需要排序的列上創(chuàng)建索引,因為索引已經(jīng)排序,這樣查詢可以利用索引的排序,加快排序查詢時間;

  • 在經(jīng)常使用在WHERE子句中的列上面創(chuàng)建索引,加快條件的判斷速度。

哪些情況不需要加索引?

  • 第一,對于那些在查詢中很少使用或者參考的列不應該創(chuàng)建索引。這是因為,既然這些列很少使用到,因此有索引或者無索引,并不能提高查詢速度。相反,由于增加了索引,反而降低了系統(tǒng)的維護速度和增大了空間需求。

  • 第二,對于那些只有很少數(shù)據(jù)值的列也不應該增加索引。這是因為,由于這些列的取值很少,例如人事表的性別列,在查詢的結(jié)果中,結(jié)果集的數(shù)據(jù)行占了表中數(shù)據(jù)行的很大比例,即需要在表中搜索的數(shù)據(jù)行的比例很大。增加索引,并不能明顯加快檢索速度。

  • 第三,對于那些定義為text, image和bit數(shù)據(jù)類型的列不應該增加索引。這是因為,這些列的數(shù)據(jù)量要么相當大,要么取值很少。
    第四,當修改性能遠遠大于檢索性能時,不應該創(chuàng)建索引。這是因為,修改性能和檢索性能是互相矛盾的。當增加索引時,會提高檢索性能,但是會降低修改性能。當減少索引時,會提高修改性能,降低檢索性能。因此,當修改性能遠遠大于檢索性能時,不應該創(chuàng)建索引。

以上就是什么是數(shù)據(jù)庫索引?數(shù)據(jù)庫索引詳解的詳細內(nèi)容,更多請關(guān)注php中文網(wǎng)其它相關(guān)文章!


學習教程快速掌握從入門到精通的SQL知識。