索引(Index)是帮助MySQL高效获取数据的数据结构。可以得到索引的本质:索引是数据结构。
目的是为了提高查询效率,类比字典
如果数据量很多,只能按照下面示例查询
如果要查“mysql”这个单词,需要定位到m字母,然后从下往下找到y字母,再找到剩下的sql。
如果没有索引,可能需要a----z,如果想找到Java开头的单词或者Oracle开头的单词,就会减少效率。
(1)可以简单理解为"排好序的快速查找数据结构”
(2)索引的两大功能
①查找速度快
②排好序
(3)举例说明:
在图书馆中,可以问办理借阅处的人,需要找什么书,前台的人可以搜索那本书的位置,然后转告给找书人,不用一本一本去瞧是不是要借阅的书籍;如果没有索引,图书馆的书有又很多,只能一本本寻找需要借阅的书籍了。办理借阅处的人如同索引的作用,需要找的书就是数据。
(4)下图就是一种可能的索引方式示例:
左边是数据表,一共有两列七条记录,最左边的是数据记录的物理地址;
右边可以理解成图书管理员使用图书检索系统,会告知你哪本书在什么位置。
比如要查找91号,0xF3是真正记录的物理地址,对91进行二叉树查找,折半查询,进行重复查找。这样可以迅速找到,交给主人。
为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找在一定的复杂度内获取到相应数据,从而快速的检索出符合条件的记录。
(5)索引的使用定义:
数据本身之外,数据库还维护着一个满足特定查找算法的数据结构,这些数据结构以某种方式指向数据,这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引。
为了查数据更快,专门负责人每天需要备份、恢复、日志,最重要的是需要建立索引。
那为什么从逻辑上说东西已经删除,从物理上说并为被删除?
1.为了数据分析
现在已经进入到云计算和大数据时代,在一些后台会有客户浏览和客户下单的完整记录,所以说大部分是从使用状态变成非激活状态;
2.为了索引
比如:跟图书馆管理员说借一本《倚天屠龙记》,她告诉借书者在二楼三号柜,跑去看什么都没找到,这个时候的索引相当于报废状态。
对数据进行频繁的修改和删除,久而久之二叉查找树会失效;如果在使用索引时速度越来越慢,这时的索引就不是很准,箭头指向变多了也会影响索引。
数据稳定之后,按最新版再重建索引,重新构建再查会提升速度;在数据库里,改一条数据,除了改数据的记录以外,还要改它的索引,就会导致查询快,分散慢。所以不适合过于频繁的改数据。
3.修改
数据库里面改一条数据,也要同时修改索引。否则会导致索引指向不准确。
4.结论
一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上。
5.和JAVA开发相关的索引
如果没有特别指明,都是指B树(多路搜索树,并不一定是二叉的)结构组织的索引,其中聚集索引,次要索引,覆盖索引,复合索引,前缀索引,唯一索引默认都是使用B+树索引,统称索引。当然,除了B+树这种类型的索引之外,还有哈希索引(hash index)等。