假设有像下面这样一个表:
CREATE TABLE test1 ( id integer, content varchar );
并且进行大量的类似下面这样的语句进行查询:
SELECT content FROM test1 WHERE id = constant;
通常,数据库系统不得不一行一行地扫描整个test1表以寻找所有匹配的记录。 如果在test1里面有许多行,但是只返回少数几行(可能是零行或一行), 那么上面这个方法可就很差劲了。如果我们让数据库系统在 id列上维护一个索引用于定位匹配的行。 这样,数据库系统只需要在搜索树中走少数的几层就可以找到匹配行。
在大多数非小说的书籍里面都使用了类似这样的方法: 在书的背后收集着读者会经常查找的术语和概念的索引,并按照字母顺序排列。 有兴趣的读者可以快速地扫描该索引并且切换到合适的页,因此不用阅读整本书就能查找到感兴趣的位置。 作者的任务之一就是预计哪些项是读者最需要查找的东西,与之类似,预计哪些索引可以带来便利也是数据库程序员的任务。
下面的命令可以用于在id列上创建前面讨论过的索引:
CREATE INDEX test1_id_index ON test1 (id);
索引名字test1_id_index可以自由选择,但是应该选那些稍后可以让你回忆起索引含义的名字。
要删除一个索引,使用DROP INDEX命令。可以在任何时候向表里增加索引或者从表中删除索引。
一旦你创建了索引,那么就不需要更多干涉了:当该表被修改后,系统会自动更新索引,并且当对表进行查询时,如果系统认为使用索引比进行顺序的表扫描更有效时,系统会选择使用索引进行查询。 不过你可能必须经常性地运行ANALYZE命令以更新统计信息,好让查询规划器能够做出有训练有素的判断。 参见Chapter 14获取关于如何获知是否使用了索引的信息,以及在什么时候、什么原因下规划器会决定不使用索引。
索引对带搜索条件的UPDATE和DELETE命令也有好处。 索引更可以用于表链接查询。因此,如果你定义了索引的列是链接条件的一部分,那么它可以显著提高链接的查询速度。
在一个巨大的表上创建索引可能会消耗大量的时间。缺省时,PostgreSQL允许在创建索引的同时读取表(SELECT), 但是写入表(INSERT, UPDATE, DELETE)的动作将被阻塞到索引创建完毕。在生产环境下这种阻塞通常是不可接受的, 因此也允许在创建索引的同时写入表,但是有一些警告需要注意,更多信息参见Building Indexes Concurrently。
创建索引之后,它必须和表保持同步。这些操作增加了数据操作的负荷。因此我们应该把那些非关键或者根本用不上的索引删除掉。