7.5. 行排序

在查询生成输出表之后,也就是在处理完选择列表之后,你还可以对输出表进行排序。 如果没有排序,那么行将以不可预测的顺序返回(实际顺序将取决于扫描和连接规划类型和在 磁盘上的顺序,但是肯定不能依赖这些东西)。 确定的顺序只能在明确地使用了排序步骤之后才能保证。

ORDER BY子句用于声明排序顺序:

SELECT select_list
    FROM table_expression
    ORDER BY sort_expression1 [ASC | DESC] [NULLS { FIRST | LAST }]
             [sort_expression2 [ASC | DESC] [NULLS { FIRST | LAST }] ...]

sort_expression(s)是任何可用于选择列表的表达式,例如:

SELECT a, b FROM table1 ORDER BY a + b, c;

如果指定了多个排序表达式,那么仅在前面的表达式排序相等的情况下才使用后面的表 达式做进一步排序。每个表达式都可以跟一个可选的ASC(升序,默认)或 DESC(降序) 以设置排序方向。升序先输出小的数值,这里的"小"是以<操作符的角度定义的。 类似的是,降序是以>操作符来判断的。 [1]

NULLS FIRSTNULLS LAST选项可以决定在排序操作中在non-null值之前还是之后。默认情况下,空值大于任何非空值;也就是说,DESC排序 默认是NULLS FIRST,否则为NULLS LAST

注意,排序选项对于每个排序列是相对独立的。例如ORDER BY x, y DESC意思是说ORDER BY x ASC, y DESC, 不同于ORDER BY x DESC, y DESC.

一个sort_expression也可以是列标签或数 输出列,如:

SELECT a + b AS sum, c FROM table1 ORDER BY sum;
SELECT a, max(b) FROM table1 GROUP BY a ORDER BY 1;

都按照第一个字段进行排序。需要注意的是,输出字段名必须是独立的 (不允许作为排序表达式的一部分)。比如,下面的语句是not正确的。

SELECT a + b AS sum, c FROM table1 ORDER BY sum + c;          -- wrong

这样的限制主要是为了减少歧义。另外,如果某个ORDER BY排序表达式能够同时匹配输 出字段名和表表达式中的字段名,也会导致歧义(此时使用输出字段名)。当 然,这种情况仅在你使用了AS重命名输出字段并且恰好与其它 表的字段同名的时候才会发生。

ORDER BY可以应用于UNIONINTERSECT或者EXCEPT的计算结果,不过在这种情况下,只允许按照字段名或编号进行排序,而不允许按照表达式进行排序。

Notes

[1]

事实上,PostgreSQL使用默认的B-tree操作符类为表达式的数据类型确定ASCDESC排序顺序。一般来说, 数据类型将被转换为适合于<和>操作符进行排序。但是对于用户自定义的数据类型可以不必如此。