SQL集合运算的通用替代方式 @ ketelle_w的部落格

http://www.skywind.name/blog/?p=85

SQL-3标准中提供了三种对检索结果进行集合运算的命令：并集UNION；交集INTERSECT；差集EXCEPT（在Oracle中叫做MINUS）。在有些数据库中对此的支持不够充分，如MySql中只有UNION，没有其他两种。实际上这些运算都可以通过普通的SQL来实现，虽然有时有些繁琐。

假设有两个表（或视图）s,t，s中有两个字段sa,sb；t中有两个字段ta,tb；

差集EXCEPT：

PLAIN TEXT

SQL:

SELECT sa FROM s
EXCEPT
SELECT ta FROM t;

可以写作

PLAIN TEXT

SQL:

SELECT sa FROM s
WHERE sa NOT IN
(SELECT ta FROM t)

上面的例子中忽略了对s和t单独的条件，这些总可以加入AND条件完成，或者使用视图。如果是多个字段比较麻烦，如：

PLAIN TEXT

SQL:

SELECT sa, sb FROM s
EXCEPT
SELECT ta, tb FROM t;

需要写成

PLAIN TEXT

SQL:

SELECT sa, sb FROM s
WHERE (sa, sb) NOT IN
(SELECT ta, tb FROM t)

上面使用的语法不见得数据库都支持。好在不支持EXCEPT的MySQL支持这种语法，而不支持这种语法的MSSQL又支持EXCEPT。

注意对于这样的row constructors（Mysql术语），是和下面写法（以及其他类似写法）不等价的。

PLAIN TEXT

SQL:

SELECT sa, sb FROM s
WHERE sa NOT IN
(SELECT ta FROM t)
AND sb NOT IN
(SELECT tb FROM t)

在MSSQL中的一个解决技巧是，把这两个字段（假设字符类型）拼起来，即

PLAIN TEXT

SQL:

SELECT sa, sb FROM s
WHERE sa+sb NOT IN
(SELECT ta+tb FROM t)

交集INTERSECT：

PLAIN TEXT

SQL:

SELECT sa FROM s
INTERSECT
SELECT ta FROM t;

可以写成

PLAIN TEXT

SQL:

SELECT sa FROM s
WHERE sa IN
(SELECT ta FROM t)

当然也可以写成

PLAIN TEXT

SQL:

SELECT sa FROM s
WHERE EXISTS
(SELECT * FROM t WHERE t.ta=s.sa)

或者使用连接

PLAIN TEXT

SQL:

SELECT sa FROM s, t
WHERE sa = ta

实际上这几个语句都有点问题，就是INTERSECT在出现重复时的语义问题。按照SQL-3标准，类似UNION，可以有明确的INTERSECT ALL或者INTERSECT DISTINCT语法。一般的INTERSECT实现并没有明确这一点，而且从逻辑上讲意义也不大。那么当s或t中出现重复的时，如sa='x'的有2个，sb='x'的有3个，使用上面的子查询将返回2行，使用连接将返回6行，当然这两个语句都可以加上一个DISTINCT，就实现了INTERSECT DISTINCT语义了。