http://www.skywind.name/blog/?p=85
 SQL-3标准中提供了三种对检索结果进行集合运算的命令:并集UNION;交集INTERSECT;差集EXCEPT(在Oracle中叫做MINUS)。在有些数据库中对此的支持不够充分,如MySql中只有UNION,没有其他两种。实际上这些运算都可以通过普通的SQL来实现,虽然有时有些繁琐。

假设有两个表(或视图)s,t,s中有两个字段sa,sb;t中有两个字段ta,tb;

差集EXCEPT:

SQL:

  1. SELECT sa FROM s
  2. EXCEPT
  3. SELECT ta FROM t;

可以写作

SQL:

  1. SELECT sa FROM s
  2. WHERE sa NOT IN
  3.     (SELECT ta FROM t)

上面的例子中忽略了对s和t单独的条件,这些总可以加入AND条件完成,或者使用视图。如果是多个字段比较麻烦,如:

SQL:

  1. SELECT sa, sb FROM s
  2. EXCEPT
  3. SELECT ta, tb FROM t;

需要写成

SQL:

  1. SELECT sa, sb FROM s
  2. WHERE (sa, sb) NOT IN
  3.     (SELECT ta, tb FROM t)

上面使用的语法不见得数据库都支持。好在不支持EXCEPT的MySQL支持这种语法,而不支持这种语法的MSSQL又支持EXCEPT。

注意对于这样的row constructors(Mysql术语),是和下面写法(以及其他类似写法)不等价的。

SQL:

  1. SELECT sa, sb FROM s
  2. WHERE sa NOT IN
  3.     (SELECT ta FROM t)
  4. AND sb NOT IN
  5.     (SELECT tb FROM t)

在MSSQL中的一个解决技巧是,把这两个字段(假设字符类型)拼起来,即

SQL:

  1. SELECT sa, sb FROM s
  2. WHERE sa+sb NOT IN
  3.     (SELECT ta+tb FROM t)

交集INTERSECT:

SQL:

  1. SELECT sa FROM s
  2. INTERSECT
  3. SELECT ta FROM t;

可以写成

SQL:

  1. SELECT sa FROM s
  2. WHERE sa  IN
  3.     (SELECT ta FROM t)

当然也可以写成

SQL:

  1. SELECT sa FROM s
  2. WHERE EXISTS
  3.     (SELECT * FROM t WHERE t.ta=s.sa)

或者使用连接

SQL:

  1. SELECT sa FROM s, t
  2. WHERE sa = ta

实际上这几个语句都有点问题,就是INTERSECT在出现重复时的语义问题。按照SQL-3标准,类似UNION,可以有明确的INTERSECT ALL或者INTERSECT DISTINCT语法。一般的INTERSECT实现并没有明确这一点,而且从逻辑上讲意义也不大。那么当s或t中出现重复的时,如sa='x'的有2个,sb='x'的有3个,使用上面的子查询将返回2行,使用连接将返回6行,当然这两个语句都可以加上一个DISTINCT,就实现了INTERSECT DISTINCT语义了。

并集UNION:

MySql从4.0开始就支持UNION(ALL 和 DISTINCT)了,为完整起见,也列举一下。
其实实现这样一个结果是很麻烦的

SQL:

  1. SELECT sa FROM s
  2. UNION DISTINCT
  3. SELECT ta FROM t;

需要使用外连接,而且是Full的外连接

SQL:

  1. SELECT DISTINCT NVL(s.sa, t.ta)
  2. FROM s FULL OUTER JOIN t ON (s.sa=t.ta)

上面的例子中我使用了Oracle的语法,实际上MySql不支持FULL OUTER JOIN(虽然支持LEFT和RIGHT OUTER JOIN),好在MySql支持UNION。

对于UNION ALL语义,我还没有想出来用普通查询如何实现,如果在上面语句中去掉DISTINCT,结果肯定不对。

arrow
arrow
    全站熱搜

    ketelle_w 發表在 痞客邦 留言(0) 人氣()