- 第16章 创建高级联结
- 一、使用表别名
- 二、使用不同类型的联结
- 1、自联结
- 2、自然联结
- 3、外部联结
- 三、使用带聚集函数的联结
- 四、使用联结和联结条件
第16章 创建高级联结
使用表别名
使用不同类型的联结
自联结
自然联结
外部联结
使用带聚集函数的联结
使用联结和联结条件
一、使用表别名
第10章中介绍了如何使用别名引用被检索的表列。给列起别名的语法如下:
select concat(rtrim(vend_name), '(', rtrim(vend_country), ')')
as vend_title
from vendors
order by vend_name;
别名除了用于列名和计算字段外,SQL还允许给表名起别名。这样做有两个主要理由:
※ 缩短SQL语句; ※ 允许在单条select
语句中多次使用相同的表。
请看下面的select
语句。它与前一章的例子中所用的语句基本相同,但改成了使用别名:
select cust_name, cust_contact
from customers as c, orders as o, orderitems as io
where c.cust_id = o.cust_id
and oi.order_num = o.order_num
and prod_id = 'TNT2';
应该注意,表别名只在查询执行中使用。与列别名不一样,表别名不返回到客户机。
二、使用不同类型的联结
迄今为止,我们使用的只是称为内部联结或等值联结的简单联结。现在来看3种其他联结,它们分别是自联结、自然联结和外部联结。
1、自联结
如前所述,使用表别名的主要原因之一是能在单条select
语句中不止一次引用相同的表。下面举一个例子。
假如你发现某物品(其ID为DTNTR
)存在问题,因此想知道生产该物品的供应商生产的其他物品是否也存在这些问题。此查询要求首先找到生产ID为DTNTR
的物品的供应商,然后找出这个供应商生产的其他物品。
下面是解决此问题的一种方法:
select prod_id, prod_name
from products
where vend_id = (select vend_id
from products
where prod_id = 'DTNTR');
这是第一种解决方案,它使用了子查询。内部的select
语句做了一个简单的检索,返回生产ID为DTNTR
的物品供应商的vend_id
。该ID用于外部查询的where
子句中,以便检索出这个供应商生产的所有物品。
现在来看使用联结的相同查询:
select p1.prod_id, p1.prod_name
from products as p1, products as p2
where p1.vend_id = p2.vend_id
and p2.prod_id = 'DTNTR';
此查询中需要的两个表实际上是相同的表,因此products
表在from
子句中出现了两次。虽然这是完全合法的,但对products
的引用具有二义性,因为MySQL不知道你引用的是products
表中的哪个实例。
为解决此问题,使用了表别名。products
的第一次出现为别名p1
,第二次出现为别名p2
。现在可以将这些别名用作表名。例如,select
语句使用p1
前缀明确地给出所需列的全名。如果不这样,MySQL将返回错误,因为分别存在两个名为prod_id
、prod_name
的列。MySQL不知道想要的是哪一个列(即使它们事实上是同一个列)。where
(通过匹配p1
中的vend_id
和p2
中的vend_id
)首先联结两个表,然后按第二个表中的prod_id
过滤数据,返回所需的数据。
用自联结而不用子查询自联结通常作为外部语句用来替代从相同表中检索数据时使用的子查询语句。虽然最终的结果是相同的,但有时候处理联结远比处理子查询快得多。应该试一下两种方法,以确定哪一种的性能更好。
2、自然联结
无论何时对表进行联结,应该至少有一个列出现在不止一个表中(被联结的列)。标准的联结(前一章中介绍的内部联结)返回所有数据,甚至相同的列多次出现。自然联结排除多次出现,使每个列只返回一次。
怎样完成这项工作呢?答案是,系统不完成这项工作,由你自己完成它。自然联结是这样一种联结,其中你只能选择那些唯一的列。这一般是通过对表使用通配符(select *
),对所有其他表的列使用明确的子集来完成的。下面举一个例子:
select c.*, o.order_num, o.order_date,
oi.prod_id, oi.quantity, oi.item_price
from customers as c, orders as o, orderitems as oi
where c.cust_id = o.cust_id
and oi.order_num = o.order_num
and prod_id = 'FB';
在这个例子中,通配符只对第一个表使用。所有其他列明确列出,所以没有重复的列被检索出来。
事实上,迄今为止我们建立的每个内部联结都是自然联结,很可能我们永远都不会用到不是自然联结的内部联结。
3、外部联结
许多联结将一个表中的行与另一个表中的行相关联。但有时候会需要包含没有关联行的那些行。
例如,可能需要使用联结来完成以下工作:
※ 对每个客户下了多少订单进行计数,包括那些至今尚未下订单的客户: ※ 列出所有产品以及订购数量,包括没有人订购的产品; ※ 计算平均销售规模,包括那些至今尚未下订单的客户。
在上述例子中,联结包含了那些在相关表中没有关联行的行。这种类型的联结称为外部联结。
下面的select
语句给出一个简单的内部联结。它检索所有客户及其订单:
select customers.cust_id, orders.order_num
from customers inner join orders
on customers.cust_id = orders.cust_id;
外部联结语法类似。为了检索所有客户,包括那些没有订单的客户,可如下进行:
select customers.cust_id, orders.order_num
from customers left outer join orders
on customers.cust_id = orders.cust_id;
类似于上一章中所看到的内部联结,这条select
语句使用了关键字outer join
来指定联结的类型(而不是在where
子句中指定)。但是,与内部联结关联两个表中的行不同的是,外部联结还包括没有关联行的行。在使用outer join
语法时,必须使用right
或left
关键字指定包括其所有行的表(right
指出的是outer join
右边的表,而left
指出的是outer join
左边的表)。上面的例子使用left outer join
从from
子句的左边表(customers
表)中选择所有行。为了从右边的表中选择所有行,应该使用right outer join
,如下例所示:
select customers.cust_id, order.order_num
from customers right outer join orders
on orders.cust_id = customers.cust_id;
没有*=
操作符MySQL不支持简化字符=
和=
的使用,这两种操作符在其他DBMS中是很流行的。
外部联结的类型存在两种基本的外部联结形式:左外部联结和右外部联结。它们之间的唯一差别是所关联的表的顺序不同。换句话说,左外部联结可通过颠倒from
或where
子句中表的顺序转换为右外部联结。因此,两种类型的外部联结可互换使用,而究竟使用哪一种纯粹是根据方便而定。
三、使用带聚集函数的联结
正如第12章所述,聚集函数用来汇总数据。虽然至今为止聚集函数的所有例子只是从单个表汇总数据,但这些函数也可以与联结一起使用。
为说明这一点,请看一个例子。如果要检索所有客户及每个客户所下的订单数,下面使用了count()
函数的代码可完成此工作:
select customers.cust_name,
customers.cust_id,
count(orders.order_num) as num_ord
from customers inner join orders
on customers.cust_id = orders.cust_id
group by customers.cust_id;
此select
语句使用inner join
将customers
和orders
表互相关联。group by
子句按客户分组数据,因此,函数调用count(orders.order_num)
对每个客户的订单计数,将它作为num_ord
返回。
聚集函数也可以方便地与其他联结一起使用。请看下面的例子:
select customers.cust_name,
customers.cust_id,
count(orders.order_num) as num_ord
from customers left outer join orders
on customers.cust_id = orders.cust_id
group by customers.cust_id;
这个例子使用左外部联结来包含所有客户,甚至包含那些没有任何下订单的客户。
四、使用联结和联结条件
在总结关于联结的这两章前,有必要汇总一下关于联结及其使用的某些要点。
※ 注意所使用的联结类型。一般我们使用内部联结,但使用外部联结也是有效的。 ※ 保证使用正确的联结条件,否则将返回不正确的数据。 ※ 应该总是提供联结条件,否则会得出笛卡儿积。 ※ 在一个联结中可以包含多个表,甚至对于每个联结可以采用不同的联结类型。虽然这样做是合法的,一般也很有用,但应该在一起测试它们前,分别测试每个联结。这将使故障排除更为简单。
?