官网地址:https://dev.mysql.com/doc/refman/8.0/en/replace.html
以下内容基于mysql 8.0版本进行讲解。
replace into与on duplicate key update在一定程度上都能实现无记录时插入,有记录时更新这个需求。但是强烈推荐使用on duplicate key update 原因见下方两者的区别。replace into的坑太多,若要使用请详细阅读本文。
replace into 跟 insert 功能类似,不同点在于:replace into 首先尝试插入数据到表中, 1. 如果发现表中已经有此行数据(根据主键或者唯一索引判断)则先删除此行数据,然后插入新的数据。 2. 否则,直接插入新数据。
要注意的是:插入数据的表必须有主键或者是唯一索引!否则的话,replace into与insert into功能一致,会直接插入数据,这将导致表中出现重复的数据。
如果归纳一下 REPLACE INTO 语句的执行规则,基本会有以下几种情况:
AUTO_INCREMENT 值会 +1
。第五点会有副作用:见本文《3.1.3、有主键有唯一索引且唯一索引冲突(有坑)》
第六点会有副作用:见本文《3.1.4、有主键有唯一索引且与一条主键冲突与另一条唯一键冲突(有坑)》
总结
以下总结replace into时可能会遇到的场景
pk:主键 uk:唯一索引
无pk无uk
场景 | replace into时相当于 | replace into在binlog中的表现形式 | 返回影响行数 |
---|---|---|---|
无pk无uk | insert | insert | insert行数 |
只有pk
场景 | replace into时相当于 | replace into在binlog中的表现形式 | 返回影响行数 |
---|---|---|---|
pk冲突 | delete+insert | update | delete+insert行数 |
pk不冲突 | insert | insert | insert行数 |
只有uk
场景 | replace into时相当于 | replace into在binlog中的表现形式 | 返回影响行数 |
---|---|---|---|
uk冲突 | delete+insert | update | delete+insert行数 |
有pk有uk
场景 | replace into时相当于 | replace into在binlog中的表现形式 | 返回影响行数 |
---|---|---|---|
pk冲突 uk不冲突 | delete + insert | delete + insert | delete+insert行数 |
pk不冲突 uk冲突 | delete + insert | update | delete+insert行数 |
pk冲突 uk冲突 | delete + insert | delete+insert | delete+insert行数 |
pk不冲突 uk不冲突 | insert | insert | insert行数 |
replace into
的三种形式1. replace into tbl_name(col_name, ...) values(...) 2. replace into tbl_name(col_name, ...) select ... 3. replace into tbl_name set col_name=value, ...
第一种形式相似于insert into的用法,
第二种replace select的用法也相似于insert select,这种用法并不必定要求列名匹配,事实上,MYSQL甚至不关心select返回的列名,它需要的是列的位置。例如,replace into tb1( name, title, mood) select rname, rtitle, rmood from tb2; 这个例子使用replace into从 tb2中将全部数据导入tb1中。
第三种replace set用法相似于update set用法,使用一个例如“SET col_name = col_name + 1”的赋值,则对位于右侧的列名称的引用会被做为DEFAULT(col_name)处理。所以,该赋值至关于SET col_name = DEFAULT(col_name) + 1。
前两种形式用的多些。其中 “into” 关键字能够省略,不过最好加上 “into”,这样意思更加直观。另外,对于那些没有给予值的列,MySQL 将自动为这些列赋上默认值。
当只有主键且主键冲突时,会执行delete+insert操作
如下sql:
drop table if exists user_test; create table user_test( id int primary key auto_increment comment '主键', name varchar(30) not null comment '姓名', update_time timestamp on update CURRENT_TIMESTAMP comment '更新时间' ) comment '测试表'; insert into user_test(name,update_time) value ('zhangsan','2000-01-01 00:00:00');
此时执行replace into
replace into user_test(id,name) value (1,'zhangsan');
上图可以看出执行replace into之后,返回的受影响条数是2,且update_time的字段被更新为空了。由此证明replace into时当只有主键且主键冲突时执行了delete+insert操作。
注意: 当时间字段设置自动更新后,若没有设置默认值,replace into更新时需要手动赋予时间字段,否则会插入为空。
当有主键有唯一索引且主键冲突时,会执行delete+insert操作
drop table if exists user_test; create table user_test( id int primary key auto_increment comment '主键', name varchar(30) unique not null comment '姓名', update_time timestamp on update current_timestamp comment '更新时间' ) comment '测试表'; insert into user_test(name,update_time) value ('zhangsan','2000-01-01 00:00:00'); replace into user_test(id,name) value (1,'lisi');
上图可以看出执行replace into之后,返回的受影响条数是2,且update_time的字段被更新为空了。由此证明replace into时当有主键有唯一索引且主键冲突时执行了delete+insert操作。
当有主键有唯一索引且唯一索引冲突时,会执行delete+insert操作,且AUTO_INCREMENT自增1
drop table if exists user_test; create table user_test( id int primary key auto_increment comment '主键', name varchar(30) unique not null comment '姓名', update_time timestamp on update current_timestamp comment '更新时间' ) comment '测试表'; insert into user_test(name,update_time) value ('zhangsan','2000-01-01 00:00:00');
此时执行replace into语句
replace into user_test(name) value ('zhangsan');
上图可以看出执行replace into之后,返回的受影响条数是2,且update_time的字段被更新为空了。由此证明replace into时当有主键有唯一索引且唯一索引冲突时执行了delete+insert操作。
注意:唯一索引冲突时会带来副作用,主键id被改变了。
由于主键设置了自增,所以当唯一索引冲突时导致AUTO_INCREMENT的值自增1。
当有主键与唯一索引时,若replace into与其中一条主键冲突、与另一条记录唯一索引冲突,此时执行delete+insert操作。注意:此时受影响的条数是3,且会删除两条数据,可能会有坑
drop table if exists user_test; create table user_test( id int primary key auto_increment comment '主键', name varchar(30) unique not null comment '姓名', update_time timestamp on update current_timestamp comment '更新时间' ) comment '测试表'; insert into user_test(id,name,update_time) values (1,'zhangsan','2000-01-01 00:00:00'), (2,'lisi','2000-01-01 00:00:00'); replace into user_test(id,name) value (1,'lisi');
上图可以看出执行replace into之后,返回的受影响条数是3。
注意: 在该场景下会删除2条数据,然后插入1条数据,所以可能会造成坑,需要特别注意。
语法类似insert into select
示例: replace into t(id, update_time) select 1, now(); replace into tb1( name, title, mood) select rname, rtitle, rmood from tb2;
表结构如下:
drop table if exists user_test; create table user_test( id int primary key auto_increment comment '主键', name varchar(30) unique not null comment '姓名', age int default 2 comment '年龄', sex varchar(10) comment '性别:男、女' ) comment '测试表';
其中: name为唯一索引,age默认值是2
执行以下sql插入第一条数据
replace into user_test set name = 'zhangsan',age = age+1, sex = '男';
可以看到age=3是因为age=default(age)+1,默认age=2然后又+1所以是3;若age字段建表时没有设置默认值则上述sql执行完后age为null。
接着上面的示例,运行以下sql
replace into user_test set name = 'zhangsan',age = age+1;
我们看到id=1的数据被删除了,新增了一条id=2的数据;它的sex字段的值没有继承第一条数据的值,age属性的值也只是由默认值决定,与上一条的值无关。
由此证明结论:
新条目各个属性的值只取决于运行的语句内容,与被删除的旧条目的值无关。
on duplicate key update更多内容参见《MySQL中ON DUPLICATE KEY UPDATE的介绍与使用、批量更新、存在即更新不存在则插入 – 五月天的尾巴》
replace into与on duplicate key update在一定程度上都能实现无记录时插入,有记录时更新这个需求。但是强烈推荐使用on duplicate key update 原因如下:
- replace into在唯一索引冲突时,会删除原记录,然后新增一条记录,如果主键id是自增的会导致主键被改变; 而on duplicate key update在唯一索引冲突时是更新原记录,主键不变。
- replace into唯一索引冲突时会导致主键自增值增加,但由于 binlog 事件记录为 UPDATE 会导致主从环境中表的 AUTO-INCREMENT 值不同,从库执行 UPDATE 事件并不会导致 AUTO-INCREMENT 值增加,所以从库表的 AUTO-INCREMENT 值会小于等于当前表的最新记录主键,当发生主从切换时向新的主库插入记录就会报 duplicate key 错误。
鉴于此,很多使用 REPLACE INTO 的场景,实际上需要的是 INSERT INTO … ON DUPLICATE KEY UPDATE(虽然也会增加自增值,但是不会出现从库表的 AUTO-INCREMENT 值会比当前表的最新记录主键小的情况),与 ‘REPLACE INTO …’ 不同,它只是更新重复行上的值,没有删除,也就不会导致原有主键值的变化。
1:replace into
2:on duplicate key update
一,两者在数据库中无记录时都执行插入操作;在数据库中有记录时都执行“更新”操作。
二,二者在判断有无记录时,都是根据表里的主键或唯一索引。
三,检索到存在记录时,1是先删除原记录,再插入新记录;而2是保持原记录不变,更新指定的字段。
如表中有如下记录,其中id是自增主键,col1是唯一索引:
(id, col1, col2,col3)= (1, a,b,c)
执行
replace into tabelname(col1, col2) values (a,d)
则表中数据变为
(id, col1, col2,col3)= (2, a,d,null)
原记录完全删除,id发生自增。
执行
insert into tablename(col1) values (a)
on duplicate key update col2=d
则表中数据变位
(id, col1, col2,col3)= (1, a,d,c)
col3保持不变,id未自增,不过在插入下一条记录时,id会跳跃。
replace into在有主键或唯一索引冲突时,会执行delete+insert操作,若字段设置了自动更新,需要手动设置时间或者字段设置默认时间,否则时间字段会插入为空
如下sql:
drop table if exists user_test; create table user_test( id int primary key auto_increment comment '主键', name varchar(30) not null comment '姓名', update_time timestamp on update CURRENT_TIMESTAMP comment '更新时间' ) comment '测试表'; insert into user_test(name,update_time) value ('zhangsan','2000-01-01 00:00:00');
此时执行replace into
replace into user_test(id,name) value (1,'zhangsan');
上图可以看出执行replace into之后,update_time的字段被更新为空了。
解决方案
# 方案一:建表时设置字段有默认时间 create table user_test( id int primary key auto_increment comment '主键', name varchar(30) not null comment '姓名', update_time timestamp default current_timestamp on update CURRENT_TIMESTAMP comment '更新时间' ) comment '测试表'; # 方案二:replace into时手动设置时间 replace into user_test values(1,'zhangsan',now());
见本文《3.1.3、有主键有唯一索引且唯一索引冲突(有坑)》
注意:使用replace into时只能用主键更新或者唯一键更新,二选其一。若同时都冲突了,可能会导致异常
见本文《3.1.4、有主键有唯一索引且与一条主键冲突与另一条唯一键冲突(有坑)》