php怎么插入数据_INSERT语句防止重复插入的技巧【详解】

INSERT IGNORE在主键或唯一键冲突时静默跳过,影响行为为0;ON DUPLICATE KEY UPDATE实现存在则更新、不存在则插入,返回影响行数均为1;REPLACE INTO是先删后插,可能导致自增ID递增及外键问题。

INSERT IGNORE 适合主键或唯一键冲突时静默跳过

当表中已有 idemail 这类带 UNIQUE 约束的字段,直接用 INSERT INTO ... VALUES 遇到重复会报错:1062 Duplicate entry。加 IGNORE 后,MySQL 会把冲突当作警告而非错误,语句继续执行,不中断后续逻辑。

注意:它只对违反 PRIMARY KEYUNIQUE 约束生效,对其他错误(如字段超长、类型不匹配)仍报错。

INSERT IGNORE INTO users (id, name, email) VALUES (1, 'Alice', 'a@example.com');
  • 如果 id=1 已存在,这条语句影响行数为 0,PHP 中 mysqli_affected_rows()PDOStatement::rowCount() 返回 0
  • 不能区分“真插入”和“因重复跳过”,需结合业务判断是否需要后续处理
  • 不触发 ON DUPLICATE KEY UPDATE 的更新逻辑,纯跳过

ON DUPLICATE KEY UPDATE 实现“存在则更新,不存在则插入”

这是更可控的方式,适用于想保留最新数据的场景,比如用户资料同步、计数器累加。

必须确保表有至少一个 UNIQUEPRIMARY KEY 字段,否则该语法无意义。

INSERT INTO users (id, name, email, updated_at) 
VALUES (1, 'Alice', 'a@example.com', NOW()) 
ON DUPLICATE KEY UPDATE 
  name = VALUES(name), 
  email = VALUES(email), 
  updated_at = NOW();
  • VALUES(name) 表示本次 INSERT 语句中对应列的值,不是当前行原值
  • 可安全用于更新时间戳、访问次数等字段,例如 visit_count = visit_count + 1
  • 若主键是自增 id,但你想用 email 去判重,则必须给 emailUNIQUE 索引,否则不触发更新

REPLACE INTO 是删除+插入,慎用于有外键或触发器的表

REPLACE INTO 不是标准 SQL,是 MySQL 特有语法。它的行为是:先尝试插入,若遇到主键/唯一键冲突,则先 DELETE 原有行,再 INSERT 新行。

这会导致自增 id 每次冲突都递增,且可能破坏外键引用、触发 DELETE 触发器,不是“无感更新”。

REPLACE INTO users (id, name, email) VALUES (1, 'Alice', 'a@example.com');
  • 如果 id=1 存在,原记录被删,新记录插入,id 不变但 auto_increment 值仍会 +1
  • 若该表被其他表通过 FOREIGN KEY 引用,且未设 ON DELETE CASCADE,会直接报错失败
  • 相比 INSERT ... ON DUPLICATE KEY UPDATE,它多一次磁盘 I/O,性能略差

PHP 中用 PDO 判断是否真正插入成功

仅靠 execute() 返回 true 无法知道是插入还是跳过/更新。必须查 rowCount()

$stmt = $pdo->prepare("INSERT INTO users (email, name) VALUES (?, ?) ON DUPLICATE KEY UPDATE name = VALUES(name)");
$stmt->execute(['a@example.com', 'Alice']);
if ($stmt->rowCount() === 1) {
    // 真正插入了一行
} elseif ($stmt->rowCount() === 2) {
    // 先删后插(REPLACE)或 ON DUPLICATE 导致更新+插入共影响两行?不,注意:MySQL 中 ON DUPLICATE KEY UPDATE 的 rowCount() 对“插入”返回 1,对“更新”也返回 1 —— 它表示“变更的行数”,不是“SQL 操作类型数”
    // 正确理解:INSERT ... ON DUPLICATE KEY UPDATE 的 rowCount() 在插入时返回 1,在更新时也返回 1;只有 REPLACE INTO 在更新时才可能返回 2(删1+插1)
}
  • 别依赖 mysql_insert_id() 判断是否新增:ON DUPLICATE KEY UPDATE 下它仍返回自增 ID(哪怕只是更新),INSERT IGNORE 下可能返回 0 或上一次插入 ID
  • 最稳妥方式:显式查一遍,如 SELECT id FROM users WHERE email = ?,再决定后续动作
  • 高并发下,即使用了 ON DUPLICATE KEY UPDATE,仍建议加事务包裹关键逻辑,避免竞态导致数据不一致
实际业务中,ON DUPLICATE KEY UPDATE 是平衡安全性、可读性和性能的首选。但很多人忽略一点:它要求冲突字段必须有 UNIQUE 索引,而这个索引一旦漏建,整条语句就退化成普通插入,重复数据照进不误。