🕵️ MySQL 終極陷阱題：資深工程師的 10 大 SQL 漏洞檢視

如果你認為自己是資深後端或資料庫專家，請先試著回答這些問題。它們來自高階面試現場，專門用來篩選出那些只會寫 CRUD，卻不理解底層原理的工程師。

這些陷阱的核心在於：語法糖衣下的執行計畫與邊界條件。

一、數據正確性與邏輯陷阱 (NULL, Group By, Join)

1. 陷阱：NULL 與比較的特殊行為

題目示例： WHERE col != 0 AND col IS NOT NULL 與 WHERE NOT col = 0 結果會一樣嗎？索引會怎樣被使用？

核心原理	理想回答要點	紅旗警告 (Red Flag)
三值邏輯 (Three-Valued Logic)：`NULL` 參與任何比較（`=`、`!=`、`<`）的結果都是 `UNKNOWN`。`WHERE` 子句只選擇結果為 `TRUE` 的行。	結論：結果一樣，都會排除 `col` 為 `NULL` 的行。細節： `col != 0` 不會匹配 `NULL`，因結果是 `UNKNOWN`。`col = 0` 對 `NULL` 也是 `UNKNOWN`，`NOT UNKNOWN` 仍然是 `UNKNOWN`，故都會被排除。索引：雖然兩種寫法語義相同，但優化器對第一種寫法（顯式 `IS NOT NULL`）的判斷通常更清晰，更容易走索引。建議：永遠使用 `IS NULL` / `IS NOT NULL` 來處理空值，並用 `EXPLAIN` 驗證查詢計畫。	不能解釋 `NULL` 在 `WHERE` 條件下的影響，或沒提到用 `EXPLAIN` 驗證索引是否被使用。

2. 陷阱：GROUP BY 與 `ONLY_FULL_GROUP_BY` 模式

題目示例： SELECT id, name, MAX(score) FROM t GROUP BY id; 這樣寫是否合法？結果可靠嗎？

核心原理	理想回答要點	紅旗警告 (Red Flag)
聚合語義與非確定性：在標準 SQL 或 MySQL `ONLY_FULL_GROUP_BY` 模式下，`SELECT` 中所有非聚合欄位都必須出現在 `GROUP BY` 中。否則，`name` 欄位的值將是非確定的（隨意從分組中選取一行）。	結論：在 MySQL 5.7+ 且啟用 `ONLY_FULL_GROUP_BY` 時不合法；禁用時合法但不可靠。解決： 1. 使用 `ANY_VALUE(name)` 顯式告知優化器隨意選取；2. 推薦使用 Window Function (MySQL 8+)，如 `ROW_NUMBER() OVER (PARTITION BY id ORDER BY score DESC)`，以確保語義清晰且結果確定。	認為 MySQL 總是允許此類查詢，或忽略 `name` 欄位值的非確定性。

5. 陷阱：`LEFT JOIN` 的退化

題目示例： LEFT JOIN 之後在 WHERE 篩掉右表欄位 IS NULL 的情況，會發生什麼？

核心原理	理想回答要點	紅旗警告 (Red Flag)
JOIN 與 WHERE 的執行順序： `JOIN` 先執行並產生虛擬表，`WHERE` 後執行進行過濾。`LEFT JOIN` 的目的是保留左表所有行，即使右表不匹配，右表欄位為 `NULL`。	結論： `LEFT JOIN` 會退化成 `INNER JOIN`。細節：由於 `LEFT JOIN` 的未匹配行中，右表欄位皆為 `NULL`。如果你在 `WHERE` 條件中篩選 `右表欄位 IS NOT NULL`，你將剛好排除了所有左表未匹配的行，行為等同於 `INNER JOIN`。正確做法：應將連接條件放在 `ON` 子句，將過濾左表的條件放在 `WHERE` 子句。	混淆 `JOIN ON`（連接條件）與 `WHERE`（過濾條件）的語義與執行順序，導致結果錯誤。

二、效能、優化器與邊界陷阱 (Index, Subquery, Order By)

4. 陷阱：隱式類型轉換與索引失效

題目示例： 有索引的 varchar_col = 123 與 varchar_col = '123' 哪個會用到索引？LIKE '%abc' 能用索引嗎？

核心原理	理想回答要點	紅旗警告 (Red Flag)
索引可比性：索引樹是按二進位儲存排序。一旦優化器需要對索引欄位進行函式運算或隱式轉型才能比較，索引就無法使用。	結論： `varchar_col = '123'` 會走索引。`varchar_col = 123` 會觸發 MySQL 隱式將 `varchar_col` 轉換為數字，導致索引失效，進行全表掃描。LIKE： `LIKE '%abc'` (前置通配) 破壞了索引的前綴匹配性，無法使用。解法： 1. 避免轉型：確保查詢參數的型別與欄位一致。2. 前綴索引： `LIKE 'abc%'` 可以使用索引。3. 全文檢索： `LIKE '%abc'` 應改用 FULLTEXT Index 或外部搜尋引擎。	只會說「加索引」卻不能解釋隱式轉換的底層原理，或不了解 `LIKE` 前置通配的限制。

3. 陷阱：ORDER BY、LIMIT 的作用域

題目示例： 你在子查詢中用 ORDER BY + LIMIT，外層 JOIN 後順序保證嗎？

核心原理	理想回答要點	紅旗警告 (Red Flag)
排序作用域： SQL 規定，如果沒有在最外層 `SELECT` 指定 `ORDER BY`，資料庫不保證最終結果的順序。優化器有權重寫查詢以提升性能。	結論：順序不保證。細節：除非子查詢是一個 `Derived Table` 或 `View`，且外層查詢完全依賴其順序，否則優化器可能在 `JOIN` 過程中重排數據。特殊情況： `LIMIT` 是唯一能「保留」子查詢排序效果的機制，因為它限制了結果集。建議：如果需要最終順序，必須在最外層指定 `ORDER BY`。若要選取每個分組的 Top N，使用 Window Functions (MySQL 8+ 的 `ROW_NUMBER()`) 更清晰與高效。	認為任何層的 `ORDER BY` 都會保留至最終結果。

6. 陷阱：子查詢 vs JOIN 的性能與語意差異

題目示例： 寫一個查詢要拿到最新的每個 user 的 log（group by user id, latest timestamp），你會用 correlated subquery、derived table、還是 JOIN？為什麼？

核心原理	理想回答要點	紅旗警告 (Red Flag)
查詢執行效率：考驗對不同寫法在數據庫執行計畫下的性能差異與取捨。Correlated Subquery（相關子查詢）在高資料量時常是性能殺手。	結論：首選 `Derived Table` (與 Window Function) 結合 `JOIN`。細節： 1. 相關子查詢：對外層的每行數據都執行一次內層查詢，在高資料量時性能最差。2. `Derived Table`：先在內層查詢中 `GROUP BY user_id` 找到 `MAX(timestamp)`，形成一個臨時表，再與原表 `JOIN` 撈取完整資料。性能通常比相關子查詢好。3. Window Function (MySQL 8+)：最佳解。使用 `ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY timestamp DESC)` 標記最新行，在外層 `WHERE rn = 1` 即可。	只憑習慣選擇相關子查詢，且不能透過 `EXPLAIN` 比較說明其在高資料量下的性能陷阱。

三、並發、事務與 DDL 陷阱 (Lock, Isolation, DDL)

7. 陷阱：事務隔離與非預期讀 (Phantom / Lost Update)

題目示例： 在 REPEATABLE READ 下，UPDATE ... WHERE id IN (SELECT ...) 會不會有 race condition？如何避免 lost update？

核心原理	理想回答要點	紅旗警告 (Red Flag)
InnoDB 鎖機制：隔離級別、MVCC、Gap Locks 與 Next-Key Locks 的實際應用。	結論：有 Race Condition，特別是 `Lost Update`。`REPEATABLE READ` 能透過 MVCC 與 Gap Locks 防禦 `Phantom Read`，但不能天然防禦 `Lost Update`。避免 Lost Update： 1. 悲觀鎖：在 `SELECT` 時使用 `SELECT ... FOR UPDATE` 鎖定將要更新的行。2. 樂觀鎖：在表中加入版本號（`version` 欄位），更新時檢查並增加版本號。3. 應用層重試：結合版本號或 `FOR UPDATE`，設置合理的重試策略。	泛泛說「用 TRANSACTION 就可以」，而無法準確區分隔離級別對幻讀 (Phantom Read) 與丟失更新 (Lost Update) 的防禦策略。

8. 陷阱：DDL 的行為與線上變更陷阱

題目示例： ALTER TABLE ADD COLUMN 在 InnoDB 上是線上還是阻塞？什麼情況會鎖表？

核心原理	理想回答要點	紅旗警告 (Red Flag)
線上 DDL (Online DDL) 與表重建： MySQL 版本、DDL 類型、`ALGORITHM=INPLACE` 與 `LOCK=NONE` 的支援程度。	結論：在 MySQL 5.6+，多數 `ADD COLUMN` 操作支持 Online DDL (使用 `ALGORITHM=INPLACE`)，不會阻塞寫入。鎖表情況： 1. 舊版本 MySQL。2. 某些操作（如修改欄位類型、新增主鍵、修改字元集）仍可能導致表重建（Rebuild），造成短暫的 DDL 鎖。安全策略：在生產環境，始終使用 `pt-online-schema-change` 或 `gh-ost` 進行線上變更，並搭配雙寫與回滾計畫。	不了解 DDL 的實際影響或不清楚 Online DDL 的版本與類型限制，建議直接在生產環境執行大型 `ALTER`。

四、字元集與查詢功能陷阱 (Collation, Fulltext)

9. 陷阱：字元集與排序 (Collation) 導致的比對錯誤

題目示例： 為什麼 WHERE name = 'Å' 找不到，但同樣資料顯示在表裡？

核心原理	理想回答要點	紅旗警告 (Red Flag)
字元集 (Charset) 與排序規則 (Collation)： `Collation` 決定了字元如何比較與排序。	結論：極可能是字元集不匹配或使用了不當的 Collation。細節：查詢字元集 (Connection Collation) 與欄位字元集不同，或欄位使用了 Case-Insensitive (CI) 或 Accent-Insensitive (AI) 的 Collation。例如 `utf8_general_ci` 會將 `A` 與 `a` 視為相等，甚至可能將某些重音字元視為相等。解法： 1. 確保資料庫、表、欄位、連接的字元集一致且都使用 `utf8mb4`。2. 需精確比較時，使用 `BINARY` 或 `COLLATE utf8mb4_bin` 進行位元組級比較。	把字元問題推給「資料錯誤」，卻沒有檢查 `collation` 與 `connection charset`，暴露多語系處理經驗的不足。

10. 陷阱：`LIKE` / `FULLTEXT` / 正則的權衡與適用場景

題目示例： 要做文字搜尋，何時用 LIKE、何時用 FULLTEXT、何時導入外部搜尋（ElasticSearch）？

核心原理	理想回答要點	紅旗警告 (Red Flag)
功能與成本權衡：考驗對搜尋功能（分詞、排序、模糊）、性能、維護成本的綜合判斷。	結論：依功能與資料量劃分：1. LIKE：適用於小型資料集、前綴匹配、簡單篩選。性能差，無法做相關性排序。2. FULLTEXT (MySQL)：適用於中等資料量、需要詞彙分詞、相關性排序的簡單全文檢索。受限於語言、最小字長。3. 外部搜尋 (ES/Solr)：適用於大規模資料、複雜分詞、多語系、高階排序/聚合、低延遲的業務。關鍵：需考慮增量同步方案（CDC）。	忽視業務需求與維運成本，只會使用單一方法，或不了解 MySQL `FULLTEXT` 的功能限制。

核心提示： 真正的資深工程師，在回答任何 SQL 問題時，都會自動加上一句：「我會用 EXPLAIN 來驗證查詢計畫。」這是從經驗中學習的最好證明。

羅培宸的技術筆記：從面試戰場到 AI 實戰

2025年11月3日星期一