羅培宸的技術筆記：從面試戰場到 AI 實戰: PHP 全端工程師面試指南：CTO 必問的資料庫生死五問

2025年11月3日星期一

PHP 全端工程師面試指南：CTO 必問的資料庫生死五問

💻 架構與資料模型 (Architecture & Data Model)

關鍵問題	資深架構師回應與建議
資料庫拓撲？	標準：至少採用主從複製 (Master-Slave/Primary-Replica)。讀寫分離是基本要求。進階：針對高寫入或極大資料量服務，可能採用垂直或水平分片 (Sharding)。
優缺點？	主從：優點是高可用性與讀擴展；缺點是寫入瓶頸，且存在複製延遲導致的讀寫一致性問題。分片：優點是寫入與資料容量的線性擴展；缺點是引入極高的複雜度（路由、跨分片查詢、再平衡）。
資料分層策略？	熱資料 (Hot)：近期活躍，存放於高性能 SSD 的主庫或讀寫分離的 Replica 叢集。冷資料 (Cold)：存取頻率極低，可透過歸檔 (Archive) 或 TTL/Partitioning 移至成本較低的儲存（如 S3/Blob Storage 或專用歸檔 DB）。歷史資料：僅用於審計或合規，可離線存儲。策略：基於時間或業務狀態，採用定期 ETL 或資料庫分區 (Partitioning) 自動化遷移。
Schema 正規化？	正規化：核心交易與高一致性要求的資料，維持到第三正規化 (3NF)，避免資料冗餘，有利維護與更新。反正規化：應用於讀取密集或報表查詢，特別是當跨表 Join 成為效能瓶頸時（例如，將常用但靜態的欄位如用戶名，複製到訂單表）。維度化：在資料倉儲 (Data Warehouse/BI) 環境中使用，便於分析。
領域界限 (Bounded Context)？	必要：應將每個微服務或領域服務對應到獨立的資料庫或至少獨立的 Schema。跨服務交易：透過非同步訊息佇列 (Message Queue/Event Bus) 實現最終一致性 (Eventual Consistency)，遵循 Saga 模式處理複雜的跨服務事務，避免傳統的分佈式事務 (2PC)。
多租戶資料隔離？	建議：初期可選同表加租戶欄位 (Tenant ID in shared tables)，優勢是成本低、維護簡單。但若租戶間數據隔離要求極高、或有大型租戶需要獨立資源，則應採獨立資料庫 (Separate Database per Tenant)，優勢是隔離性最強、易於備份與還原**。選擇依據是：安全合規、擴展性需求與運營成本。
事件溯源/CQRS？	看業務複雜度：對於複雜的領域 (如金融交易、庫存變化)，事件溯源 (Event Sourcing, ES) 可提供完整的審計軌跡與歷史狀態重建能力。CQRS (Command Query Responsibility Segregation)：寫入端 (Command) 複雜且查詢端 (Query) 頻繁時採用。策略：透過 Domain Events 驅動，使用 Message Queue 確保事件傳輸的可靠性，並由 Read Model 異步更新，接受最終一致性。

⚡ 效能與擴展 (Performance & Scaling)

關鍵問題	資深架構師回應與建議
最大的效能瓶頸？	通常在於：熱點查詢 (缺少索引或複雜 Join)、鎖競爭 (Lock Contention，尤其在高寫入場景)、慢查詢導致的 IO 飽和。量化指標：關注 `QPS/TPS`、`95th/99th Latency`、`Buffer Pool Hit Rate`、`IOPS`。
慢查詢分析流程？	應建立自動化流程：1. 收集：透過 `slow query log` 或 APM 工具 (如 Datadog, New Relic) 收集。2. 分析：定期或實時分析，按執行時間、執行次數、掃描行數等排序，識別 Top N。3. 優先修復：優先處理影響核心業務且高頻率的查詢。修復後立即 Code Review 驗證 `EXPLAIN` 計畫。
索引策略？	制定：基於查詢模式 (`WHERE`/`ORDER BY`/`GROUP BY`) 與寫入頻率的權衡。評估成本：新增索引會增加寫入延遲、儲存空間和維護開銷。原則：避免過多單列索引，優先考慮複合索引；定期審查未使用的索引 (冗餘或過度索引)，並清理。
大型查詢與報表？	絕對禁止阻塞生產庫：應將分析/報表查詢導向專用的只讀 Replica 或離線數據層。採用：透過 ETL 或 CDC (Change Data Capture) 將資料異步同步到資料倉儲 (OLAP DB) 或 Elasticsearch/物化視圖 (Materialized View) 供報表使用。
寫入負載高時的策略？	節流/平滑：應用端可採用批次寫入 (Batch Insert/Update) 減少網路 RTT；使用消息佇列 (MQ) 作為前端緩衝 (CQ 後端)，將瞬時高寫入轉化為 DB 後端可控的穩定速率寫入。優點：降低 DB 瞬時壓力，保障核心服務穩定。
線上擴展 (Scale-out)？	讀寫分離：透過 Proxy 層 (如 ProxySQL, Vitess) 自動路由。分片邏輯：必須基於業務，選定穩定且高頻率的 Sharding Key (例如 Tenant ID, User ID)。再平衡：是一個高風險操作，流程需自動化且經過嚴格的灰度測試，通常採用雙寫與數據驗證階段，最小化對線上服務的衝擊。

🛡️ 可用性、備援與運維 (Availability, Backup & Operations)

關鍵問題	資深架構師回應與建議
RTO/RPO 目標？	RPO (資料丟失)：應盡力接近 0，透過實時或近實時複製 (Streaming Replication) 達成。RTO (恢復時間)：根據業務 SLA，目標應在 5-15 分鐘內。滿足性：需定期 Failover 演練 (每年至少兩次) 驗證 RTO/RPO，確保自動切換機制可靠。
備份策略與驗證？	採用全量備份 (Full) 配合增量/日誌備份 (Incremental/WAL) 最小化備份時間與 RPO。驗證：備份完成後必須自動還原到隔離環境並運行資料一致性檢查。保留策略：遵循 3-2-1 原則 (3 份副本，2 種介質，1 份異地)。
故障切換 (Failover)？	優先自動化：透過 DB 專用工具 (如 Orchestrator, Patroni) 自動執行 Primary 選舉與 Replica 重新指向，將 RTO 降至最低。一致性保證： Failover 後應立即檢查新的 Primary 是否已應用所有事務。若採用非同步複製，必須接受極少量事務的丟失風險，或採用半同步複製來權衡。
監控指標與告警？	核心指標：延遲、錯誤率、鎖等待、連接數、磁碟 IOPS/飽和度。OOME (Out Of Memory Error)：重點關注 DB Server 的 Buffer Pool/Cache 與 OS 記憶體。告警閾值：應基於基線 (Baseline) 設定，而非固定值。例如，延遲超過基線的 3 倍且持續 2 分鐘觸發 P1 告警。重複執行計數：關注事務重試、失敗次數，是應用端穩定性的風向標。
升級與遷移策略？	採用藍綠 (Blue/Green) 或滾動部署 (Rolling Update) 策略。流程：先建立新版本/新 DB 作為新的 Slave/Replica，驗證同步。切換時，逐步將流量從舊版本 (Blue) 切到新版本 (Green)，最終將舊 DB 下線。關鍵：確保新舊 Schema 的兼容性，最小化停機與回滾風險。
日常維護？	排程： VACUUM/OPTIMIZE/統計資訊更新需在低峰時段定期運行。自動化：應盡可能透過 DB 內建功能 (如 PostgreSQL Autovacuum) 或排程工具實現自動化。責任：應歸屬於 DevOps/SRE 團隊，並由核心開發團隊定期覆核維護效益。

🔒 安全性與治理 (Security & Governance)

關鍵問題	資深架構師回應與建議
資料存取控制？	原則：最小權限 (Least Privilege)。應用程式應使用專用帳號，只授予執行所需 Stored Procedure/Function 和存取特定 Table 的權限。審計 (Audit Log)：啟用 DB 自身的審計功能，記錄所有對敏感資料表的 `SELECT/UPDATE/DELETE` 操作，並安全存儲。
敏感資料保護？	必須實施多層次保護。加密 at-rest：啟用磁碟層加密或 DB 自身的透明資料加密 (TDE)。加密 in-transit：強制使用 TLS/SSL 連線。欄位加密/令牌化：對於支付卡號、身份證號等極度敏感數據，應在應用層進行欄位級加密或替換為 Token (令牌化)，DB 只存儲加密或 Token 值。
跨地區/第三方傳輸合規？	必須遵循傳輸地或接收地的當地法規 (如 GDPR, CCPA)。所有傳輸都必須經過加密通道。與第三方合作時，需確保其符合我方安全協議，並有詳細的資料處理協議 (DPA) 與傳輸日誌。
憑證與密鑰管理？	應將所有 DB 憑證與密鑰存儲於專門的密鑰管理系統 (KMS)，如 Vault、AWS Secrets Manager。自動輪換：憑證應設定定期自動輪換 (例如每 90 天)。泄露應變：一旦懷疑密鑰泄露，立即停止使用該密鑰並強制進行緊急輪換與系統審計。
SQL 注入防護？	開發原則：永遠使用參數化查詢 (Prepared Statements)，絕不拼接 SQL 字串。測試：在 CI/CD 流程中加入 SAST/DAST 工具進行安全掃描。應用層：使用 WAF (Web Application Firewall) 提供額外防護。
資料生命週期與刪除？	生命週期：遵循資料分層策略，定期歸檔。刪除：對於用戶請求的刪除或法規要求的刪除，應實現硬刪除 (Hard Delete)，確保資料從主庫、備份、日誌中不可逆地刪除，並有審計紀錄。需定期檢查歸檔數據的刪除策略。

🚀 演進、遷移與技術選型 (Evolution & Future)

關鍵問題	資深架構師回應與建議
未來成長與容量規劃？	預期：應基於業務增長率 (例如每月 20% 的用戶增長)，推算未來 12-24 個月的 DB 儲存需求與 RPS (Request Per Second) 增長。容量規劃：確保有足夠的擴展緩衝區 (例如當前容量只使用 50% 時就規劃下一步擴展)。需定期進行負載測試以驗證當前架構在高負載下的表現。
雲端資料庫考慮？	非常值得考慮。優先考量：降低運維成本 (OPEX)、自動化備份/災難復原、更高的彈性擴展、專業的性能調優工具。Aurora/Spanner 等提供了超越自建方案的高可用性與擴展能力，能讓工程師專注於業務邏輯。權衡：成本、廠商鎖定 (Vendor Lock-in) 程度、合規性要求。
技術選型痛點與收益？	痛點案例：複雜查詢極慢、全文搜索效率低、實時分析延遲高。加入輔助存儲： NoSQL (MongoDB/Redis)：應對高併發讀寫 (如緩存) 或彈性 Schema 需求。Search (Elasticsearch)：解決全文搜索與複雜聚合查詢。TimeSeries：適用於 IoT 或監控數據。收益/成本評估：需計算開發/遷移人力成本 vs 預期性能提升/維護成本節省的 ROI。
資料治理與變更管理？	流程：應採用 Schema-as-Code (如 Flyway/Liquibase) 管理所有 Schema 變更。協調：變更必須經過 Code Review 與 DBA/架構師審批。對於大規模或破壞性變更，需在獨立環境進行壓力測試，並設定回滾計畫。治理：定期審查資料字典與數據定義。
零停機/微秒級延遲架構？	零停機：採用藍綠/滾動部署。微秒級延遲：短期：優化 Top N 慢查詢、更激進地使用記憶體緩存 (Redis/Memcached)。架構改造：去中心化：將部分非核心數據或高讀取服務遷出關係型資料庫。考慮使用分佈式數據庫或內存數據庫 (In-Memory DB)。網路：檢查應用與 DB 間的網路延遲。
技術債清單優先順序？	1. 必須立刻處理 (高風險/高成本)：安全漏洞 (如老舊 DB 版本、弱密碼)、核心業務的慢查詢導致的服務不穩定性、未經驗證的備份/復原流程。2. 中期處理 (架構優化/效率)：過度耦合的資料庫設計、手動運維流程。3. 後期處理 (開發效率/整潔度)：不一致的命名規範、不必要的反正規化。

這份全面的回答涵蓋了從底層拓撲到未來戰略的各個層面。這是我在實戰中面對類似挑戰時的標準作業流程。

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)