深入淺出資料庫分片 (Sharding)：當單一資料庫撐不住時，下一步是什麼？

發表於 2025-08-15 分類於技術筆記

在軟體開發旅程中，隨著應用程式用戶量和資料量的爆炸性成長，經常會遇到一個令人頭痛卻又甜蜜的煩惱：資料庫效能瓶頸。當已經做完了所有能想到的優化，從索引調整、查詢改寫到讀寫分離，但資料庫的回應時間依然越來越慢，這或許是一個信號——資料庫需要的是結構性的擴展，而不僅僅是修補。

這篇文章就來聊聊解決這個問題的終極武器之一：資料庫分片 (Database Sharding)。

Sharding 是一個強大但複雜的概念。這篇文章的目標，是帶你用最直觀的方式理解它、了解它的優缺點，並知道何時該認真考慮它。

什麼是 Sharding？一切從水平擴展說起

在討論 Sharding 之前，先快速了解兩種資料庫擴展方式：

垂直擴展 (Vertical Scaling)：又稱「向上擴展」(Scale-up)，就像是為伺服器升級，給它更強的 CPU、更多的 RAM、更快的 SSD。這很直接，但成本昂貴，且有物理極限。總不能無限地加記憶體吧？
水平擴展 (Horizontal Scaling)：又稱「向外擴展」(Scale-out)，不是讓一台伺服器變強，而是增加更多台伺服器，並將負載分散到這些伺服器上。

Sharding，本質上就是一種水平擴展的實踐。

Sharding 就是將一個龐大的資料庫，水平切割成多個更小、更易於管理的部分，這些部分被稱為「分片 (Shards)」。 每個 Shard 都包含整體資料的一部分，並且可以被部署在獨立的伺服器上。

用生活化的比喻來理解：

想像一下，經營著一個擁有全國所有圖書的「中央圖書館」。當藏書越來越多，讀者也越來越多時，找書和借書的速度變得很慢，圖書館變得擁擠不堪。

垂直擴展，就像是把這個中央圖書館蓋得更高、更大，換上更快的圖書輸送帶。

水平擴展 (Sharding)，則是決定在全國各地開設「分館」。例如，A-G 開頭的書放在台北分館，H-P 的書放在台中分館，Q-Z 的書放在高雄分館。如此一來，每個分館的壓力都變小了，讀者也可以就近、更快地找到自己想要的書。

在這個比喻中，每個「分館」就是一個 Shard。

為什麼需要 Sharding？三大核心優勢

當正確實施 Sharding 後，可以帶來幾個顯著的好處：

提升效能 (Improved Performance)：查詢不再需要掃描數十億筆資料，而是在一個規模小得多的 Shard 中進行。這大大降低了查詢延遲，提升了讀寫速度。
增強擴展性 (Enhanced Scalability)：當資料繼續增長時，不需要升級昂貴的單一伺服器，只需要增加更多的 Shard（也就是更多的伺服器）即可。這種擴展方式更具彈性且成本效益更高。
提高可用性 (Increased Availability)：如果某一個 Shard 因為硬體故障而離線，它只會影響到儲存在該 Shard 上的那部分資料。其他 Shards 仍然可以正常運作，整個系統不會完全癱瘓（相較於單一資料庫故障會導致所有服務中斷）。

Sharding 是如何運作的？關鍵的「分片鍵 (Shard Key)」

系統是如何知道「哪筆資料該存到哪個 Shard」以及「去哪個 Shard 查詢資料」的呢？答案是透過一個至關重要的元素：分片鍵 (Shard Key)。

Shard Key 是資料表中的一個（或多個）欄位，它的值會經過一個分片演算法，來決定這筆資料的最終歸屬地。選擇一個好的 Shard Key 是 Sharding 成敗的關鍵。

以下是幾種常見的 Sharding 策略：

1. 範圍分片 (Range-Based Sharding)

這是最直觀的方式。根據 Shard Key 的一個範圍來劃分資料。

範例：一個訂單資料表，可以用 order_date 作為 Shard Key。
- Shard 1: 存放 2023 年 1 月 - 3 月的訂單。
- Shard 2: 存放 2023 年 4 月 - 6 月的訂單。
- …以此類推。
優點：容易實現，範圍查詢（例如查詢某個月份的所有訂單）非常高效，因為資料都在同一個 Shard 裡。
缺點：容易產生 熱點 (Hotspot) 問題。例如，所有新的訂單都會寫入最新的 Shard，導致該 Shard 負載極高，而舊的 Shard 則相對閒置。

2. 雜湊分片 (Hash-Based Sharding)

這種策略是將 Shard Key 經過一個雜湊函數（例如 MD5、SHA-256）處理，然後用雜湊結果來決定 Shard。

範例：一個用戶資料表，用 user_id 作為 Shard Key。
- shard_id = hash(user_id) % 總Shard數量
優點：資料可以非常均勻地分佈到各個 Shard，有效避免了熱點問題。
優點：範圍查詢變得非常困難。例如，無法輕易地查詢 user_id 從 100 到 200 的所有用戶，因為他們的資料經過雜湊後，可能散落在所有 Shards 中。

3. 目錄分片 (Directory-Based Sharding)

這種方式需要維護一個獨立的「查詢表 (Lookup Table)」，就像書的目錄一樣，它記錄了每個 Shard Key 值與其對應 Shard 的映射關係。

範例：應用程式在寫入或讀取資料前，先去查詢這個目錄表，找到目標 Shard，然後再進行操作。
優點：分片邏輯非常靈活，可以隨時更改某個 Key 對應的 Shard。
缺點：目錄表本身可能成為新的效能瓶頸或單點故障。

Sharding 必須面對的挑戰

聽起來 Sharding 很美好，對吧？但在決定擁抱它之前，請務必了解它帶來的複雜性：

架構複雜度劇增：應用程式、部署流程、監控系統都需要重新設計，以適應分佈式的資料庫環境。
跨分片查詢 (Cross-Shard Queries)：如果一個查詢需要聯合 (JOIN) 不同 Shard 的資料，將會變得非常慢且複雜。通常需要應用程式層面進行多次查詢再組合結果。
資料重新平衡 (Rebalancing)：當新增一個 Shard 時，需要將部分資料從舊的 Shards 遷移到新的 Shard 中，這個過程被稱為 Rebalancing。這是一個非常複雜且具風險的操作。
交易一致性：在單一資料庫中，有 ACID 交易來保證資料的一致性。但在分佈式環境下，要維持跨 Shard 的交易一致性是一個巨大的技術挑戰。

結論

Sharding 是一個強大的工具，但它也是一把雙面刃。它通常被視為擴展的最後手段。

在考慮 Sharding 之前，請先確保已經窮盡了其他所有優化方案：

垂直擴展：伺服器硬體是否還有升級空間？
快取 (Caching)：是否已經有效利用 Redis 或 Memcached 等工具來減少資料庫讀取壓力？
讀寫分離：是否已經將讀取操作導向到唯讀副本 (Read Replicas)？
資料庫與查詢優化：是否還有未加索引的欄位？是否有可以改寫的慢查詢？

只有當上述方法都已無法滿足需求，且應用程式正面臨「超大規模」的資料量（通常是 TB 級別）和吞吐量時，Sharding 才應該被納入考慮範圍。