Leaf：美團(tuán)分布式ID生成服務(wù)開源

geekidentity 發(fā)布于2019-08-16 15:36 / 2935人閱讀

摘要：是美團(tuán)基礎(chǔ)研發(fā)平臺推出的一個(gè)分布式生成服務(wù)，名字取自德國哲學(xué)家數(shù)學(xué)家萊布尼茨的一句話具備高可靠低延遲全局唯一等特點(diǎn)。目前已經(jīng)廣泛應(yīng)用于美團(tuán)金融美團(tuán)外賣美團(tuán)酒旅等多個(gè)部門。具體的技術(shù)細(xì)節(jié)，可參考此前美團(tuán)技術(shù)博客的一篇文章美團(tuán)分布式生成服務(wù)。

Leaf是美團(tuán)基礎(chǔ)研發(fā)平臺推出的一個(gè)分布式ID生成服務(wù)，名字取自德國哲學(xué)家、數(shù)學(xué)家萊布尼茨的一句話：“There are no two identical leaves in the world.”Leaf具備高可靠、低延遲、全局唯一等特點(diǎn)。目前已經(jīng)廣泛應(yīng)用于美團(tuán)金融、美團(tuán)外賣、美團(tuán)酒旅等多個(gè)部門。具體的技術(shù)細(xì)節(jié)，可參考此前美團(tuán)技術(shù)博客的一篇文章：《Leaf美團(tuán)分布式ID生成服務(wù)》。近日，Leaf項(xiàng)目已經(jīng)在Github上開源：https://github.com/Meituan-Dianping/Leaf，希望能和更多的技術(shù)同行一起交流、共建。

Leaf特性

Leaf在設(shè)計(jì)之初就秉承著幾點(diǎn)要求：

全局唯一，絕對不會(huì)出現(xiàn)重復(fù)的ID，且ID整體趨勢遞增。

高可用，服務(wù)完全基于分布式架構(gòu)，即使MySQL宕機(jī)，也能容忍一段時(shí)間的數(shù)據(jù)庫不可用。

高并發(fā)低延時(shí)，在CentOS 4C8G的虛擬機(jī)上，遠(yuǎn)程調(diào)用QPS可達(dá)5W+，TP99在1ms內(nèi)。

接入簡單，直接通過公司RPC服務(wù)或者HTTP調(diào)用即可接入。

Leaf誕生

Leaf第一個(gè)版本采用了預(yù)分發(fā)的方式生成ID，即可以在DB之上掛N個(gè)Server，每個(gè)Server啟動(dòng)時(shí)，都會(huì)去DB拿固定長度的ID List。這樣就做到了完全基于分布式的架構(gòu)，同時(shí)因?yàn)镮D是由內(nèi)存分發(fā)，所以也可以做到很高效。接下來是數(shù)據(jù)持久化問題，Leaf每次去DB拿固定長度的ID List，然后把最大的ID持久化下來，也就是并非每個(gè)ID都做持久化，僅僅持久化一批ID中最大的那一個(gè)。這個(gè)方式有點(diǎn)像游戲里的定期存檔功能，只不過存檔的是未來某個(gè)時(shí)間下發(fā)給用戶的ID，這樣極大地減輕了DB持久化的壓力。

整個(gè)服務(wù)的具體處理過程如下：

Leaf Server 1：從DB加載號段[1，1000]。

Leaf Server 2：從DB加載號段[1001，2000]。

Leaf Server 3：從DB加載號段[2001，3000]。

用戶通過Round-robin的方式調(diào)用Leaf Server的各個(gè)服務(wù)，所以某一個(gè)Client獲取到的ID序列可能是：1，1001，2001，2，1002，2002......也可能是：1，2，1001，2001，2002，2003，3，4......當(dāng)某個(gè)Leaf Server號段用完之后，下一次請求就會(huì)從DB中加載新的號段，這樣保證了每次加載的號段是遞增的。

Leaf數(shù)據(jù)庫中的號段表格式如下：

+-------------+--------------+------+-----+-------------------+-----------------------------+
| Field       | Type         | Null | Key | Default           | Extra                       |
+-------------+--------------+------+-----+-------------------+-----------------------------+
| biz_tag     | varchar(128) | NO   | PRI |                   |                             |
| max_id      | bigint(20)   | NO   |     | 1                 |                             |
| step        | int(11)      | NO   |     | NULL              |                             |
| desc        | varchar(256) | YES  |     | NULL              |                             |
| update_time | timestamp    | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |
+-------------+--------------+------+-----+-------------------+-----------------------------+

Leaf Server加載號段的SQL語句如下：

Begin
UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx
SELECT tag, max_id, step FROM table WHERE biz_tag=xxx
Commit

整體上，V1版本實(shí)現(xiàn)比較簡單，主要是為了盡快解決業(yè)務(wù)層DB壓力的問題，而快速迭代出的一個(gè)版本。因而在生產(chǎn)環(huán)境中，也發(fā)現(xiàn)了些問題。比如：

在更新DB的時(shí)候會(huì)出現(xiàn)耗時(shí)尖刺，系統(tǒng)最大耗時(shí)取決于更新DB號段的時(shí)間。

當(dāng)更新DB號段的時(shí)候，如果DB宕機(jī)或者發(fā)生主從切換，會(huì)導(dǎo)致一段時(shí)間的服務(wù)不可用。

Leaf雙Buffer優(yōu)化

為了解決這兩個(gè)問題，Leaf采用了異步更新的策略，同時(shí)通過雙Buffer的方式，保證無論何時(shí)DB出現(xiàn)問題，都能有一個(gè)Buffer的號段可以正常對外提供服務(wù)，只要DB在一個(gè)Buffer的下發(fā)的周期內(nèi)恢復(fù)，就不會(huì)影響整個(gè)Leaf的可用性。

這個(gè)版本代碼在線上穩(wěn)定運(yùn)行了半年左右，Leaf又遇到了新的問題：

號段長度始終是固定的，假如Leaf本來能在DB不可用的情況下，維持10分鐘正常工作，那么如果流量增加10倍就只能維持1分鐘正常工作了。

號段長度設(shè)置的過長，導(dǎo)致緩存中的號段遲遲消耗不完，進(jìn)而導(dǎo)致更新DB的新號段與前一次下發(fā)的號段ID跨度過大。

Leaf動(dòng)態(tài)調(diào)整Step

假設(shè)服務(wù)QPS為Q，號段長度為L，號段更新周期為T，那么Q * T = L。最開始L長度是固定的，導(dǎo)致隨著Q的增長，T會(huì)越來越小。但是Leaf本質(zhì)的需求是希望T是固定的。那么如果L可以和Q正相關(guān)的話，T就可以趨近一個(gè)定值了。所以Leaf每次更新號段的時(shí)候，根據(jù)上一次更新號段的周期T和號段長度step，來決定下一次的號段長度nextStep：

T < 15min，nextStep = step * 2

15min < T < 30min，nextStep = step

T > 30min，nextStep = step / 2

至此，滿足了號段消耗穩(wěn)定趨于某個(gè)時(shí)間區(qū)間的需求。當(dāng)然，面對瞬時(shí)流量幾十、幾百倍的暴增，該種方案仍不能滿足可以容忍數(shù)據(jù)庫在一段時(shí)間不可用、系統(tǒng)仍能穩(wěn)定運(yùn)行的需求。因?yàn)楸举|(zhì)上來講，Leaf雖然在DB層做了些容錯(cuò)方案，但是號段方式的ID下發(fā)，最終還是需要強(qiáng)依賴DB。

MySQL高可用

在MySQL這一層，Leaf目前采取了半同步的方式同步數(shù)據(jù)，通過公司DB中間件Zebra加MHA做的主從切換。未來追求完全的強(qiáng)一致，會(huì)考慮切換到MySQL Group Replication。

現(xiàn)階段由于公司數(shù)據(jù)庫強(qiáng)一致的特性還在演進(jìn)中，Leaf采用了一個(gè)臨時(shí)方案來保證機(jī)房斷網(wǎng)場景下的數(shù)據(jù)一致性：

多機(jī)房部署數(shù)據(jù)庫，每個(gè)機(jī)房一個(gè)實(shí)例，保證都是跨機(jī)房同步數(shù)據(jù)。

半同步超時(shí)時(shí)間設(shè)置到無限大，防止半同步方式退化為異步復(fù)制。

Leaf監(jiān)控

針對服務(wù)自身的監(jiān)控，Leaf提供了Web層的內(nèi)存數(shù)據(jù)映射界面，可以實(shí)時(shí)看到所有號段的下發(fā)狀態(tài)。比如每個(gè)號段雙buffer的使用情況，當(dāng)前ID下發(fā)到了哪個(gè)位置等信息都可以在Web界面上查看。

Leaf Snowflake

Snowflake，Twitter開源的一種分布式ID生成算法?；?4位數(shù)實(shí)現(xiàn)，下圖為Snowflake算法的ID構(gòu)成圖。

第1位置為0。

第2-42位是相對時(shí)間戳，通過當(dāng)前時(shí)間戳減去一個(gè)固定的歷史時(shí)間戳生成。

第43-52位是機(jī)器號workerID，每個(gè)Server的機(jī)器ID不同。

第53-64位是自增ID。

這樣通過時(shí)間+機(jī)器號+自增ID的組合來實(shí)現(xiàn)了完全分布式的ID下發(fā)。

在這里，Leaf提供了Java版本的實(shí)現(xiàn)，同時(shí)對Zookeeper生成機(jī)器號做了弱依賴處理，即使Zookeeper有問題，也不會(huì)影響服務(wù)。Leaf在第一次從Zookeeper拿取workerID后，會(huì)在本機(jī)文件系統(tǒng)上緩存一個(gè)workerID文件。即使ZooKeeper出現(xiàn)問題，同時(shí)恰好機(jī)器也在重啟，也能保證服務(wù)的正常運(yùn)行。這樣做到了對第三方組件的弱依賴，一定程度上提高了SLA。

未來規(guī)劃

號段加載優(yōu)化：Leaf目前重啟后的第一次請求還是會(huì)同步加載MySQL，之所以這么做而非服務(wù)初始化加載號段的原因，主要是MySQL中的Leaf Key并非一定都被這個(gè)Leaf服務(wù)節(jié)點(diǎn)所加載，如果每個(gè)Leaf節(jié)點(diǎn)都在初始化加載所有的Leaf Key會(huì)導(dǎo)致號段的大量浪費(fèi)。因此，未來會(huì)在Leaf服務(wù)Shutdown時(shí)，備份這個(gè)服務(wù)節(jié)點(diǎn)近一天使用過的Leaf Key列表，這樣重啟后會(huì)預(yù)先從MySQL加載Key List中的號段。

單調(diào)遞增：簡易的方式，是只要保證同一時(shí)間、同一個(gè)Leaf Key都從一個(gè)Leaf服務(wù)節(jié)點(diǎn)獲取ID，即可保證遞增。需要注意的問題是Leaf服務(wù)節(jié)點(diǎn)切換時(shí)，舊Leaf 服務(wù)用過的號段需要廢棄。路由邏輯，可采用主備的模型或者每個(gè)Leaf Key 配置路由表的方式來實(shí)現(xiàn)。

關(guān)于開源

分布式ID生成的方案有很多種，Leaf開源版本提供了兩種ID的生成方式：

號段模式：低位趨勢增長，較少的ID號段浪費(fèi)，能夠容忍MySQL的短時(shí)間不可用。

Snowflake模式：完全分布式，ID有語義。

讀者可以按需選擇適合自身業(yè)務(wù)場景的ID下發(fā)方式。希望美團(tuán)的方案能給予大家一些幫助，同時(shí)也希望各位能夠一起交流、共建。

Leaf項(xiàng)目Github地址：https://github.com/Meituan-Dianping/Leaf 。

如有任何疑問和問題，歡迎提交至Github issues。

GPU云服務(wù)器云服務(wù)器分布式id生成器全局id生成生成全局唯一id 生成唯一id算法

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.hztianpu.com/yun/73592.html

發(fā)表評論

登陸后可評論

0條評論

geekidentity

男|高級講師

我要關(guān)注我要私信

TA的文章

#yyds干貨分享#DHCP服務(wù)三種機(jī)制分配IP地址

閱讀 3802·2021-11-23 09:51
UCloud優(yōu)刻得六大特惠開啟雙11，烏蘭察布云服務(wù)器低至0.5折僅37.5元/年-老劉博客

閱讀 1473·2021-11-10 14:35
site5虛擬主機(jī)怎么用-虛擬主機(jī)有什么用？

閱讀 4079·2021-09-22 15:01
iWebFusion：美國服務(wù)器$49/月起,高配服務(wù)器$219/月(Dual E5-2699v4/

閱讀 1374·2021-08-19 11:12
css

閱讀 464·2019-08-30 15:53
將輪播圖組件化

閱讀 1758·2019-08-29 13:04
雖不是CSS3，但是它的壽命卻不及他

閱讀 3511·2019-08-29 12:52
手寫極簡版Promise

閱讀 3152·2019-08-23 16:14

成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲中文字幕日韩无码

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Leaf：美團(tuán)分布式ID生成服務(wù)開源

相關(guān)文章

分布式id生成方案概述

**探討分布式ID生成系統(tǒng)**

長知識 - 收藏集 - 掘金

長知識系列 - 收藏集 - 掘金

發(fā)表評論

0條評論

geekidentity

男|高級講師

TA的文章

#yyds干貨分享#DHCP服務(wù)三種機(jī)制分配IP地址

UCloud優(yōu)刻得六大特惠開啟雙11，烏蘭察布云服務(wù)器低至0.5折僅37.5元/年-老劉博客

site5虛擬主機(jī)怎么用-虛擬主機(jī)有什么用？

iWebFusion：美國服務(wù)器$49/月起,高配服務(wù)器$219/月(Dual E5-2699v4/

css

將輪播圖組件化

雖不是CSS3，但是它的壽命卻不及他

手寫極簡版Promise

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Leaf：美團(tuán)分布式ID生成服務(wù)開源

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！