什么是分布式存儲呢?如果一個存儲系統(tǒng),不管是對象、塊、文件、kv、log、olap、oltp,只要對所管理的數(shù)據(jù)做了Partitioning&Replication,不管姿勢對不對,其實都可以歸納于分布式存儲。分布式存儲就是:Partitioning以多機scale,Replication以災備容錯。復制是解決可用性,可擴展性和高性能的關(guān)鍵。為了災備,數(shù)據(jù)需要冗余存儲;為了高可用,服務(wù)需要hotstandby。缺乏災備的系統(tǒng)難以在生產(chǎn)環(huán)境使用。元數(shù)據(jù)和數(shù)據(jù)的維護均離不開復制,復制可轉(zhuǎn)移而不可消除。復制引出了多副本一致性問題,而一致性保證需要考慮各種軟件和硬件故障,以及誤操作。 萬萬沒想到,分布式存儲系統(tǒng)的一致性是......!合肥魏晉元興分布式存儲原理
隨著企業(yè)數(shù)字化轉(zhuǎn)型的深入,分布式存儲由初的開發(fā)測試、桌面云等非關(guān)鍵應用,逐步走向生產(chǎn)應用。生產(chǎn)應用除了上述可靠性SLA要求之外,對分布式存儲的性能,尤其是數(shù)據(jù)訪問的穩(wěn)定低時延提出了更嚴苛的要求。軟硬件解耦的分布式存儲在性能設(shè)計上存在兩大天然缺陷:標準服務(wù)器不具備機房突然斷電時保護內(nèi)存數(shù)據(jù)的電池(BBU),所以只能用SSD卡/盤來做數(shù)據(jù)緩存。SSD的時延遠高于內(nèi)存,導致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲時延無法和生產(chǎn)存儲媲美。單獨采購的分布式存儲軟件無法和第三方服務(wù)器的SSD盤緊密配合,從而無法像業(yè)界先進的全閃存存儲一樣實現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導致的生產(chǎn)應用時延波動。 蘇州大道云行分布式存儲的一般架構(gòu)分布式存儲系統(tǒng)需要使用多臺服務(wù)器共同存儲數(shù)據(jù),隨著服務(wù)器數(shù)量的增加,出現(xiàn)故障的概率也在不斷增加。
分布式存儲系統(tǒng)中還可能使用基于寫多個存儲節(jié)點的復制協(xié)議(Replicated-writeprotocol)。比如Dynamo系統(tǒng)中的NWR復制協(xié)議,其中,N為副本數(shù)量,W為寫操作的副本數(shù),R為讀操作的副本數(shù)。NWR協(xié)議中多個副本不再區(qū)分主和備,客戶端根據(jù)一定的策略往其中的W個副本寫入數(shù)據(jù),讀取其中的R個副本。只要W+R>N,可以保證讀到的副本中至少有一個包含了的更新。然而,這種協(xié)議的問題在于不同副本的操作順序可能不一致,從多個副本讀取時可能出現(xiàn)。這種方式在實際系統(tǒng)中比較少見,不建議使用。
分布式存儲系統(tǒng),是將數(shù)據(jù)分散存儲在多個du立的設(shè)備上。傳統(tǒng)的網(wǎng)絡(luò)存儲系統(tǒng)采用集中的存儲服務(wù)器存放所有數(shù)據(jù),存儲服務(wù)器成為系統(tǒng)性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規(guī)模存儲應用的需要。分布式網(wǎng)絡(luò)存儲系統(tǒng)采用可擴展的系統(tǒng)結(jié)構(gòu),利用多臺存儲服務(wù)器分擔存儲負荷,利用位置服務(wù)器定位存儲信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴展。分布式存儲系統(tǒng)需要使用多臺服務(wù)器共同存儲數(shù)據(jù),而隨著服務(wù)器數(shù)量的增加,服務(wù)器出現(xiàn)故障的概率也在不斷增加。為了保證在有服務(wù)器出現(xiàn)故障的情況下系統(tǒng)仍然可用。一般做法是把一個數(shù)據(jù)分成多份存儲在不同的服務(wù)器中。但是由于故障和并行存儲等情況的存在,同一個數(shù)據(jù)的多個副本之間可能存在不一致的情況。這里稱保證多個副本的數(shù)據(jù)完全一致的性質(zhì)為一致性。 分布式存儲系統(tǒng)通過統(tǒng)一硬件資源池,同時提供塊、文件、對象三種存儲服務(wù)。
分布式存儲早是由谷歌提出的,其目的是通過廉價的服務(wù)器來提供使用與大規(guī)模,高并發(fā)場景下的Web訪問問題。它采用可擴展的系統(tǒng)結(jié)構(gòu),利用多臺存儲服務(wù)器分擔存儲負荷,利用位置服務(wù)器定位存儲信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴展。分布式存儲的興起與互聯(lián)網(wǎng)的發(fā)展密不可分,互聯(lián)網(wǎng)公司由于其數(shù)據(jù)量大而資本積累少,而通常都使用大規(guī)模分布式存儲系統(tǒng)。與傳統(tǒng)的高duan服務(wù)器、高duan存儲器和高duan處理器不同的是,互聯(lián)網(wǎng)公司的分布式存儲系統(tǒng)由數(shù)量眾多的、低成本和高性價比的普通PC服務(wù)器通過網(wǎng)絡(luò)連接而成。 布式存儲系統(tǒng),采用Scale-out擴展架構(gòu),可實現(xiàn)超大集群規(guī)模的部署。南通四大開源分布式存儲系統(tǒng)架構(gòu)
分布式存儲將如何挑戰(zhàn)互聯(lián)網(wǎng)巨頭?合肥魏晉元興分布式存儲原理
分布式存儲包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲和分布式對象存儲外,還包括分布式數(shù)據(jù)庫和分布式緩存等,但其中架構(gòu)無外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點??蛻舳耸峭ㄟ^一個設(shè)備映射關(guān)系計算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲節(jié)點通信,從而避免中心節(jié)點的性能瓶頸。 合肥魏晉元興分布式存儲原理
江蘇魏晉元興智能科技有限公司是一家智能技術(shù)、計算機技術(shù)研發(fā)、技術(shù)咨詢,技術(shù)轉(zhuǎn)讓:軟件開 發(fā)、銷售;信息系統(tǒng)集成服務(wù):機電產(chǎn)品、計算機及配件、 電線電纜、儀器儀表、電子元器件、機械設(shè)備、機電設(shè)備 節(jié)能設(shè)備、辦公用品、攝影器材、文化用品、通訊設(shè)備、體 育器材、消防器材銷售;綜合布線工程、水電工程、園林綠 化工程、室內(nèi)裝飾工程、土石方工程設(shè)計、施工,提供勞務(wù) 服務(wù);企業(yè)形象策劃:企業(yè)管理咨詢:家用電器銷售、維 修;文化藝術(shù)交流活動組織、 策劃。( 依法須經(jīng)批準的項 目,經(jīng)相關(guān)部門批準后方可開展經(jīng)營活動)的公司,致力于發(fā)展為創(chuàng)新務(wù)實、誠實可信的企業(yè)。公司自創(chuàng)立以來,投身于網(wǎng)絡(luò)安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制,是數(shù)碼、電腦的主力軍。魏晉元興智能不斷開拓創(chuàng)新,追求出色,以技術(shù)為先導,以產(chǎn)品為平臺,以應用為重點,以服務(wù)為保證,不斷為客戶創(chuàng)造更高價值,提供更優(yōu)服務(wù)。魏晉元興智能創(chuàng)始人譚國江,始終關(guān)注客戶,創(chuàng)新科技,竭誠為客戶提供良好的服務(wù)。