如何過濾不需要變形的數(shù)據(jù)

來源: 發(fā)布時(shí)間:2024-10-03

在國家大力發(fā)展信創(chuàng)的背景下,實(shí)現(xiàn)國產(chǎn)化軟硬件部署已成為企業(yè)的**訴求,其中逐步建立覆蓋國產(chǎn)化數(shù)據(jù)庫、操作系統(tǒng)、虛擬化平臺(tái)的國產(chǎn)化數(shù)據(jù)保護(hù)體系,實(shí)現(xiàn)備份數(shù)據(jù)自動(dòng)化恢復(fù)驗(yàn)證成為當(dāng)前數(shù)據(jù)保護(hù)系統(tǒng)的迫切需求。同時(shí),以金融和運(yùn)營商行業(yè)為例,其開發(fā)測(cè)試部門需要頻發(fā)測(cè)試驗(yàn)證,對(duì)數(shù)據(jù)使用頻率較高,因此形成了大量不同版本的測(cè)試數(shù)據(jù),這部分?jǐn)?shù)據(jù)體量龐大,動(dòng)輒幾百GB甚至幾十TB,管理難度較大。國家日趨重視對(duì)數(shù)據(jù)隱私的安全管控,數(shù)據(jù)脫敏成為企業(yè)數(shù)據(jù)安全治理的重要方向。ADM在處理數(shù)據(jù)上中下游流轉(zhuǎn)的過程是集中統(tǒng)一的,通過全閉環(huán)式的傳輸保證了數(shù)據(jù)的安全。如何過濾不需要變形的數(shù)據(jù)

如何過濾不需要變形的數(shù)據(jù),上訊敏捷數(shù)據(jù)管理平臺(tái)ADM

傳統(tǒng)的備份方案大多采用周期性的“全量備份+增量備份”策略,其增量備份大多不可持續(xù),經(jīng)過一段時(shí)間就必須執(zhí)行一次全量備份。因而傳統(tǒng)的備份方案經(jīng)常面臨備份窗口過大的問題,而且其增量備份數(shù)據(jù)的恢復(fù)效率相對(duì)低下,因?yàn)槊總€(gè)時(shí)間點(diǎn)的恢復(fù)都依賴于上一次全備副本和上一次全備副本后的所有增量數(shù)據(jù),恢復(fù)操作需要進(jìn)行逐個(gè)迭代恢復(fù)。此外,過期增量數(shù)據(jù)的清理操作也受限于備份副本之間的依賴關(guān)系,不一定能及時(shí)被***。而長久增量備份與全量快照合成技術(shù),即***執(zhí)行全量備份,之后只對(duì)新增或改動(dòng)過的數(shù)據(jù)進(jìn)行增量備份,此增量備份數(shù)據(jù)是持續(xù)的,而且每個(gè)增量備份的數(shù)據(jù)副本將自動(dòng)合成為全量快照副本,便于恢復(fù)。因此,長久增量備份與全量快照合成技術(shù)能夠大幅度減少備份時(shí)間,節(jié)省備份數(shù)據(jù)所需的存儲(chǔ)空間,且提升了恢復(fù)效率。長久增量備份與全量快照合成技術(shù)適用于單個(gè)應(yīng)用數(shù)據(jù)量大,執(zhí)行一次完全備份比較費(fèi)時(shí)費(fèi)力的應(yīng)用場(chǎng)景。若用戶備份數(shù)據(jù)量小,也可使用傳統(tǒng)的全備+增備技術(shù)方式,ADM無掛載備份能夠?qū)崿F(xiàn)此方式。多場(chǎng)景同步測(cè)試ADM支持多線程文件備份,支持海量小文件場(chǎng)景下的聚合策略進(jìn)行文件備份。

如何過濾不需要變形的數(shù)據(jù),上訊敏捷數(shù)據(jù)管理平臺(tái)ADM

數(shù)據(jù)分鐘級(jí)提供,提升數(shù)據(jù)交付效率縮短開發(fā)周期通過部署ADM幾分鐘內(nèi)即可創(chuàng)建一個(gè)數(shù)據(jù)量TB級(jí)別的虛擬數(shù)據(jù)庫,進(jìn)而,快速將測(cè)試數(shù)據(jù)傳輸?shù)较掠蔚拈_發(fā)測(cè)試環(huán)境,無需繁瑣冗長的審核和等待,這一過程有效減少了下游開發(fā)測(cè)試場(chǎng)景中測(cè)試數(shù)據(jù)的準(zhǔn)備時(shí)間,通常從以天計(jì)算縮短到以小時(shí)計(jì)算,時(shí)間效率提升明顯,**縮短了開發(fā)測(cè)試時(shí)間,進(jìn)而縮短產(chǎn)品的發(fā)布周期。(5)敏感數(shù)據(jù)定義識(shí)別與仿真***,保障數(shù)據(jù)流轉(zhuǎn)環(huán)節(jié)的安全性通過智能定義敏感數(shù)據(jù)類型,自動(dòng)發(fā)現(xiàn)和識(shí)別敏感數(shù)據(jù),包括數(shù)據(jù)類型、內(nèi)容、約束關(guān)系,靈活排序減少人為篩選,***精細(xì)定位敏感數(shù)據(jù)源。豐富的***算法與仿真的字典庫相結(jié)合,保證***后數(shù)據(jù)仍具有業(yè)務(wù)屬性,數(shù)據(jù)表間關(guān)系仍具有業(yè)務(wù)一致性,不影響數(shù)據(jù)挖掘分析數(shù)據(jù)價(jià)值。對(duì)涉及企業(yè)、個(gè)人信息的隱私數(shù)據(jù),包括資金財(cái)產(chǎn)、個(gè)人、企業(yè)隱私的對(duì)照關(guān)系進(jìn)行敏感數(shù)據(jù)識(shí)別,通過內(nèi)置的***規(guī)則進(jìn)行***處理,將數(shù)據(jù)敏感部分去隱私化,但并不失去數(shù)據(jù)挖掘的價(jià)值特征,減少數(shù)據(jù)隱私泄露帶來的風(fēng)險(xiǎn)和損失,甚至降低可能發(fā)生的人身傷害和違法犯罪事件。

上訊敏捷數(shù)據(jù)管理平臺(tái)適用場(chǎng)景:數(shù)據(jù)交付速度慢的開發(fā)測(cè)試部門企業(yè)通過交付生產(chǎn)數(shù)據(jù)輔助第三方業(yè)務(wù)決策,如開發(fā)/測(cè)試環(huán)境、統(tǒng)計(jì)分析、準(zhǔn)業(yè)務(wù)系統(tǒng)環(huán)境搭建等,交付生產(chǎn)數(shù)據(jù)的方式是通過生成業(yè)務(wù)系統(tǒng)數(shù)據(jù)副本,而副本的準(zhǔn)備通常需要幾小時(shí),甚至幾天不等,嚴(yán)重拖延了項(xiàng)目進(jìn)度。

備份數(shù)據(jù)的有效性驗(yàn)證效率低的運(yùn)維部門,大部分企業(yè)對(duì)其**業(yè)務(wù)系統(tǒng)進(jìn)行了數(shù)據(jù)備份,為了檢驗(yàn)備份數(shù)據(jù)的有效性,以及滿足相關(guān)法律法規(guī)的要求,企業(yè)對(duì)備份數(shù)據(jù)采取周期性的恢復(fù)驗(yàn)證;由于企業(yè)的業(yè)務(wù)系統(tǒng)繁多,而人員相對(duì)緊缺,驗(yàn)證工作需要大量重復(fù)性動(dòng)作,成為企業(yè)當(dāng)前面臨的一大挑戰(zhàn)。

數(shù)據(jù)副本分散存放難以管理的數(shù)據(jù)中心數(shù)據(jù)副本一旦被交付使用,就**存在于使用環(huán)境中,隨著數(shù)據(jù)使用場(chǎng)景的日益增多,數(shù)據(jù)副本在非生產(chǎn)環(huán)境中逐漸累積,**分散的存放方式導(dǎo)致副本的辨識(shí)度不高,后續(xù)使用與銷毀難度明顯增大。同時(shí),重復(fù)存放現(xiàn)象嚴(yán)重造成了存儲(chǔ)資源的浪費(fèi)。u隱私數(shù)據(jù)泄露風(fēng)險(xiǎn)高的用戶無論是通過生產(chǎn)數(shù)據(jù)庫導(dǎo)出,還是通過備份系統(tǒng)恢復(fù),都能夠直接獲取到企業(yè)的**生產(chǎn)數(shù)據(jù),其中包含企業(yè)內(nèi)部機(jī)密數(shù)據(jù)和客戶個(gè)人隱私信息,一旦發(fā)生泄露將帶來嚴(yán)重后果,不僅影響企業(yè)的名譽(yù),也會(huì)造成一定的經(jīng)濟(jì)損失。 上訊敏捷數(shù)據(jù)管理平臺(tái)ADM是國內(nèi)比較認(rèn)可的CDM產(chǎn)品。

如何過濾不需要變形的數(shù)據(jù),上訊敏捷數(shù)據(jù)管理平臺(tái)ADM

l分鐘級(jí)掛載恢復(fù)技術(shù)ADM壓縮保存源端數(shù)據(jù)庫的數(shù)據(jù),并保留時(shí)間線,方便恢復(fù)任意時(shí)間點(diǎn)數(shù)據(jù)。ADM備份的全量快照為原格式,無需格式轉(zhuǎn)換和IO拷貝,可直接掛載到目標(biāo)主機(jī)上快速拉起應(yīng)用恢復(fù),**技術(shù)采用自研的數(shù)據(jù)庫虛擬化技術(shù)通過一份數(shù)據(jù)快照作為基礎(chǔ)數(shù)據(jù)生成黃金副本,快速掛載恢復(fù)多個(gè)虛擬副本。掛載恢復(fù)的方式**縮短了數(shù)據(jù)恢復(fù)的時(shí)間,通常業(yè)務(wù)RTO時(shí)間由小時(shí)級(jí)甚至天級(jí),縮短到分鐘級(jí);掛載恢復(fù)降低了數(shù)據(jù)恢復(fù)所占用的存儲(chǔ)空間,*對(duì)新寫入的數(shù)據(jù)計(jì)入資源占用;由于掛載恢復(fù)速度快增加了數(shù)據(jù)恢復(fù)演練的頻率,提高了備份數(shù)據(jù)有效性驗(yàn)證的工作效率。ADM達(dá)到了快速交付副本數(shù)據(jù)、靈活管理副本數(shù)據(jù)版本、集中管理副本數(shù)據(jù)存儲(chǔ)與流轉(zhuǎn)的目標(biāo)。敏感因子

ADM企業(yè)級(jí)副本數(shù)據(jù)管理(CDM)產(chǎn)品。如何過濾不需要變形的數(shù)據(jù)

上訊信息敏捷數(shù)據(jù)管理平臺(tái)的備份數(shù)據(jù)管理模塊,突破了傳統(tǒng)備份理念,基于特有的CDM數(shù)據(jù)庫虛擬化技術(shù),不僅可以實(shí)現(xiàn)對(duì)數(shù)據(jù)庫的實(shí)時(shí)性持續(xù)備份以及本機(jī)、異機(jī)的快速恢復(fù),還可以同時(shí)對(duì)備份數(shù)據(jù)的有效性進(jìn)行驗(yàn)證。對(duì)于已經(jīng)部署了NBU/CommVault等備份系統(tǒng)的用戶,可以對(duì)接備份系統(tǒng),實(shí)現(xiàn)存儲(chǔ)空間、恢復(fù)服務(wù)器和恢復(fù)任務(wù)的自動(dòng)調(diào)度,從而實(shí)現(xiàn)備份數(shù)據(jù)有效性驗(yàn)證的全自動(dòng)化,并根據(jù)驗(yàn)證結(jié)果生成詳細(xì)的恢復(fù)驗(yàn)證報(bào)告。在恢復(fù)驗(yàn)證任務(wù)結(jié)束后,自動(dòng)清理恢復(fù)環(huán)境,釋放存儲(chǔ)資源和恢復(fù)服務(wù)器資源,以用于下一個(gè)恢復(fù)驗(yàn)證任務(wù)的使用,使整個(gè)數(shù)據(jù)備份恢復(fù)驗(yàn)證工作能夠周期性地循環(huán)運(yùn)轉(zhuǎn).如何過濾不需要變形的數(shù)據(jù)