第290章 牛肉河粉_離語_免费小说阅读网 
免费小说阅读网 > 玄幻魔法 > 離語 > 第290章 牛肉河粉

第290章 牛肉河粉(2 / 2)

展示品牌榮譽和認證信息,提升用戶信任度。

驗證方式:通過問卷調查了解用戶對品牌宣傳的感知和認可度。

監控品牌搜索量和用戶轉化率等指標,評估品牌宣傳效果。

采用增量字段方式捕獲變化數據的原理是y在源係統業務表數據表中增

加增量字段y增量字段可以是時間字段y同時也可以是自增長字段y當

源業務係統中數據新增或者被修改時y增量字段就會產生變化y時間戳

字段就會被修改為相應的係統時間y自增長字段就會增加

每當etl工具進行增量數據獲取時y隻需比對最近一次數據抽取的增量

字段值y就能判斷出來哪些是新增數據y哪些是修改數據。

這種數據抽取方式的優點是抽取性能比較高y判斷過程比較簡單yetl

係統設計清晰y源數據抽取相對清楚簡單y可以實現數據的遞增加載

最大的局限性就是由於某些數據庫在進行設計的時候y未考慮到增量字

段y需要對業務係統進行改造y基於數據庫其他方麵的原因y還有可能

出現漏數據的情況。

3.

全量同步

全量同步又叫

全表刪除插入方式

y是指每次抽取前先刪除目標表

數據y抽取時全新加載數據該方式實際上將增量抽取等同於全量

抽取對於數據量不大y全量抽取的時間代價小於執行增量抽取的

算法和條件代價時y可以采用該方式。

這種方式的優點是對已有係統表結構不產生影響y不需要修改業務

操作程序y所有抽取規則由etl完成y管理維護統一y可以實現數

據的遞增加載y沒有風險

缺點是etl比對較複雜y設計較為複雜y速度較慢與觸發器和時

間戳方式中的主動通知不同y全表比對方式是被動的進行全表數據

的比對y性能較差當表中沒有主鍵或唯一列且含有重複記錄時y

全表比對方式的準確性較差。

日誌比對的方式是通過獲取數據庫層麵的日誌來捕獲到變化的數據y

不需要改變源業務係統數據庫相關表結構y數據同步的效率比較高y

同步的及時性也比較快y最大的問題就是不同數據庫的日誌文件結

構存在較大的差異性y實施分析起來難度比較大y同時y需要具備

訪問源業務庫日誌表文件的權限y存在一定的風險性y所以這種方

式有很大的局限性。

日誌比對方式中比較成熟的技術是cdc(change

data

capture)技術y

作用同樣是能夠捕獲到上一次抽取之後產生的相關變化數據y當

cdc對源業務表進行新增更新和刪除等相關操作的時就可以捕獲

到相關變化的數據y相對於增量字段方式ycdc方式能夠較好地捕

獲到刪除數據y並寫入相關數據庫日誌表y然後再通過視圖或者彆

的某種可操作的方式將捕獲到的變化同步到數據倉庫當中去。

這種方式的優點是etl同步效率較高y不需要修改業務係統表結構y

可以實現數據的遞增加載缺點是業務係統數據庫版本與產品不統

一y難以統一實現y實現過程相對複雜y並且需深入研究方能實現

這種方式也通過第三方工具實現y但是y一般都是商業軟件y費用

較高。



最新小说: 我靠破案養家糊口 少尊主撿回了個瘋批Omega 我真不是龍傲天老婆 師姐穿軍嫂:兵哥,一起養孩子唄 黃仙討封,我告訴它要相信科學 火紅年代,開局大學演講 原神:璃月劍仙,玩家發癲 一腳悲催穿越古代,努力搞錢 遊戲人生No game No life 美食:我工廠擺攤賣盒飯饞哭全網