隨著企業(yè)收集的數(shù)據(jù)比以往任何時候都多,有效管理、集成和訪問這些數(shù)據(jù)的能力變得至關重要。兩種主要方法主導了這個領域:提取、轉換和加載(ETL) 以及提取、加載和轉換(ELT)。兩者都有相同的核心目的,即將數(shù)據(jù)從不同來源轉移到中央存儲庫中進行分析,但它們的實現(xiàn)方式不同。了解差異、相似之處和適當?shù)挠美峭晟茢?shù)據(jù)集成和可訪問性實踐的關鍵。
大數(shù)據(jù)的系統(tǒng)架構設計主要包含3個方面ETL設計、ODS層、OLAP(聯(lián)機分析處理),重點對ETL和OLAP進行分析:
Atitit etl之道 attilax著?1. ETL 11.1. (數(shù)據(jù)倉庫技術) 21.2. ETL的質(zhì)量問題具體表現(xiàn)為正確性、完整性、一致性、完備性、有效性、時效性和可獲取性等幾個特性 22.
Atitit etl之道 attilax著?1. ETL 11.1. (數(shù)據(jù)倉庫技術) 21.2. ETL的質(zhì)量問題具體表現(xiàn)為正確性、完整性、一致性、完備性、有效性、時效性和可獲取性等幾個特性 22.