データメッシュ

全体構成主要原則に基づいて設計されたデータメッシュ
セールスドメインデータソース: RDS(トランザクション)
処理: Glue(ETL)
データプロダクト: S3(売上分析データ)
公開: API Gateway経由
マーケティングドメインデータソース: DynamoDB(キャンペーン)
処理: Kinesis(イベント)
データプロダクト: S3(顧客行動データ)
公開: API Gateway経由
サプライチェーンドメインデータソース: IoT Core(センサー)
処理: Lambda(処理)
データプロダクト: S3(在庫・物流データ)
公開: API Gateway経由
ファイナンスドメインデータソース: Aurora(ERP)
処理: Glue(ETL)
データプロダクト: S3(財務レポート)
公開: API Gateway経由
Self-Serveデータプラットフォーム(共通基盤)Lake Formation(データ管理)
Glue Catalog(メタデータ)
Service Catalog(テンプレート)
CloudFormation(IaC )
CodeCommit(バージョン管理)
CodePipeline(CI/CD)
CloudWatch(監視)
Cost Explorer(コスト管理)
DataZone(カタログ)
連合型ガバナンスIAM(アクセス管理)
KMS(暗号化)
Macie(機密データ検出)
Config(コンプライアンス)
CloudTrail(監査)
Organizations(組織管理)
表1.全体構成(データメッシュ)

ドメイン指向の分散型データ所有
(Domain-oriented Decentralized Data Ownership)
データを「中央のデータチーム」ではなく、各事業ドメイン(プロダクトチームなど)が自分たちで所有するという考え方。
データをプロダクトとして扱う
(Data as a Product)
データは使われて初めて価値があるため、ユーザー(分析者・他チーム・サービス)が安心して使える “製品” として提供する。
セルフサービス型データプラットフォーム
(Self-serve Data Platform)
各ドメインチームがデータの提供・利用をしやすいように、共通のプラットフォームやツールを整備する。
統合的なガバナンス
(Federated Computational Governance)
各ドメインが独立性を保ちながら、全体で共通して守るべきルール(セキュリティ・互換性・標準)を共有する仕組み。
表2.主要原則(データメッシュ)