Redshift

Redshift は、ペタバイト級のデータを高速に処理できる データウェアハウス(DWH) です。

SQL準拠 / PostgreSQL互換 の構文でクエリを実行でき、既存のBIツールやアプリケーションと高い互換性を持ちます。

内部的には クラスタノード で構成され、データを分散配置するための ディストリビューションキー を用いることで、効率的な並列処理(MPP)を実現します。データは 列指向ストレージ(Columnar Storage) で格納され、ソートキー や 圧縮エンコード によりI/Oを最適化し、高速なクエリ応答を可能にしています。

マテリアライズドビュー による結果キャッシュや 結合最適化 により、複雑な分析クエリも高パフォーマンスで実行できます。さらに、AQUA(Advanced Query Accelerator) と RA3ノード を活用することで、ストレージ分離型のスケーラブルな構成が可能です。

Redshift Spectrum を使用すると、S3 上のデータを直接参照してクエリを実行でき、Athena と同様にデータレイク統合分析を実現します。

運用面では、Concurrency Scaling や Redshift Serverless によって、負荷や利用状況に応じて柔軟にスケールすることができます。

メタデータ管理には Glue Data Catalog / Lake Formation を活用し、Glue, QuickSight, Lambda, Kinesis などのサービスとシームレスに連携します。

AWS Glue / Data Pipeline / DMS と組み合わせることで、データの抽出・変換・移行(ETL)を自動化できます。

セキュリティと運用面では、自動スナップショット / モニタリング により高い可用性と可観測性を確保します。

料金体系は オンデマンド / リザーブドインスタンス / Serverless従量課金 から選択でき、コスト最適化も容易です。

重要用語

ノード
ディストリビューションキー
列指向ストレージ
マテリアライズドビュー
Concurrency Scaling
関連サービス
Lake Formation
QuickSight

ユースケース

  • リスト1
  • リスト2
  • リスト3

ベストプラクティス

  • リスト1
  • リスト2
  • リスト3

高可用性・冗長化

  • リスト1
  • リスト2
  • リスト3

セキュリティ

  • リスト1
  • リスト2
  • リスト3

運用・監視

  • リスト1
  • リスト2
  • リスト3

デフォルトのリミット値

リミット事項 上限数
項目1上限1
項目2上限2
項目3上限3
項目4上限4
項目5上限5

AWS CLIのサンプルコード

vpc を作成
vpc を作成
aaaaaaaaaaaaa
bbbbbbbbbbbbb
ccccccccccccc

Terraformのサンプルコード

vpc を作成
bbbbbbbbbbbbbbbbbbbbbbb
ddddddddddddddddddddddd
vpc を作成
xxxxxxxxxxxxxxxxxxxxxxx
yyyyyyyyyyyyyyyyyyyyyy

課金モデル

項目 内容
項目1内容1
項目2内容2
項目3内容3
項目4内容4
項目5内容5

公式ページ

AWSドキュメント