
Redshift は、ペタバイト級のデータを高速に処理できる データウェアハウス(DWH) です。
SQL準拠 / PostgreSQL互換 の構文でクエリを実行でき、既存のBIツールやアプリケーションと高い互換性を持ちます。
内部的には クラスタ と ノード で構成され、データを分散配置するための ディストリビューションキー を用いることで、効率的な並列処理(MPP)を実現します。データは 列指向ストレージ(Columnar Storage) で格納され、ソートキー や 圧縮エンコード によりI/Oを最適化し、高速なクエリ応答を可能にしています。
マテリアライズドビュー による結果キャッシュや 結合最適化 により、複雑な分析クエリも高パフォーマンスで実行できます。さらに、AQUA(Advanced Query Accelerator) と RA3ノード を活用することで、ストレージ分離型のスケーラブルな構成が可能です。
Redshift Spectrum を使用すると、S3 上のデータを直接参照してクエリを実行でき、Athena と同様にデータレイク統合分析を実現します。
運用面では、Concurrency Scaling や Redshift Serverless によって、負荷や利用状況に応じて柔軟にスケールすることができます。
メタデータ管理には Glue Data Catalog / Lake Formation を活用し、Glue, QuickSight, Lambda, Kinesis などのサービスとシームレスに連携します。
AWS Glue / Data Pipeline / DMS と組み合わせることで、データの抽出・変換・移行(ETL)を自動化できます。
セキュリティと運用面では、自動スナップショット / モニタリング により高い可用性と可観測性を確保します。
料金体系は オンデマンド / リザーブドインスタンス / Serverless従量課金 から選択でき、コスト最適化も容易です。
重要用語
ユースケース
- リスト1
 - リスト2
 - リスト3
 
ベストプラクティス
- リスト1
 - リスト2
 - リスト3
 
高可用性・冗長化
- リスト1
 - リスト2
 - リスト3
 
セキュリティ
- リスト1
 - リスト2
 - リスト3
 
運用・監視
- リスト1
 - リスト2
 - リスト3
 
デフォルトのリミット値
| リミット事項 | 上限数 | 
|---|---|
| 項目1 | 上限1 | 
| 項目2 | 上限2 | 
| 項目3 | 上限3 | 
| 項目4 | 上限4 | 
| 項目5 | 上限5 | 
AWS CLIのサンプルコード
vpc を作成
#include <stdio.h>
void main(void) {
  int i;
  for (i=0; i<10; i++)
    printf("%d\n", i);
vpc を作成
aaaaaaaaaaaaa
bbbbbbbbbbbbb
ccccccccccccc
Terraformのサンプルコード
vpc を作成
bbbbbbbbbbbbbbbbbbbbbbb
ddddddddddddddddddddddd
vpc を作成
xxxxxxxxxxxxxxxxxxxxxxx
yyyyyyyyyyyyyyyyyyyyyy
課金モデル
| 項目 | 内容 | 
|---|---|
| 項目1 | 内容1 | 
| 項目2 | 内容2 | 
| 項目3 | 内容3 | 
| 項目4 | 内容4 | 
| 項目5 | 内容5 |