データエンジニア(DE)へのキャリア転換を目指し、統計学の基礎からクラウドインフラの実装までを体系的に記録するリポジトリです。
「単なる暗記ではなく、実務に繋がる実装力を」 NotebookLM等のAIツールで構造化した知識を、TerraformやPythonを用いて「動く形」で再構成しています。
graph TD
subgraph Goal [2026 Career Pivot: Data Engineer]
G1[統計検定2級: データ解析の基礎]
G2[G検定: AIリテラシー/社会実装]
G3[AWS DEA: クラウドインフラ実装]
end
subgraph Tech_Stack [Mastering Tech Stack]
T1[Python / boto3]
T2[SQL / Athena]
T3[Terraform / IaC]
T4[Statistics / Math]
end
subgraph Business_Value [Business Impact]
V1[意思決定の安定化 / 異常値検知]
V2[分析環境の再現性 / IaC]
V3[コスト最適化 / サーバーレス]
end
G1 --> T4 --> V1
G2 --> T1 --> V1
G3 --> T3 --> V2
G3 --> T2 --> V3
style Goal fill:#f9f,stroke:#333,stroke-width:2px
style Business_Value fill:#bbf,stroke:#333,stroke-width:2px
実務のMLOps環境に準拠し、各資格・プロジェクトを独立して管理しています。
01_DEA/: AWSデータエンジニアリング関連の実装(旧terraform-aws/)02_Statistics_L2/: 統計学の理論検証(旧excel/notebooks/)03_G_Kentei/: AIリテラシー・社会実装・法律関連04_E_Shikaku/: 深層学習のアルゴリズム実装shared/: 共通スクリプト、過去のアーカイブ (old_notes)
sequenceDiagram
participant Biz as 事業課題 (在庫/欠品)
participant Stat as 統計学 (02_Statistics)
participant AWS as クラウド基盤 (01_DEA)
participant Goal as 意思決定の最適化
Biz->>Stat: データ分析・異常値除外
Note over Stat: 1.5xIQRルールによるクレンジング
Stat->>AWS: 堅牢なパイプラインで自動化
Note over AWS: Terraform + boto3 による自動構築
AWS->>Goal: 再現性の高い分析結果を提供
Goal-->>Biz: コスト削減・利益最大化
- 統計検定2級合格: 2026年内の取得を目指し、弱点の統計学を重点的に強化。
- G検定合格: 深層学習の理論と社会実装の基礎を習得。
- DEA合格: データエンジニアとしての基本であるSQLおよびTerraformの強化。
本リポジトリで取り組む技術スタックは、以下の具体的な事業課題の解決を想定しています。
- 課題: センサー故障や入力ミスによる異常値が、予測精度を著しく低下させていた。
- 解決: 1.5xIQRルールに基づき、異常値を自動的に除去・補正するモジュールを実装。
- 価値: 予測のブレを最小化し、不要な在庫コスト削減や欠品リスク低減に貢献します。
- 技術: AWS / Terraform / Docker
- 価値: インフラをコード化(IaC)することで、チーム全体が同一の分析環境を即座に構築でき、プロジェクトの立ち上げスピードを最大化します。
Terraformを用いてAWS S3バケットを構築・管理。実務を意識したリファクタリングを実践。
- IaC (Infrastructure as Code): 手動操作を排除し、再現性の高いインフラ構築を実現。
- Variablesの活用:
variables.tfによる変数分離を実装し、保守性を向上。 - セキュリティ・マナーの徹底:
.gitignoreを活用し、機密情報や不要なバイナリ(800MB超のprovider等)を適切に管理・排除。
- GitHubのファイルサイズ制限への対応:
- 誤ってGit管理に含めたプロバイダーの巨大バイナリによるエラーを経験。
git resetと.gitignore設定によりレポジトリをクリーンな状態に修正し、Git運用の作法を習得。
- 誤ってGit管理に含めたプロバイダーの巨大バイナリによるエラーを経験。
- Terraform最新構文への対応:
- 型指定における非推奨な記述を、エラーログに基づき最新の記述(引用符の排除)へ修正。
VS Code上のターミナルから terraform apply を実行し、AWS S3リソースが正常にプロビジョニングされる様子です。
| VSCodeディレクトリ構成 | アップロード成功ログ |
|---|---|
![]() |
![]() |
プログラム(boto3)経由で作成されたフォルダおよびファイルが、クラウド上に正しく反映されていることをコンソール上で確認しました。
| S3バケット内のオブジェクト一覧 |
|---|
![]() |
© 2026 kou-sato / Data Engineer Aspirant


