はじめに

この記事では、VSCodeのRemote Containers拡張機能を利用し、DockerでPythonのデータ分析環境を構築、運用する手法について解説します。

前提条件

  • Dockerがインストール済みである
  • 使用するエディタはVSCode
  • ターミナルはVSCode上から利用

手順

1. プロジェクトディレクトリの作成

環境はプロジェクトごとに用意する想定です。 今回は、 python_data_analysis_vscode というプロジェクトを作成していきます。

mkdir python_data_analysis_vscode
cd python_data_analysis_vscode

2. Dockerfileの作成

続いて、Dockerfileを作成していきましょう。 Dockerfileには以下の内容を記入します。

FROM python:3.9
WORKDIR /workspace
RUN pip install numpy pandas matplotlib seaborn jupyterlab scikit-learn

3. .devcontainer/devcontainer.jsonの作成

.devcontainerディレクトリ内にdevcontainer.jsonを作成します。

{
  "name": "Python Data Analysis",
  "build": {
    "dockerfile": "../Dockerfile",
    "context": ".."
  },
  "extensions": [
    "ms-python.python"
  ],
  "forwardPorts": [8888]
}

4. Remote Containers拡張機能のインストール

VSCodeでRemote - Containersをインストールします。

5. Remote Containerの起動

VSCodeでプロジェクトディレクトリを開き、Remote Containerを起動します。

6. Jupyter Labの起動

jupyter lab --ip=0.0.0.0 --port=8888 --no-browser --allow-root

まとめ

VSCodeとDockerを組み合わせることで、カスタマイズしたPythonデータ分析環境を簡単に構築、運用することができます。 特にRemote Containers拡張は、環境設定の手間を大きく削減してくれます。