このDockerイメージは、AlphaGenomeおよび一般的なデータサイエンス向けライブラリがインストールされた、最小限のPython環境を提供します。Google Colabに近い環境をローカルやオフラインで再現することを目的としています。
- alphagenome
- matplotlib
- pandas
- Dockerのインストール(https://docs.docker.com/get-docker/ を参照)
Dockerイメージをビルドするには、以下を実行します:
docker build -t alphagenome-env .これにより、alphagenome-env という名前のイメージが作成されます。
コンテナ内で対話型のPythonセッションを開始するには:
docker run -it --rm alphagenome-envAPIキーを使って run.py を実行するには、環境変数として渡すことができます:
docker run -it --rm \
-v $(pwd):/alphagenome \
-e API_KEY=your_real_api_key_here \
alphagenome-env python run.py seq.faもしくは、このディレクトリに以下の内容を含む .env ファイルを作成してください:
API_KEY=your_real_api_key_hereその後、次のコマンドでコンテナを実行します:
docker run -it --rm \
-v $(pwd):/alphagenome \
--env-file .env \
alphagenome-env python run.py seq.faデフォルトでは、コンテナ内の作業ディレクトリは /alphagenome に設定されています。
ローカルのプロジェクトディレクトリをこれにマウントするには:
docker run -it --rm -v $(pwd):/alphagenome alphagenome-env| 出力種別 | 説明 | 対象とするデータ・解釈 |
|---|---|---|
| ATAC | Tn5トランスポザーゼを用いてクロマチンの開いた領域を検出 | オープンクロマチン領域、調節活性の指標 |
| CAGE | 5’キャップ化RNAを基に転写開始点(TSS)を特定 | プロモーター活性、正確なTSSの位置 |
| DNASE | DNase I感受性部位(DHS)を検出 | エンハンサーやプロモーターなどの制御領域 |
| RNA_SEQ | RNAシーケンスによる遺伝子発現量の定量 | 発現量の推定、スプライシングパターンの解析 |
| CHIP_HISTONE | ヒストン修飾(例:H3K27acなど)に対するChIP-seq解析 | 活性なエピジェネティックマーク、クロマチン状態の評価 |
| CHIP_TF | 転写因子に対するChIP-seq解析 | TF結合部位の特定、調節ネットワークの構築 |
| SPLICE_SITES | スプライスドナー/アクセプター部位の注釈または予測 | エクソン-イントロン境界、スプライスシグナル |
| SPLICE_SITE_USAGE | 各スプライス部位の使用頻度などの定量的情報 | スプライシングの動態、アイソフォームの切り替えの解析 |
| SPLICE_JUNCTIONS | RNA-seqリードから推定されるエクソン接合部 | 代替スプライシングの検出 |
| CONTACT_MAPS | Hi-CやMicro-Cなどによるクロマチン相互作用データ | 3次元ゲノム構造、エンハンサー・プロモーターのループ解析 |
| PROCAP | 精密なrun-on法による転写開始点の高解像度検出 | 活性なTSSの検出、エンハンサーの転写活性評価 |
Pythonシェルの代わりにJupyterLabを起動するには、Dockerfile内のCMDを変更するか、以下のように上書きします:
docker run -it --rm -p 8888:8888 alphagenome-env jupyter lab --ip=0.0.0.0 --allow-root --no-browserその後、ブラウザで http://localhost:8888 にアクセスしてください。
このプロジェクトはMITライセンスの下で提供されています。詳細は LICENSE ファイルをご覧ください。