このテンプレートを使って新しいプロジェクトを始める方法を説明します。
# 新しいプロジェクト用にコピー
cp -r paper_project_template/ my_new_project/
cd my_new_project/
# Gitを初期化(既存のGit履歴を削除)
rm -rf .git
git init
git add .
git commit -m "Initial commit from template"-
README.md を編集
- プロジェクト名・概要を記入
- 研究目的・仮説を記載
-
CLAUDE.md を確認(必要に応じてカスタマイズ)
- プロジェクト固有のルールがあれば追加
# Python環境を作成
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
# パッケージをインストール
pip install -r requirements.txt
# データを配置
# data/raw/ に元データを配置(自動的にGit管理外)my_project/
├── data/
│ ├── raw/ # 元データ(Git管理外・編集禁止)
│ └── processed/ # 加工済みデータ
├── scripts/ # Pythonスクリプト
├── tasks/ # タスクチェックリスト(Markdown)
├── tables/ # 論文用テーブル(CSV、LaTeX)
├── figures/ # 論文用図(300 dpi以上)
├── results/ # 解析結果・中間ファイル
└── manuscript/ # 原稿
| ディレクトリ | 役割 | Git管理 |
|---|---|---|
data/raw/ |
元データ(PHI含む可能性あり) | 除外 |
data/processed/ |
前処理済みデータ | 任意 |
scripts/ |
解析スクリプト | 必須 |
tasks/ |
進捗管理チェックリスト | 必須 |
tables/ |
論文用テーブル | 必須 |
figures/ |
論文用図 | 必須 |
results/ |
中間結果・ログ | 任意 |
manuscript/ |
原稿ファイル | 必須 |
python scripts/data_profiler.py \
--input data/raw/patients.csv \
--output results/data_profile.md \
--correlationpython scripts/create_table1.py \
--input data/processed/clean_data.csv \
--group treatment \
--output tables/table1.mdpython scripts/check_quality.py --report results/quality_report.md# 図のスタイル設定
from scripts.figure_style import set_paper_style, save_figure
set_paper_style()
# 可視化
from scripts.visualization_toolkit import plot_kaplan_meier, plot_learning_curve
# ML実験管理
from scripts.ml_experiment_tracker import ExperimentTracker
tracker = ExperimentTracker("my_experiment")tasks/01_data_preparation.mdを開いてチェックリストを確認- データを
data/raw/に配置 data_profiler.pyでデータ品質を確認- 前処理後、
create_table1.pyでTable 1を作成 tasks/02_analysis.mdに沿って解析を進める
tasks/01_data_preparation.mdでデータ準備ml_experiment_tracker.pyで実験を管理visualization_toolkit.pyで学習曲線・評価結果を可視化- 結果を
results/experiments/に保存
プロジェクトタイプに応じて、不要なファイルを削除してください。
rm scripts/ml_experiment_tracker.py
# visualization_toolkit.py のML関連関数は無視でOK# タスクファイルを削減
rm tasks/03_manuscript_draft.md
rm tasks/04_submission.md
# manuscriptディレクトリを削除
rm -r manuscript/このファイルはテンプレートの改善記録です。 新しいプロジェクトでは削除するか、自分用のメモとして活用してください。
# 仮想環境を再作成
rm -rf .venv
python -m venv .venv
source .venv/bin/activate
pip install --upgrade pip
pip install -r requirements.txt# 個別にインストール
pip install lifelinesfigure_style.py の save_figure() を使用してください。
デフォルトで300 dpi以上で保存されます。
- EXAMPLES.md - 具体的な使用例
- tasks/ - タスクチェックリスト
- scripts/ - 各スクリプトのdocstring
質問があれば、各スクリプトの --help オプションを参照してください:
python scripts/data_profiler.py --help