Time-Series Image Classifier

A production-ready deep learning project for time-series image classification using EfficientNet/NFNet with PyTorch Lightning. This project implements transfer learning for multi-class classification tasks with selective fine-tuning techniques, supporting both single-modal (image-only) and multi-modal (image + time-series features) learning approaches. Currently adopts EfficientNet-B4 as the main architecture.

日本語版README | English README

Features

Model-Selectable Transfer Learning: Pre-trained EfficientNet-B4 (main), NFNet-F0, or ResNet18 (fallback) with configurable fine-tuning approaches
Multi-Modal Support: Single-modal (image-only) and multi-modal (image + numerical time-series features)
Selective Fine-tuning: Choose between stage-wise differential learning rates or progressive unfreezing
F1-Score Optimization: Comprehensive F1-score based evaluation and early stopping
Production-Ready: Resume training from checkpoints, flexible YAML configuration system
Advanced Visualization: TensorBoard integration with comprehensive metrics tracking
Feature Engineering: LightGBM-based feature importance analysis with automatic config updates
Hyperparameter Optimization: Optuna integration for automated hyperparameter tuning
Cross-Platform: Support for local development and Google Colab environments

Why F1-Score Optimization?

This project prioritizes F1-score for model evaluation and optimization:

Class Imbalance Robustness: F1-score provides robust evaluation for imbalanced datasets
Precision-Recall Balance: Harmonically balances precision and recall, minimizing both false positives and false negatives
Performance-Based Checkpointing: Saves models based on validation F1-score improvements, ensuring actual predictive performance gains
Hyperparameter Optimization: Optuna optimization targets F1-score maximization for optimal model selection

Class Imbalance Handling Strategy

To address class imbalance in datasets, the following strategy is employed:

Uniform Sampling: All classes are balanced to match the sample count of the smallest class
Cross-Split Consistency: Maintains unified class distribution across training, validation, and test sets

Key F1-score applications:

Model Checkpointing: epoch={epoch:05d}-val_loss={val_loss:.4f}-val_f1={val_f1:.4f}.ckpt
Early Stopping: Prevents overfitting when validation F1-score stops improving
Feature Importance: LightGBM analysis optimizes feature selection for maximum F1-score

Requirements

PyTorch
PyTorch Lightning
TorchVision
TorchMetrics
PyYAML
TensorBoard
scikit-learn (evaluation & visualization)
matplotlib (visualization)
LightGBM (feature importance analysis)
Optuna (hyperparameter optimization)

Quick Start

Setup

Clone the repository
Option A: Local Setup
- Install PyTorch with CUDA support: pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu121
- Install other dependencies: pip install -r requirements.txt
- Install Optuna integration: pip install optuna-integration[pytorch_lightning]
Option B: Docker Setup
- Pull from Docker Hub: docker pull kechiro/timeseries-image-classifier:latest
- Or build locally: ./build-docker.sh
Configure settings:
- Local environment: configs/config.yaml
- Google Colab: configs/config_for_google_colab.yaml
- Set model_mode ('single' or 'multi') and model_architecture_name

Training

Local execution:

python main.py

Docker execution:

# Run with Docker Compose (recommended)
docker-compose up

# Or run directly
docker run --gpus all -it kechiro/timeseries-image-classifier:latest

Resume Training

To resume training, specify the checkpoint filename in your config file:

# In config.yaml
resume_from_checkpoint: last.ckpt  # or 'epoch=00051-val_loss=0.7755-val_f1=0.6688.ckpt' (example)

Then run:

python main.py

Google Colab Training

Use the provided notebook for Google Colab training:

feature_analysis/colab_runner_current.ipynb

This notebook automates:

Google Drive mounting
Library installation
Configuration setup (configs/config_for_google_colab.yaml)
Training execution (main.py)
Checkpoint resumption
TensorBoard visualization
Model evaluation and prediction visualization

Advanced Features

Data Validation

Enable dataset shape validation:

check_data: true

Feature Importance Analysis

Optimize feature selection for multi-modal models:

python feature_analysis/feature_analysis.py

This script performs:

LightGBM-based feature importance analysis
Walk-forward validation for time-series data
Optuna hyperparameter optimization
Top feature extraction and automatic config updates

For detailed usage: feature_analysis/README.md

Configuration

Main Training Config (`config.yaml`/`config_for_google_colab.yaml`)

Key parameters:

model_mode: 'single' or 'multi'
model_architecture_name: Architecture name (e.g., 'nfnet', 'efficientnet')
max_epochs: Training epochs
batch_size: Batch size
precision: Computation precision ('16-mixed' recommended)
early_stopping_patience: Early stopping patience
use_progressive_unfreezing: Enable progressive unfreezing
lr_head, lr_backbone, lr_decay_rate: Learning rate settings
datasets: Dataset list to use
resume_from_checkpoint: Checkpoint file for resumption

Progressive Fine-tuning

Stage-wise differential learning rate implementation:

Classifier Head: Highest learning rate (lr_head) for task-specific output
Layer 4 (Deepest): Base learning rate (lr_backbone)
Layer 3: Base LR × decay rate
Layer 2: Base LR × decay rate²
Layer 1: Base LR × decay rate³

Benefits:

Transfer Learning Efficiency: Lower rates for general features, higher for task-specific
Overfitting Prevention: Balanced learning across network depth
Training Stability: Gradient explosion/vanishing prevention

Progressive Unfreezing Schedule

Stage 1 (stage1_epoch): Unfreeze Layer 4
Stage 2 (stage2_epoch): Unfreeze Layer 3
Stage 3 (stage3_epoch): Unfreeze Layer 2

Model Architecture

The classification model consists of:

Feature Extraction: Pre-trained EfficientNet-B4/NFNet-F0/ResNet18 (single-modal) or combined image + numerical features (multi-modal)
Classification Head: Multi-layer neural network that generates intermediate representations and performs final class classification

Checkpoints

Checkpoints are saved in checkpoints/{model_mode}/{model_architecture_name}/:

F1-Score Based: Best validation F1-score model
Latest Epoch: Last epoch model (last.ckpt)

TensorBoard Visualization

Launch TensorBoard

# Example: Single-modal NFNet (Local)
tensorboard --logdir="./logs/single/nfnet"

# Example: Multi-modal NFNet+Transformer (Colab)
# tensorboard --logdir="/content/drive/MyDrive/Time_Series_Classifier/logs/multi/nfnet_transformer"

Available Metrics

Scalars: Training/validation loss, F1-score, learning rate progression
Images: Input data and model attention visualization (if configured)
Graphs: Model network structure
Distributions: Model weights and biases
Histograms: Gradient and activation distributions

Dataset Structure

Required Folder Organization

project_root/
├── data/
│   ├── README.md                                # Data structure documentation
│   ├── fix_labeled_data_timeseries_15m.csv     # Label file (sample)
│   ├── timeseries_15m_202412301431.csv         # Feature file (sample)
│   ├── dataset_a_15m_winsize40/                # Dataset A (image data)
│   │   ├── README.md                           # Image data requirements
│   │   ├── train/                              # Training data
│   │   │   ├── class_0/                        # Class 0 images (label 0)
│   │   │   │   ├── dataset_a_15m_20240101_0900_label_0.png
│   │   │   │   └── ...
│   │   │   ├── class_1/                        # Class 1 images (label 1)
│   │   │   └── class_2/                        # Class 2 images (label 2)
│   │   └── test/                               # Test data
│   │       ├── class_0/                        # Class 0 images (label 0)
│   │       ├── class_1/                        # Class 1 images (label 1)
│   │       └── class_2/                        # Class 2 images (label 2)
│   ├── dataset_b_15m_winsize40/                # Dataset B (same structure)
│   │   ├── README.md
│   │   ├── train/
│   │   │   ├── class_0/
│   │   │   ├── class_1/
│   │   │   └── class_2/
│   │   └── test/
│   │       ├── class_0/
│   │       ├── class_1/
│   │       └── class_2/
│   └── dataset_c_15m_winsize40/                # Dataset C (same structure)
│       ├── README.md
│       ├── train/
│       │   ├── class_0/
│       │   ├── class_1/
│       │   └── class_2/
│       └── test/
│           ├── class_0/
│           ├── class_1/
│           └── class_2/

File Naming Conventions

Image Files

{dataset_name}_{timeframe}_{YYYYMMDD}_{HHMM}_label_{class_id}.png

Examples:

dataset_a_15m_20240101_0900_label_0.png → class_0 (label 0)
dataset_a_15m_20240101_0915_label_1.png → class_1 (label 1)

Time-Series Data (Multi-modal)

{dataset_name}_{timeframe}_{YYYYMMDD}{HHMM}.csv

Example:

dataset_a_15m_202412301431.csv → Data for 2024-12-30 14:31

Configuration Examples

Local Environment (`configs/config.yaml`)

# Data directory settings
data_dir: "./data"

# Dataset directories
dataset_a_dir: "./data/dataset_a_15m_winsize40"
dataset_b_dir: "./data/dataset_b_15m_winsize40"
dataset_c_dir: "./data/dataset_c_15m_winsize40"

# Datasets to use
datasets: ["dataset_a", "dataset_b", "dataset_c"]

Multi-modal Configuration

model_mode: "multi"

# Time-series data settings
timeseries:
  data_path: "./data/timeseries_15m_202412301431.csv"
  feature_columns: ["feature_1", "feature_2", "feature_3", "feature_4", "feature_5", "feature_6"]
  window_size: 40

# Class settings
num_classes: 3
class_names: ["class_0", "class_1", "class_2"]

Multi-modal Learning Workflow

Label Extraction: Labels are obtained from image directory structure (class_0/, class_1/, class_2/)
Timestamp Extraction: Extract datetime from image filenames (e.g., dataset_a_15m_202401020930_label_1.png → 2024-01-02 09:30:00)
Feature Matching: Match extracted timestamps with corresponding time-series data from feature CSV
Multi-modal Input: Combine image data + time-series feature data for training

Important: Image filename timestamps must match feature CSV timestamps for proper alignment.

Troubleshooting

GPU Memory Error: Reduce batch_size or increase accumulate_grad_batches. Use precision: '16-mixed'
NFNet Loading Error: Update TorchVision or automatic ResNet18 fallback will occur
Training Convergence Issues: Adjust learning rates (lr_head, lr_backbone) or weight_decay
Windows Environment: Set num_workers: 0 in config (default setting)
Checkpoint Not Found: Verify checkpoint filename and path in checkpoints/{model_mode}/{model_architecture_name}/

References

License

This project is licensed under the MIT License - see the LICENSE file for details.

Contributing

Contributions are welcome! Please feel free to submit a Pull Request.

Citation

If you use this project in your research, please consider citing:

@software{timeseries_image_classifier,
  title={Time-Series Image Classifier},
  author={kechirojp},
  year={2025},
  url={https://github.com/kechirojp/timeseries-image-classifier}
}

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.devcontainer		.devcontainer
configs		configs
data		data
feature_analysis		feature_analysis
scripts		scripts
src		src
tuning		tuning
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
README_ja.md		README_ja.md
__init__.py		__init__.py
build-docker.sh		build-docker.sh
docker-compose.yml		docker-compose.yml
main.py		main.py

Folders and files

Latest commit

History

Repository files navigation

Time-Series Image Classifier

Features

Why F1-Score Optimization?

Class Imbalance Handling Strategy

Requirements

Quick Start

Setup

Training

Resume Training

Google Colab Training

Advanced Features

Data Validation

Feature Importance Analysis

Configuration

Main Training Config (config.yaml/config_for_google_colab.yaml)

Progressive Fine-tuning

Progressive Unfreezing Schedule

Model Architecture

Checkpoints

TensorBoard Visualization

Launch TensorBoard

Available Metrics

Dataset Structure

Required Folder Organization

File Naming Conventions

Image Files

Time-Series Data (Multi-modal)

Configuration Examples

Local Environment (configs/config.yaml)

Multi-modal Configuration

Multi-modal Learning Workflow

Troubleshooting

References

License

Contributing

Citation

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Main Training Config (`config.yaml`/`config_for_google_colab.yaml`)

Local Environment (`configs/config.yaml`)

Packages