ctdiff

ctdiff implements a constant-time diff algorithm based on a modified Myers algorithm. Unlike traditional diff tools, it maintains consistent execution time regardless of file content patterns, preventing timing-based side-channel attacks.

Key Features

Timing Attack Resistance: Execution time depends only on file sizes, not content differences
Multiple Security Levels: Configurable security/performance trade-offs
Familiar Output: Unix diff-compatible output formats
Binary File Support: Secure comparison of non-text files
Cryptographic Quality: Uses the subtle crate for constant-time operations

Installation

Install from Git [Recommended]

cargo install --git https://github.com/tanctl/ctdiff

Building From Source

git clone https://github.com/tanctl/ctdiff
cd ctdiff
cargo build --release

The binary will be available at target/release/ctdiff or you can install it with:

cargo install --path .

Usage

Basic Comparison

ctdiff file1.txt file2.txt

Security Options

# Maximum security (strongest timing protection)
ctdiff --security-level maximum file1.txt file2.txt

# Balanced performance and security
ctdiff --security-level balanced file1.txt file2.txt

# Performance optimized with basic security
ctdiff --security-level fast file1.txt file2.txt

Output Formats

# Unified diff (default, legacy format)
ctdiff file1.txt file2.txt

# Side-by-side comparison (legacy)
ctdiff --format side-by-side file1.txt file2.txt

# New format system with enhanced features
ctdiff --new-format json file1.txt file2.txt          # Structured JSON
ctdiff --new-format html file1.txt file2.txt          # Web-friendly HTML
ctdiff --new-format git file1.txt file2.txt           # Git-compatible patches
ctdiff --new-format summary file1.txt file2.txt       # Statistics summary

# Output to files
ctdiff --new-format html --output diff.html file1.txt file2.txt

Additional Options

# Colored output
ctdiff --color file1.txt file2.txt

# Show timing information
ctdiff --show-timing file1.txt file2.txt

# Quiet mode (exit code only)
ctdiff --quiet file1.txt file2.txt

# Set maximum file size (in KB)
ctdiff --max-size 1024 file1.txt file2.txt

# Force processing despite security warnings
ctdiff --force large_file1.txt large_file2.txt

Exit Codes

0: Files are identical
1: Files differ
2: Error occurred (missing files, security limits exceeded, etc.)

Security Levels

Maximum Security

Strongest timing attack resistance
Input padding and size normalization
Strict size limits (4KB default)
Best for highly sensitive environments

Balanced (Default)

Good security with reasonable performance
Moderate size limits (256KB default)
Auto-calculated input padding
Suitable for most applications

Fast

Basic security guarantees
Larger size limits (1MB default)
Optimized for performance
For less sensitive use cases

Examples

basic/ - Basic examples to understand ctdiff cli options and basic functionality.
security/ - Timing attack examples and constant-time programming patterns.
library/ - Rust API usage examples
tools/ - Demo scripts and utilities for automated testing.

Security Considerations

Why Constant-Time?

Traditional diff algorithms can leak information through execution time:

Files with early differences may be processed faster
Identical files might take different time than completely different ones
Content patterns can influence algorithm performance

When to Use ctdiff

Version Control: Comparing sensitive source code
Document Systems: Secure document comparison
Cryptographic Applications: Any scenario where file content confidentiality matters
High-Security Environments: Where side-channel resistance is required

Limitations

Performance trade-off for security guarantees
Memory usage proportional to file size squared (O(m*n))
Not suitable for very large files without careful configuration

Architecture

Security-First Design

ctdiff implements a modified Myers diff algorithm with constant-time guarantees to prevent timing side-channel attacks. Unlike traditional diff tools that optimize for speed, ctdiff ensures execution time depends only on input sizes, not content patterns.

Core Components

src/
├── algorithm.rs           # Constant-time Myers algorithm implementation
├── primitives.rs          # Cryptographic constant-time primitives  
├── security.rs            # Configurable security levels and policies
├── builder.rs             # Fluent API for easy configuration
├── result.rs              # Rich result objects with multiple output formats
├── formats/               # Extensible output format system
│   ├── unified.rs         # Traditional unified diff (Unix compatible)
│   ├── json.rs            # Structured JSON for APIs
│   ├── html.rs            # Web-friendly HTML with CSS
│   ├── git.rs             # Git-compatible patches  
│   └── summary.rs         # Statistical summaries
├── vulnerable.rs          # Educational vulnerable implementation
├── attack.rs              # Timing attack simulation framework
└── timing.rs              # High-precision timing analysis tools

Constant-Time Algorithm (`algorithm.rs`)

The core diff engine implements these security properties:

No Early Termination: Always processes complete inputs regardless of differences
Oblivious Memory Access: Same memory access patterns for all input combinations
Branch-Free Operations: Uses subtle crate for cryptographic constant-time primitives
Optional Input Padding: Normalize inputs to uniform sizes for stronger protection

// Traditional vulnerable approach
for (a, b) in bytes_a.iter().zip(bytes_b.iter()) {
    if a != b { return false; } // TIMING LEAK: early exit
}

// Constant-time approach  
let mut diff = 0u8;
for (a, b) in bytes_a.iter().zip(bytes_b.iter()) {
    diff |= a ^ b; // Accumulate all differences
}
diff == 0 // No early exit

Security Levels (`security.rs`)

Three preconfigured security levels balance protection vs. performance:

Level	File Limit	Input Padding	Timing Protection	Use Case
Maximum	4KB	Fixed padding	Strict	Cryptographic applications
Balanced	256KB	Auto padding	Moderate	Version control, documents
Fast	1MB	No padding	Basic	Performance-critical systems

Constant-Time Primitives (`primitives.rs`)

Low-level building blocks for timing-attack resistance:

ct_bytes_eq(): Timing-safe byte comparison (no short-circuit evaluation)
ct_min()/ct_max(): Branch-free minimum/maximum using conditional selection
ct_lookup(): Oblivious array access that touches all elements
ct_memcmp(): Lexicographic comparison without early exit

Attack Demonstration Framework

Vulnerable Implementation (vulnerable.rs): Intentionally vulnerable diff with common timing leaks:

Early termination on first difference
Content-dependent algorithm selection
Short-circuit boolean evaluation
Variable-time heuristics Attack Simulation (attack.rs): Comprehensive timing attack testing:
Multiple attack scenarios (early vs. late changes, similarity detection)
Statistical analysis with t-tests for significance
Attack success probability calculation
Side-by-side vulnerable vs. secure timing comparison Timing Analysis (timing.rs): High-precision measurement tools:
Nanosecond-accuracy timing with statistical analysis
Confidence intervals and significance testing
CSV/JSON export for external analysis
Validates constant-time properties

Performance Characteristics

Time Complexity: O(nm) where n,m are input lengths
Space Complexity: O(nm) for edit distance matrix
Security Overhead: ~2-10x slower than optimized diff algorithms
Memory Access: Predictable patterns resistant to cache timing attacks

The performance cost is the price of security - constant-time algorithms trade speed for timing-attack resistance.

Library Usage

ctdiff provides a powerful library API for Rust applications:

Quick Start

use ctdiff::{DiffBuilder, SecurityLevel, OutputFormat};

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // create a diff builder with desired configuration
    let diff = DiffBuilder::new()
        .security_level(SecurityLevel::Balanced)
        .output_format(OutputFormat::Unified)
        .context_lines(3)
        .color(true)
        .build()?;
    
    // compare two strings
    let result = diff.compare_text("hello world", "hello rust")?;
    
    // get information about the diff
    println!("Edit Distance: {}", result.edit_distance());
    println!("Similarity: {:.1}%", result.similarity() * 100.0);
    println!("Identical: {}", result.is_identical());
    
    // format output
    let formatted = result.format()?;
    println!("{}", formatted);
    
    Ok(())
}

Multiple Output Formats

use ctdiff::{DiffBuilder, OutputFormat};

// JSON output for APIs
let json_diff = DiffBuilder::new()
    .output_format(OutputFormat::Json)
    .build()?;

let result = json_diff.compare_text("old", "new")?;
let json_output = result.format()?;

// HTML output for web applications
let html_diff = DiffBuilder::new()
    .output_format(OutputFormat::Html)
    .build()?;

let result = html_diff.compare_text("old", "new")?;
let html_output = result.format()?;

// summary for monitoring
let summary_diff = DiffBuilder::new()
    .output_format(OutputFormat::Summary)
    .build()?;

let result = summary_diff.compare_text("old", "new")?;
println!("{}", result.format()?);

File Comparison

use ctdiff::{DiffBuilder, SecurityLevel};

let diff = DiffBuilder::new()
    .security_level(SecurityLevel::Maximum)
    .max_file_size(64 * 1024) // 64KB limit
    .build()?;

// compare files directly
let result = diff.compare_files("file1.txt", "file2.txt")?;
println!("Files differ by {} operations", result.edit_distance());

// detailed statistics
let stats = result.statistics();
println!("Insertions: {}", stats.insertions);
println!("Deletions: {}", stats.deletions);
println!("Similarity: {:.2}%", stats.similarity * 100.0);

Security Configuration

use ctdiff::security::{SecurityConfig, TimingProtection};

// custom security configuration
let custom_config = SecurityConfig {
    max_input_size: 1024,
    pad_inputs: true,
    padding_size: Some(2048),
    validate_inputs: true,
    max_edit_distance: Some(512),
    memory_protection: true,
    timing_protection: TimingProtection::Strict,
};

// validate configuration before use
custom_config.validate()?;

let diff = DiffBuilder::new()
    .security_config(custom_config)
    .build()?;

Error Handling

use ctdiff::{DiffBuilder, Error};

match diff.compare_files("file1.txt", "file2.txt") {
    Ok(result) => {
        println!("Edit distance: {}", result.edit_distance());
    }
    Err(Error::Security { message }) => {
        eprintln!("Security violation: {}", message);
    }
    Err(Error::Io(io_err)) => {
        eprintln!("File I/O error: {}", io_err);
    }
    Err(Error::ResourceLimit { message }) => {
        eprintln!("Resource limit exceeded: {}", message);
    }
    Err(e) => {
        eprintln!("Other error: {}", e);
    }
}

Integration Examples

See the examples/library/ directory for comprehensive examples:

basic_usage.rs - Fundamental library operations
performance_comparison.rs - Performance benchmarks across security levels
security_demo.rs - Security features and best practices
integration_examples.rs - Real-world integration scenarios

Testing

Run the test suite:

# unit tests
cargo test

# integration tests including cli
cargo test --test cli

# property-based tests
cargo test --features proptest

License

GPL v3 - see LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
benches		benches
examples		examples
src		src
tests		tests
.gitignore		.gitignore
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
LICENSE		LICENSE
README.md		README.md

License

tanctl/ctdiff

Folders and files

Latest commit

History

Repository files navigation

ctdiff

Key Features

Installation

Install from Git [Recommended]

Building From Source

Usage

Basic Comparison

Security Options

Output Formats

Additional Options

Exit Codes

Security Levels

Maximum Security

Balanced (Default)

Fast

Examples

Security Considerations

Why Constant-Time?

When to Use ctdiff

Limitations

Architecture

Security-First Design

Core Components

Constant-Time Algorithm (algorithm.rs)

Security Levels (security.rs)

Constant-Time Primitives (primitives.rs)

Attack Demonstration Framework

Performance Characteristics

Library Usage

Quick Start

Multiple Output Formats

File Comparison

Security Configuration

Error Handling

Integration Examples

Testing

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Constant-Time Algorithm (`algorithm.rs`)

Security Levels (`security.rs`)

Constant-Time Primitives (`primitives.rs`)

Packages