TimeCraft/supplementary/dataset_split.md at main · microsoft/TimeCraft

Train, Validation, and Test set Split for Time-Series Dataset with Text Descriptions

After generating textual descriptions for the time-series data, we split the output files into training, validation, and test sets. This ensures the datasets are ready for model training and evaluation. It splits the data into train, validation, and test sets according to a predefined ratio (default: 80% train, 10% val, 10% test).

The splitting process is implemented in the following script: Dataset Split Code

Example Command

python dataset_split.py --input_dir ./output_files --output_dir ./split_files

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Train, Validation, and Test set Split for Time-Series Dataset with Text Descriptions

Example Command

FilesExpand file tree

dataset_split.md

Latest commit

History

dataset_split.md

File metadata and controls

Train, Validation, and Test set Split for Time-Series Dataset with Text Descriptions

Example Command