Sensor-Based Modeling of Fatigue Using Transformer Model

Abstract

Fatigue is a common symptom of many chronic diseases, lowers productivity, and is a main culprit in driving accidents. Yet up to date, the main method to monitor fatigue is through questionnaires, which are not only slow and costly but suffer from subjective biases. In this work, we explore the feasibility of automated fatigue monitoring using machine learning (ML). Our models achieve a weighted F1-score of 0.75 ± 0.02 for physical and 0.66 ± 0.04 for mental fatigue on stratified group 5-fold cross-validation (CV). Using a convolutional neural network (CNN), our approach reaches an F1-score of 0.68 $\pm$ 0.24 and a balanced accuracy of 0.67 ± 0.19 for physical fatigue on leave-one-subject-out (LOSO) CV. Additionally, we explore different missing data imputation methods for physiological data from wearables and demonstrate the feasibility of using a transformer model for imputation. The transformer model outperforms all other imputation techniques (e.g., linear interpolation, nearest neighbour) by 4%-49% and shows high stability for different time-series data. Lastly, we show the advantages of hybrid imputation strategies that use different imputation methods based on physiological variables and missing data length. These results open up new opportunities to leverage machine learning and sensor data to automatically measure fatigue. Additionally, they show the capability of transformer models to impute missing data in physiological signals.

Overview repository

Data: This folder contains the used dataset in raw form
Models: This folder contains the trained transformer models
- transformer_imputation_final: This model is trained on the full dataset for 2000 epochs and used for imputation.
- transformer_imputation6500: This model is trained on the provided training set for 6500 epochs and is used to compare against other imputation methods.
Output: This folder contains:
- A) Dataset:
  - combined_data.csv: This is the used dataset in (X, Y) form (X: physiological variables, y: binary labels)
  - combined_data_mean.csv: The is the used dataset with daily mean physiological data
  - combined_data_unnested.csv: This is the used dataset with each row being a separate measurement
- B) Spectrograms (linear interpolation):
  - feature_vector#.npy: An individual spectrogram
  - labels#.npy: Binary labels (PhF, MF) for a spectrogam
  - metadata.txt: Additional information (subjectID, etc.)
- C) Statistical feature set:
  - feature_vector_stat#.npy: An individual statistical feature vector
  - labels_stat#.npy: Binary labels (PhF, MF)
  - metadata_stat.txt: Additional information (subjectID, etc.)
- D) Other feature sets:
  - transformer_imputation: Spectrograms using transformer imputation
  - full_transformer_imputation: Spectrograms with full transformer output (not just imputation)
  - stat_imputation: Statistical feature vectors using linear interpolation
  - stat_transformer_imputation: Statistical feature vectors using transformer imputation
Scores: This folder contains the classification scores for each CV
CNN.ipynb: CNN model
data_analyzation.R: Statistical analysis of dataset
evaluator.py: Utility functions used for evaluation
data_loader.ipynb: This notebook loads the dataset from its raw form (in Data) to used dataset (in Output)
imputation_comparison.ipynb: This notebook is used to compare the different imputation methods
imputation_transformer.ipynb: This notebook trains the transformer on the full dataset
imputation_utils.py: Utility functions for imputation_comparison.iypnb and imputation_transformer.ipynb
majority_voting.ipynb: Biased random guess baseline
preproc_data.ipynb: Preprocessing pipeline for spectrograms (with segmentation)
preproc_data_no_segments.ipynb: Preprocessing pipeline for spectrograms (without segmentation)
preproc_data_stat.ipynb: Preprocessing pipeline for statistical features
random_forest.ipynb: Random forest model
random_guess.ipynb: Random guess baseline
xgboost.ipynb: XGBoost model

Data pipeline

a) Classification

flowchart TD;
    Data --> id1([data_loader])
    id1([data_loader]) --> Output
    
    Output --> id2([preproc_data])
    Output --> id14([transformer_imputation])
    Output --> id13([preproc_data_no_segments])
    Output --> id6([preproc_data_stat])
    Output ---> id4([majority_voting])
    Output ---> id9([random_guess])

    id6([preproc_data_stat]) --> id8([random_forest])
    id6([preproc_data_stat]) --> id10([XGBoost])
    id13([preproc_data_no_segments]) --> id5([CNN])
    id2([preproc_data]) --> id5([CNN])
    
    id14([transformer_imputation]) <.-> id2([preproc_data])
    id14([transformer_imputation]) <.-> id13([preproc_data_no_segments])
    
    id5([CNN]) --> id11([evaluator])
    id4([majority_voting]) --> id11([evaluator])
    id8([random_forest]) --> id11([evaluator])
    id10([XGBoost]) --> id11([evaluator])
    id9([random_guess]) --> id11([evaluator])

b) Statistical analysis & imputation comparison

flowchart TD;
    Data --> id1([data_loader])
    id1([data_loader]) --> Output
    
    Output --> id3([data_analyzation])
    Output --> id12([imputation_comparison])
    
    id12([imputation_comparison]) <.-> id4([imputation_utils])

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sensor-Based Modeling of Fatigue Using Transformer Model

Abstract

Overview repository

Data pipeline

a) Classification

b) Statistical analysis & imputation comparison

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 78 Commits
.idea		.idea
Data		Data
Models		Models
Output		Output
Scores		Scores
__pycache__		__pycache__
.DS_Store		.DS_Store
.RData		.RData
.Rhistory		.Rhistory
.gitignore		.gitignore
CNN.ipynb		CNN.ipynb
LICENSE		LICENSE
README.md		README.md
data_analyzation.R		data_analyzation.R
data_loader.ipynb		data_loader.ipynb
evaluator.py		evaluator.py
imputation_comparison.ipynb		imputation_comparison.ipynb
imputation_transformer.ipynb		imputation_transformer.ipynb
imputation_utils.py		imputation_utils.py
majority_voting.ipynb		majority_voting.ipynb
preproc_data.ipynb		preproc_data.ipynb
preproc_data_no_segments.ipynb		preproc_data_no_segments.ipynb
preproc_data_stat.ipynb		preproc_data_stat.ipynb
random_forest.ipynb		random_forest.ipynb
random_guess.ipynb		random_guess.ipynb
xgboost.ipynb		xgboost.ipynb

License

Yahnnosh/Sensor-Based-Modeling-of-Fatigue-Using-Transformer-Model

Folders and files

Latest commit

History

Repository files navigation

Sensor-Based Modeling of Fatigue Using Transformer Model

Abstract

Overview repository

Data pipeline

a) Classification

b) Statistical analysis & imputation comparison

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages