FER TAR course project

Detection of propaganda techniques in news articles

Original shared task data and labels are located in data/articles and data/labels.

data_parsing.py is responsible for generating labeled words from original data, suitable for sequence labeling task
split_data.py splits processed data (located in data/labeled_articles) into train-validate-test split. Also, it merges all articles into one file for each split, which is needed for Flair datasets
training.py is example of Flair usage for sequence labeling tasks. Its output can be some simple baseline, and it is stored in folder resources (ignored by git)

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
data		data
.gitignore		.gitignore
BertEmbeddings.ipynb		BertEmbeddings.ipynb
BertExploration.ipynb		BertExploration.ipynb
BertLayers.ipynb		BertLayers.ipynb
BertLearning.ipynb		BertLearning.ipynb
Example.ipynb		Example.ipynb
README.md		README.md
TAR2020_paper_14.pdf		TAR2020_paper_14.pdf
continueTraining.py		continueTraining.py
custom_embeddings.py		custom_embeddings.py
evaluation.py		evaluation.py
hyperParamOptimizer.py		hyperParamOptimizer.py
liwc2007_embeddings.pickle		liwc2007_embeddings.pickle
liwc2015_embeddings.pickle		liwc2015_embeddings.pickle
official_evaluation.py		official_evaluation.py
training.py		training.py