Words Embedding & Visualization

Installation

conda create -n we-venv -y python=3.7 && conda activate we-venv
pip install -r requirements.txt

Usage

Insert project path e.g. :

/Users/your_name/Desktop/WordsEmbedding

then you can choose between a tiny dataset (100 sentences) and a big dataset (15927 sentences). Just uncomment the variable which you want to use in main.py. This script is computationally intensive and was written for educational purpose. I would recomment to use the tiny dataset.

then run the script:

python main.py

Training

i used:

optimizer: Stochastic gradient descent
epochs: 10
learning rate: 0.01
momentum: 0.9

for targetword in sentence:
for contextword arround targetword:
embedding = matmul(E, targetword)
tmp = matmul(W, embedding)
predicted_contextword = softmax(tmp)
minimize(predicted_contextword, contextword)

Visualization

For the visualization I used the dimension reduction method T-SNE.

Contact

If you have any Input for me to make the training more efficient or better feel free to contact me.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
data		data
.gitignore		.gitignore
README.md		README.md
embedding.jpg		embedding.jpg
main.py		main.py
preprocessing.py		preprocessing.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Words Embedding & Visualization

Installation

Usage

Training

Visualization

Contact

About

Releases

Packages

Languages

besrym/Words-Embedding-Visualization

Folders and files

Latest commit

History

Repository files navigation

Words Embedding & Visualization

Installation

Usage

Training

Visualization

Contact

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages