Text to Image using DCGAN

This implementation is a PyTorch-based version of Generative Adversarial Text-to-Image Synthesis paper. In this project, a Conditional Generative Adversarial Network (CGAN) is trained, leveraging text descriptions as conditioning inputs to generate corresponding images. The architecture of this model draws inspiration from DCGAN (Deep Convolutional Generative Adversarial Network).

Requirements

h5py==3.6.0
numpy==1.21.5
Pillow==10.0.0
torch==2.0.0

Dataset

We used Caltech-UCSD Birds 200 and text embeddings provided by Reed Scott et al.

Repository

├── models
├     └──  dcgan_model.py
├── utils.py
├── data_util.py
├── requirements.txt
└──  DCGAN_Text2Image.ipynb

Results

References

[1] Generative Adversarial Text-to-Image Synthesis https://arxiv.org/abs/1605.05396

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
models		models
result		result
.gitignore		.gitignore
DCGAN_Text2Image.ipynb		DCGAN_Text2Image.ipynb
README.md		README.md
data_util.py		data_util.py
requirements.txt		requirements.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Text to Image using DCGAN

Requirements

Dataset

Repository

Results

References

About

Releases

Packages

Languages

yashashwita20/text-to-image-using-GAN

Folders and files

Latest commit

History

Repository files navigation

Text to Image using DCGAN

Requirements

Dataset

Repository

Results

References

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages