Automatic Neural Image Captioning

I am using an inject architecture for Xception - LSTM model to generate caption for images. I used pretrained weights from ImageNet for Xception encoder and used pretrained Stanford GloVe word embeddings.

Data

I used Flickr 8k dataset which is a collection of 8k images with their respective captions where each image consists five different captions.

Requirements

Python 3.7

Keras 2.3

Numpy 1.18

Pandas 1.0

Matplotlib 3.1

NLTK 3.4.5

Re 2.2.1

Results

Reference

Deep Visual-Semantic Alignments for Generating Image Descriptions, Andrej Karpathy, Li Fei-Fei

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
model		model
test		test
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Automatic Neural Image Captioning

Data

Requirements

Results

Reference

About

Releases

Packages

Languages

h-pal/Automatic-neural-image-captioning

Folders and files

Latest commit

History

Repository files navigation

Automatic Neural Image Captioning

Data

Requirements

Results

Reference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages