CVPR papers topic viewer

This is a set of scripts for creating visual summary for all papers published at CVPR. The original idea is from https://github.com/colincsl/cvpr2013papers They show how one can manipulate PDFs, analyze word frequencies,

Installation

Clone this repository git clone https://github.com/xiangze/cvprpapers.git
Make sure you have the following libraries [System: ghostscript, imagemagick; Python: httplib2, beautifulsoup]

pip3 install -r  requirements.txt

On OSX: brew install ghostscript brew install imagemagick pip install httplib2 pip install beautifulsoup pip install gensim pip install pyLDAvis pip install nltk

1.1 Download NLTK stopwords

>>import nltk

>>nltk.download("stopwords")

for year in `seq 2016 2023`;do
./run.sh cvpr $year
done

contents of run.sh

python script	from	to
download_paper.py	cvpr+"year"	$conference$year/*.pdf
pdftowordcloud.py	$conference$year/*.pdf	topwords.p
scrape_pdfs.py	$conference$year/*.pdf	all_text.txt
makecorpus.py	$conference$year/*.pdf	alpapers.txt
genLDA.py	allpapers.txt	papers_%d.model'
genpages.py	papers_model:lda	$conference$year_$topicnum.html

Licence

WTFPL licence

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
perp		perp
result		result
Readme.md		Readme.md
cvpr.dict		cvpr.dict
cvpr_DTM_result.ipynb		cvpr_DTM_result.ipynb
cvpr_papers_10.model		cvpr_papers_10.model
download_paper.py		download_paper.py
genLDA.py		genLDA.py
generatenice.py		generatenice.py
generatenicelda.py		generatenicelda.py
genpages.py		genpages.py
getabstracts.py		getabstracts.py
lda.py		lda.py
makecorpus.py		makecorpus.py
pdftothumbs.py		pdftothumbs.py
pdftowordcloud.py		pdftowordcloud.py
perpexity.ipynb		perpexity.ipynb
requirements.txt		requirements.txt
run.sh		run.sh
runall.sh		runall.sh
scrape_cvpr.py		scrape_cvpr.py
scrape_pdfs.py		scrape_pdfs.py
stopwords.txt		stopwords.txt
topwords.p		topwords.p
vocabulary.py		vocabulary.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CVPR papers topic viewer

Installation

Licence

About

Releases

Packages

Languages

xiangze/CSpaperTopicViewer

Folders and files

Latest commit

History

Repository files navigation

CVPR papers topic viewer

Installation

Licence

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages