EMNIST_classify

you can download dataset here. (EMNIST handwrite dataset) https://www.kaggle.com/datasets/crawford/emnist

And, you can download dataset (Next Word)

letters train https://drive.google.com/file/d/1TvXANMn2LKcbI09MzWNgEhD7lv4IgvaS/view?usp=sharing
letters test https://drive.google.com/file/d/17OlyrwbJBTfXf_yCK7DWUH7h9Y0-sxU8/view?usp=sharing
balanced train https://drive.google.com/file/d/1xrq9av_rSsBOz3PGI6EH9cLORjytJfbk/view?usp=sharing
balanced test https://drive.google.com/file/d/1PluDzPRd_OSPzu-SUfyxTJ3OqFK4VAjE/view?usp=sharing

데이터 분석
- emnist-letters : A-Z 총 26개 class train 약 89,000 test 약 14,800
- emnist-balnaced : 0-9, A-Z, 대문자와 비슷하지 않은 소문자 총 47개 class
- encodedpdc : emnist-letters에 맞춰 LSTM으로 각 문자 class를 실제 output으로 가지는 예측 데이터를 만든 것
- encodedbalancepdc : emnist-balanced에 맞춰 LSTM으로 각 문자 class를 실제 output으로 가지는 예측 데이터를 만든 것
CNN
VGG16

vgg16은 Imagenet challenge에서 탄생한 모델이라 input이미지 크기가 224x224x3이고 ouput class 수가 1000개로 고정 되어 있어서 emnist 데이터의 크기와 클래스 수에 맞게 끔 조정 해 주는 과정이 필요했습니다.

(2424를 4848로 변환)

RESNET
LSTM : dataset 만드는 데 사용

이미지 처리 모델 + LSTM으로 예측한 데이터 처리

CNN, VGG16, RESNET 등의 이미지를 처리하는 모델의 출력과 사전에 LSTM으로 산출한 실제 레이블에 대한 score점수를 처리하는 모델의 출력을 연접한 후 softmax를 적용해서 classification했습니다. 중간에 activation함수는 relu를 사용했습니다.

Letters에 대한 결과
- CNN 90% -> 95%
- VGG16 92% -> 96%
- RESNET 93% -> 95%
Balanced에 대한 결과
- CNN 85% -> 95%
- VGG16 87% -> 95%
- RESNET 87% -> 95%

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
CNN.ipynb		CNN.ipynb
README.md		README.md
RESNET.ipynb		RESNET.ipynb
vgg16.ipynb		vgg16.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EMNIST_classify

About

Releases

Packages

Languages

Lipeya/EMNIST_classify

Folders and files

Latest commit

History

Repository files navigation

EMNIST_classify

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages