layout | background-class | body-class | title | summary | category | image | author | tags | github-link | github-id | featured_image_1 | featured_image_2 | accelerator | order | demo-model-link | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
hub_detail |
hub-background |
hub |
MobileNet v2 |
์์ฐจ ๋ธ๋ก์ ๊ธฐ๋ฐํ ์๋์ ๋ฉ๋ชจ๋ฆฌ์ ์ต์ ํ๋ ํจ์จ์ ์ธ ๋คํธ์ํฌ |
researchers |
mobilenet_v2_1.png |
Pytorch Team |
|
pytorch/vision |
mobilenet_v2_1.png |
mobilenet_v2_2.png |
cuda-optional |
10 |
import torch
model = torch.hub.load('pytorch/vision:v0.10.0', 'mobilenet_v2', pretrained=True)
model.eval()
๋ชจ๋ ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ๋ค์ ๋์ผํ ๋ฐฉ์์ผ๋ก ์ ๊ทํ๋ ์ด๋ฏธ์ง๋ฅผ ์
๋ ฅ์ผ๋ก ์ฌ์ฉํฉ๋๋ค.
์ฆ, ๋ฏธ๋ ๋ฐฐ์น์ 3-์ฑ๋ RGB ์ด๋ฏธ์ง๋ค์ (3 x H x W)
์ ํํ๋ฅผ ๊ฐ์ง๋ฉฐ, ํด๋น H
์ W
๋ ์ต์ 224
์ด์์ด์ด์ผ ํฉ๋๋ค.
๊ฐ ์ด๋ฏธ์ง๋ [0, 1]
์ ๋ฒ์ ๋ด์์ ๋ถ๋ฌ์์ผ ํ๋ฉฐ, mean = [0.485, 0.456, 0.406]
๊ณผ std = [0.229, 0.224, 0.225]
์ ์ด์ฉํด ์ ๊ทํ๋์ด์ผ ํฉ๋๋ค.
๋ค์์ ์คํ ์์ ์ ๋๋ค.
# pytorch ์น์ฌ์ดํธ์์ ์์ ์ด๋ฏธ์ง ๋ค์ด๋ก๋
import urllib
url, filename = ("https://github.com/pytorch/hub/raw/master/images/dog.jpg", "dog.jpg")
try: urllib.URLopener().retrieve(url, filename)
except: urllib.request.urlretrieve(url, filename)
# ์คํ ์์ (torchvision ํ์)
from PIL import Image
from torchvision import transforms
input_image = Image.open(filename)
preprocess = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])
input_tensor = preprocess(input_image)
input_batch = input_tensor.unsqueeze(0) # ๋ชจ๋ธ์์ ์๊ตฌํ๋ ํํ์ ๋ฏธ๋๋ฐฐ์น ์์ฑ
# ์ฌ์ฉ ๊ฐ๋ฅํ ๊ฒฝ์ฐ ์๋๋ฅผ ์ํด ์
๋ ฅ ๋ฐ์ดํฐ์ ๋ชจ๋ธ์ GPU๋ก ์ด๋
if torch.cuda.is_available():
input_batch = input_batch.to('cuda')
model.to('cuda')
with torch.no_grad():
output = model(input_batch)
# output์ 1000๊ฐ์ Tensor ํํ์ด๋ฉฐ, ์ด๋ Imagenet ๋ฐ์ดํฐ ์
์ 1000๊ฐ ํด๋์ค์ ๋ํ ์ ๋ขฐ๋ ์ ์๋ฅผ ๋ํ๋ด๋ ๊ฒฐ๊ณผ
print(output[0])
# output ๊ฒฐ๊ณผ๋ ์ ๊ทํ๋์ง ์์ ๊ฒฐ๊ณผ. ํ๋ฅ ์ ์ป๊ธฐ ์ํด์ softmax๋ฅผ ๊ฑฐ์ณ์ผ ํจ.
probabilities = torch.nn.functional.softmax(output[0], dim=0)
print(probabilities)
# ImageNet ๋ผ๋ฒจ ๋ค์ด๋ก๋
!wget https://raw.githubusercontent.com/pytorch/hub/master/imagenet_classes.txt
# ์นดํ
๊ณ ๋ฆฌ ์ฝ์ด๋ค์ด๊ธฐ
with open("imagenet_classes.txt", "r") as f:
categories = [s.strip() for s in f.readlines()]
# ์ด๋ฏธ์ง ๋ณ ์์ ์นดํ
๊ณ ๋ฆฌ ํ์
top5_prob, top5_catid = torch.topk(probabilities, 5)
for i in range(top5_prob.size(0)):
print(categories[top5_catid[i]], top5_prob[i].item())
MobileNet v2 ๊ตฌ์กฐ๋ ์์ฐจ ๋ธ๋ก์ ์ ๋ ฅ ๋ฐ ์ถ๋ ฅ์ด ์์ ๋ณ๋ชฉ ๊ณ์ธต ํํ์ธ ๋ฐ์ ๋ ์์ฐจ ๊ตฌ์กฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค. ๋ฐ์ ๋ ์์ฐจ ๊ตฌ์กฐ๋ ์ ๋ ฅ๋จ์์ ํ์ฅ๋ ํํ์ ์ฌ์ฉํ๋ ๊ธฐ์กด์ ์์ฐจ ๋ชจ๋ธ๊ณผ ๋ฐ๋๋๋ ๊ตฌ์กฐ์ ๋๋ค. MobileNet v2๋ ๊ฒฝ๋ํ๋ depthwise ํฉ์ฑ๊ณฑ์ ์ฌ์ฉํ์ฌ ์ค๊ฐ ํ์ฅ ๊ณ์ธต์ ํน์ง๋ค์ ํํฐ๋งํฉ๋๋ค. ๋ํ, ํํ๋ ฅ ์ ์ง๋ฅผ ์ํด ์ข์ ๊ณ์ธต์ ๋น์ ํ์ฑ์ ์ ๊ฑฐ๋์์ต๋๋ค.
๋ชจ๋ธ ๊ตฌ์กฐ | Top-1 ์ค๋ฅ | Top-5 ์ค๋ฅ |
---|---|---|
mobilenet_v2 | 28.12 | 9.71 |