-
Notifications
You must be signed in to change notification settings - Fork 0
/
gg_20230426.qmd
195 lines (138 loc) · 8.34 KB
/
gg_20230426.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
---
title: "chatGPT"
subtitle: "경기도 직무교육(4/26~28)"
author:
- name: 이광춘
url: https://www.linkedin.com/in/kwangchunlee/
affiliation: 한국 R 사용자회
affiliation-url: https://github.com/bit2r
- name: 신종화
url: https://modernity.tistory.com/
affiliation: 한국 R 사용자회
affiliation-url: https://github.com/bit2r
date: "2023-04-26"
title-block-banner: true
#title-block-banner: "#562457"
format:
html:
css: css/quarto.css
theme: flatly
code-fold: true
code-overflow: wrap
toc: true
toc-depth: 3
toc-title: 목차
number-sections: true
highlight-style: github
self-contained: false
filters:
- lightbox
lightbox: auto
link-citations: true
knitr:
opts_chunk:
message: false
warning: false
collapse: true
comment: "#>"
R.options:
knitr.graphics.auto_pdf: true
editor_options:
chunk_output_type: console
editor:
markdown:
wrap: 72
---
```{mermaid}
flowchart LR
subgraph 주 강의범위
A[강의 PPT] --> AB["글쓰기<br>(write)"] --> B[실습: <br> 개회사 등]
A[강의 PPT] --> AC["그리기<br>(draw)"] --> C[그리기: <br> 이미지 작성자 등]
A[강의 PPT] --> AD["코딩<br>(code)"] --> D[실습: <br> 엑셀 등]
end
subgraph 부 강의범위
A[강의 PPT] -.-> AE["추론<br>(code)"] -.-> E[실습: <br> 수능 등]
end
B --> F["심화(선택)"]
C --> F["심화(선택)"]
D --> F["심화(선택)"]
E -.-> F["심화(선택)"]
click A href "https://r2bit.com/bitSlide/slideshow/202304-gpt/#/title-slide"
click AB href "https://r2bit.com/chatGPT/prompt_in_practice.html"
click F href "https://r2bit.com/chatGPT/"
class A nodeStyle
class AB,AC,AD,AE theoryStyle
class B,C,D,E practiceStyle
class F taskStyle
classDef nodeStyle fill:#93c47d,stroke:#000000,stroke-width:0.7px,font-weight:bold,font-size:14px;
classDef theoryStyle fill:#f59542,stroke:#000000,stroke-width:0.7px,font-weight:bold,font-size:14px;
classDef practiceStyle fill:#4287f5,stroke:#000000,stroke-width:0.7px,font-weight:bold,font-size:14px;
classDef taskStyle fill:#42f548,stroke:#000000,stroke-width:0.7px,font-weight:bold,font-size:12px;
```
# 기계가 학습을 정말(?)
[Code.org](https://code.org/)는 모든 학교의 모든 학생이 초중고 핵심 교육의 일환으로 컴퓨터 과학을 배울 수 있는 기회를 갖는다는 비전에 전념하는 교육 혁신 비영리 단체로 젊은 여성과 기타 소외 계층의 학생 참여를 늘리는 데 중점을 두고 학교에서 컴퓨터 과학에 대한 접근성을 확대하고 있다.
[Code.org](https://code.org/)에서 제작한 인공지능 교육 사례를 살펴보고 다음 심화과정으로 넘어가자
- [AI: Is this a fish?](https://studio.code.org/s/oceans/lessons/1/levels/2)
# AI 모형 개발
[티처블 머신(teachable machine)](https://teachablemachine.withgoogle.com/)을 사용하면 로컬 컴퓨터에
별다른 설치없이 기계학습(AI 인공지능) 모형을 개발하는 것은 물론 서비스로 출시도 가능하다.
```{mermaid}
flowchart LR
A[데이터셋] --> B(기계학습 <br> 훈련)
B --> C[배포]
C --> D[추론]
style A fill:#9fe6a0,stroke:#333,stroke-width:2px;
style B fill:#80c1ff,stroke:#333,stroke-width:2px;
style C fill:#ffa080,stroke:#333,stroke-width:2px;
style D fill:#f7ddbb,stroke:#333,stroke-width:2px;
```
## 문제가 어려운 이유
기계학습(AI) 모형을 개발할 때 가장 중요한 것이 데이터셋이다.
과거 AI 모형은 강아지 그림과 고양이 그림을 잘 구별하지 못하였다.
하지만 2010년 전후로 새로운 인공지능 기술이 개발되면서 이런 문제는 자연히
해결되고 더 나아가 커다란 변혁이 일어났다.
:::{#fig-dogs layout-ncol=3}
![양치기 강아지와 마대자루 걸레](images/dog-food-comparison-bagel-muffin-lookalike-teenybiscuit-karen-zack-6__700.jpg)
![치와와 강아지와 머핀](images/dog-food-comparison-bagel-muffin-lookalike-teenybiscuit-karen-zack-7__700.jpg)
![강아지와 베이글 빵](images/dog-food-comparison-bagel-muffin-lookalike-teenybiscuit-karen-zack__700.jpg)
출처: [Puppies Or Food? 12 Pics That Will Make You Question Reality](https://www.boredpanda.com/dog-food-comparison-bagel-muffin-lookalike-teenybiscuit-karen-zack)
:::
## 데이터셋
Zenodo [Cats and Dogs sample](https://zenodo.org/record/5226945#.ZDSZ03ZBwuU) 데이터셋은 [캐글 고양이와 개 데이터셋](https://www.kaggle.com/c/dogs-vs-cats/data)에서 추출한 소규모 개와 고양이 데이터셋으로 훈련 세트용 이미지 1000개(고양이 500개, 개 500개)와 테스트 세트용 이미지 400개(각각 200개)가 포함되어 있다.
다운로드 받은 데이터셋을 로컬 컴퓨터에서 압축을 푼다.
고양이와 강아지 사진을 윈도우즈 탐색기를 사용해서 살펴본다.
## 훈련
데이터에서 구분된 고양이와 강아지를 이미지를 각각 범주에 넣고 학습버튼을 눌러 학습을 완료시킨다.
필요한 경우 웹캠 혹은 고양이, 강아지 이미지를 구해 출력값이 제대로 나오는지 점검한다.
![](images/cats_dogs_training.jpg)
## 배포
[[고양이와 강아지 사진 분류 서비스](https://teachablemachine.withgoogle.com/models/WDOR30DkZ/)]{.aside}
우측 **미리보기** **모델 내보내기** 버튼을 눌러 모형을 내보낸다.
"공유 가능한 링크"의 복사 버튼을 클릭하면 웹 브라우져에서 접속이 가능한 URL이 생성되어 이를 공유한다.
![](images/cats_dogs_deploy.jpg)
## 실습
:::{.callout-note collapse="true"}
### 치와와 강아지와 머핀을 구분하는 인공지능 모형을 만드세요
1. 캐글 [chihuahua or muffin](https://www.kaggle.com/datasets/returnofsputnik/chihuahua-or-muffin) 데이터셋 다운로드
1. [teachable machine](https://teachablemachine.withgoogle.com/) 웹사이트 접속
1. 치와와 강아지와 머핀을 구분하는 기계학습 모형 개발
- 치와와 강아지 이미지 (`test` 폴더)
- 머핀 이미지 (`test` 폴더)
1. 개발완료 후 웹링크 배포하여 공유
:::
# 챗GPT 보안사고
- [정두용 (2023-03-30), "우려가 현실로…삼성전자, 챗GPT 빗장 풀자마자 ‘오남용’ 속출", 이코노미스트](https://economist.co.kr/article/view/ecn202303300057)
> 삼성전자 DS 부문 임직원 A씨는 **반도체 설비 계측 데이터베이스(DB)** 다운로드 프로그램의 소스 코드를 실행 중 오류를 확인했다. 문제가 된 소스 코드 전부를 복사해 챗GPT에 입력, 해결 방법을 문의했다. 삼성전자 설비 계측과 관련한 소스 코드가 오픈AI 학습 데이터로 입력된 셈이다.
> 임직원 B씨는 수율·불량 설비 파악을 위해 작성한 **프로그램 코드**를 챗GPT에 입력하는 사고를 냈다. 관련 소스 전체를 챗GPT에 입력하고 코드 최적화를 요청했다. 임직원 C씨는 스마트폰으로 녹음한 회의 내용을 **네이버 클로바 애플리케이션(앱)**을 통해 문서 파일로 변환한 뒤 챗GPT에 입력했다. 회의록 작성 요청이 목적이다.
- [민재용 (2023.04.02), "이탈리아도 챗GPT '차단'...서방 국가중 처음", 한국일보](https://m.hankookilbo.com/News/Read/A2023040208490005108)
> 로이터 통신 등에 따르면 이탈리아 데이터 보호청은 "챗GPT가 이탈리아의 개인정보 보호 기준과 규정을 충족할 때까지 서비스 접속을 일시적으로 차단할 것"이라고 밝혔다.
> 접속 차단 이유는 개인정보 침해 우려 때문이다. 이탈리아 당국은 챗GPT가 알고리즘 학습을 이유로, 개인정보를 대량으로 수집하고 저장하는 행위를 정당화할 법적 근거가 없다고 지적했다. 보호청은 챗GPT 개발사 오픈AI가 20일 이내에 해결책을 내놓지 않으면 전 세계 매출액의 최대 4%에 달하는 벌금을 물게 될 것이라고 경고하기도 했다.
# 챗GPT 글쓰기
- [바로가기](gg_20230426_write.html)
# 챗GPT 그리기
- [바로가기](gg_20230426_draw.html)
# 챗GPT 코딩
- [바로가기](gg_20230426_excel.html)
# 사례분석
- 오피스 전쟁: [마이크로소프트 오피스](https://r2bit.com/chatGPT/office.html)
- 사례 분석: [AI부상과 일자리의 변화](https://r2bit.com/bitSlide/slideshow/202304-gpt/#/%ED%95%9C%EA%B3%84-limit)