From 87075ec088a2f40095f5c23fa375547fc4ee710b Mon Sep 17 00:00:00 2001 From: wonsang you <45346964+Uwonsang@users.noreply.github.com> Date: Sun, 13 Oct 2019 14:32:46 +0900 Subject: [PATCH 1/3] Retranslate_image MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit image 문서 전체적으로 번역 및 수정하였습니다. --- sources/preprocessing/image.md | 639 +++++++++++++++++---------------- 1 file changed, 337 insertions(+), 302 deletions(-) diff --git a/sources/preprocessing/image.md b/sources/preprocessing/image.md index 21457ac1..cf11db60 100644 --- a/sources/preprocessing/image.md +++ b/sources/preprocessing/image.md @@ -1,93 +1,111 @@ - -# 이미지 전처리 +# 이미지 전처리Image Preprocessing [[source]](https://github.com/keras-team/keras/blob/master/keras/preprocessing/image.py#L238) -## ImageDataGenerator 클래스 + +## 이미지 데이터 생성 클래스ImageDataGenerator Class ```python keras.preprocessing.image.ImageDataGenerator(featurewise_center=False, samplewise_center=False, featurewise_std_normalization=False, samplewise_std_normalization=False, zca_whitening=False, zca_epsilon=1e-06, rotation_range=0, width_shift_range=0.0, height_shift_range=0.0, brightness_range=None, shear_range=0.0, zoom_range=0.0, channel_shift_range=0.0, fill_mode='nearest', cval=0.0, horizontal_flip=False, vertical_flip=False, rescale=None, preprocessing_function=None, data_format='channels_last', validation_split=0.0, interpolation_order=1, dtype='float32') ``` -실시간 데이터 증강을 사용해서 텐서 이미지 데이터 배치를 생성합니다. -데이터에 대해 (배치 단위로) 루프가 순환됩니다. +실시간 데이터 증강Data augmentation을 이용하여 텐서 이미지 데이터의 배치들을 생성합니다. +데이터가 배치 단위로 루프Loop를 순환합니다. __인수__ -- __featurewise_center__: 불리언. - 데티터셋에 대해 특성별로 인풋의 평균이 0이 되도록 합니다. -- __samplewise_center__: 불리언. 각 샘플의 평균이 0이 되도록 합니다. -- __featurewise_std_normalization__: 불리언. - 인풋을 각 특성 내에서 데이터셋의 표준편차로 나눕니다. -- __samplewise_std_normalization__: 불리언. 각 인풋을 표준편차로 나눕니다. -- __zca_whitening__: 불리언. 영위상 성분분석 백색화를 적용할지 여부입니다. -- __zca_epsilon__: 영위상 성분분석 백색화의 엡실론 값. 디폴트 값은 1e-6입니다. -- __rotation_range__: 정수. 무작위 회전의 각도 범위입니다. -- __width_shift_range__: 부동소수점, 1D 형태의 유사배열 혹은 정수 - - 부동소수점: < 1인 경우 전체 가로넓이에서의 비율, >= 1인 경우 픽셀의 개수입니다. - - 1D 형태의 유사배열: 배열에서 가져온 무작위 요소입니다. - - 정수: `(-width_shift_range, +width_shift_range)` - 사이 구간의 픽셀 개수입니다. - - `width_shift_range=2`인 경우 유효값은 - 정수인 `[-1, 0, +1]`로, - `width_shift_range=[-1, 0, +1]`와 동일한 반면, - `width_shift_range=1.0`인 경우 유효값은 - `[-1.0, +1.0)`의 구간 사이 부동소수점입니다. -- __height_shift_range__: 부동소수점, 1D 형태의 유사배열 혹은 정수 - - 부동소수점: < 1인 경우 전체 세로높이에서의 비율, >= 1인 경우 픽셀의 개수입니다. - - 1D 형태의 유사배열: 배열에서 가져온 무작위 요소입니다. - - 정수: `(-height_shift_range, +height_shift_range)` - 사이 구간의 픽셀 개수입니다. - - `height_shift_range=2`인 경우 - 유효한 값은 정수인 `[-1, 0, +1]`으로 - `height_shift_range=[-1, 0, +1]`와 동일한 반면, - `height_shift_range=1.0`인 경우 유효한 값은 - `[-1.0, +1.0)`의 구간 사이 부동소수점입니다. -- __brightness_range__: 두 부동소수점 값으로 이루어진 리스트 혹은 튜플. - 밝기 정도를 조절할 값의 범위입니다. -- __shear_range__: 부동소수점. 층밀리기의 강도입니다. - (도 단위의 반시계 방향 층밀리기 각도) -- __zoom_range__: 부동소수점 혹은 [하한, 상산]. 무작위 줌의 범위입니다. - 부동소수점인 경우, `[하한, 상한] = [1-zoom_range, 1+zoom_range]`입니다. -- __channel_shift_range__: 부동소수점. 무작위 채널 이동의 범위입니다. +- __featurewise_center__: `Bool`. 데이터셋의 특성 단위 Feature-wise로 입력 값의 평균이 0이 되도록 합니다. + +- __samplewise_center__: `Bool`. 각 표본Sample의 평균이 0이 되도록 합니다. + +- __featurewise_std_normalization__: `Bool`. + 입력 값을 데이터셋의 특성 단위로 구한 표준편차로 나눕니다. + +- __samplewise_std_normalization__: `Bool`. 각 입력값을 표본 단위로 구한 표준편차로 나눕니다. + +- __zca_whitening__: `Bool`. ZCA 화이트닝ZCA whitening를 적용할지 여부입니다. + +- __zca_epsilon__: ZCA 화이트닝의 엡실론Epsilon 값. 기본값Defalut은 1e-6입니다. + +- __rotation_range__: `Int`. 임의 회전의 각도Degree 범위입니다. + +- __width_shift_range__: `Float`, `1-D array-like` 혹은 `Int` + + - `Float`: < 1인 경우 전체 가로넓이의 비율, >= 1인 경우 픽셀의 개수입니다. + - `1-D array-like`: 배열Array에서 가져온 임의 요소Element입니다. + - `Int`: `(-width_shift_range, +width_shift_range)` + 사이 구간의 픽셀 개수입니다. + - `width_shift_range=2`인 경우 유효값은 + 정수형인 `[-1, 0, +1]`로, + `width_shift_range=[-1, 0, +1]`와 동일한 반면, + `width_shift_range=1.0`인 경우 유효값은 + `[-1.0, +1.0)`의 구간 사이 부동 소수점입니다. + +- __height_shift_range__: `float`, `1-D array-like` 혹은 `int` + + - `Float`: < 1인 경우 전체 세로높이에서의 비율, >= 1인 경우 픽셀의 개수입니다. + - `1-D array-like`: 배열에서 가져온 임의 요소입니다. + - `Int`: `(-height_shift_range, +height_shift_range)` + 사이 구간의 픽셀 개수입니다. + - `height_shift_range=2`인 경우 + 유효한 값은 정수형인 `[-1, 0, +1]`으로 + `height_shift_range=[-1, 0, +1]`와 동일한 반면, + `height_shift_range=1.0`인 경우 유효한 값은 + `[-1.0, +1.0)`의 구간 사이 부동소수점입니다. + +- __brightness_range__: 두 개의 부동소수점 값으로 이루어진 리스트 혹은 튜플. + 밝기 정도를 조절할 값의 범위입니다. + +- __shear_range__: `Float`. 층밀리기Shear의 강도입니다. + (도 단위의 반시계 방향 층밀리기 각도) + +- __zoom_range__: `Float` 혹은 [하한, 상한]. 임의 확대/축소의 범위입니다. + `Float`인 경우, `[하한, 상한] = [1-zoom_range, 1+zoom_range]`입니다. + +- __channel_shift_range__: `Float`. 채널의 임의 이동 범위입니다. + - __fill_mode__: {"constant", "nearest", "reflect" 혹은 "wrap"} 중 하나. - 디폴트 값은 'nearest'입니다. - 인풋 경계의 바깥 공간은 다음의 모드에 따라 - 다르게 채워집니다: - - 'constant': kkkkkkkk|abcd|kkkkkkkk (cval=k) - - 'nearest': aaaaaaaa|abcd|dddddddd - - 'reflect': abcddcba|abcd|dcbaabcd - - 'wrap': abcdabcd|abcd|abcdabcd -- __cval__: 부동소수점 혹은 정수. - `fill_mode = "constant"`인 경우 - 경계 밖 공간에 사용하는 값입니다. -- __horizontal_flip__: 불리언. 인풋을 무작위로 가로로 뒤집습니다. -- __vertical_flip__: 불리언. 인풋을 무작위로 세로로 뒤집습니다. -- __rescale__: 크기 재조절 인수. 디폴트 값은 None입니다. - None 혹은 0인 경우 크기 재조절이 적용되지 않고, - 그 외의 경우 (다른 변형을 전부 적용한 후에) - 데이터를 주어진 값으로 곱합니다. -- __preprocessing_function__: 각 인풋에 적용되는 함수. - 이미지가 크기 재조절되고 증강된 후에 함수가 작동합니다. - 이 함수는 다음과 같은 하나의 인수를 갖습니다: - 단일 이미지 (계수가 3인 Numpy 텐서), - 그리고 동일한 형태의 Numpy 텐서를 출력해야 합니다. + 기본값은 "nearest"입니다. + 입력 경계의 바깥 공간은 다음의 모드에 따라 다르게 채워집니다. + - 'constant': kkkkkkkk|abcd|kkkkkkkk (cval=k) +- 'nearest': aaaaaaaa|abcd|dddddddd + - 'reflect': abcddcba|abcd|dcbaabcd + - 'wrap': abcdabcd|abcd|abcdabcd + +- __cval__: `float` 혹은 `int`. + `fill_mode = "constant"`인 경우 + 경계 밖 공간에 사용하는 값입니다. + +- __horizontal_flip__: `Bool`. 입력값을 무작위로 가로로 뒤집습니다. + +- __vertical_flip__: `Bool`. 입력값을 무작위로 세로로 뒤집습니다. + +- __rescale__: 크기 재조절 인수. 기본값은 None입니다. + None 혹은 0인 경우 크기 재조절이 적용되지 않습니다, + 그 외의 값이 존재하는 경우, 변형을 적용한 후 값을 데이터와 곱합니다. + +- __preprocessing_function__: 각 입력에 적용되는 함수. + 이미지의 크기가 재조절되고 증강된 후에 함수가 작동합니다. + 이 함수는 단일 이미지 (랭크가 3인 Numpy 텐서) 인수를 갖습니다. + 그리고 단일 이미지와 동일한 형태의 Numpy 텐서를 출력해야 합니다. + - __data_format__: 이미지 데이터 형식, - "channels_first" 혹은 "channels_last"가 사용가능합니다. - "channels_last" 모드는 이미지의 형태가 - `(샘플, 높이, 넓이, 채널)`이어야 함을, - "channels_first" 모드는 이미지의 형태가 - `(샘플, 채널, 높이, 넓이)`이어야 함을 의미합니다. - 디폴트 값은 `~/.keras/keras.json`에 위치한 value found in your - 케라스 구성 파일의 `image_data_format` 값으로 설정됩니다. - 따로 설정을 바꾸지 않았다면, "channels_last"가 초기값입니다. -- __validation_split__: 부동소수점. (엄격히 0과 1사이의 값으로) 검증의 용도로 남겨둘 - 남겨둘 이미지의 비율입니다. -- __interpolation_order__: int, order to use for the spline interpolation. Higher is slower + "channels_first" 혹은 "channels_last"가 사용가능합니다. + "channels_last" 모드는 이미지가 `(samples, height, width, channels)` 형태, + "channels_first" 모드는 이미지가 `(samples, channels, height, width)`형태임을 의미합니다. + 기본값은 `~/.keras/keras.json`에 위치한 + 케라스 구성 파일의 `image_data_format` 값으로 설정됩니다. + 따로 설정을 바꾸지 않았다면, "channels_last"가 기본값입니다. + +- __validation_split__: `Float` ( 0과 1사이의 값으로) .검증의 용도로 남겨둘 이미지의 비율입니다. + +- __interpolation_order__: `int`, 스플라인 보간법Spline interpolation을 사용하기 위한 순서입니다. 높을수록 느립니다. + - __dtype__: 생성된 배열에 사용할 자료형. + __예시__ -`.flow(x, y)`사용한 예시: +`.flow(x, y)`사용한 예시 ```python (x_train, y_train), (x_test, y_test) = cifar10.load_data() @@ -102,15 +120,15 @@ datagen = ImageDataGenerator( height_shift_range=0.2, horizontal_flip=True) -# 특성별 정규화에 필요한 수치를 계산합니다 -# (영위상 성분분석 백색화를 적용하는 경우, 표준편차, 평균, 그리고 주성분이 이에 해당합니다) +# 특성 단위로 정규화에 필요한 수치를 계산합니다 +# (ZCA 화이트닝을 적용하는 경우, 표준편차, 평균, 그리고 주성분이 이에 해당합니다) datagen.fit(x_train) # 실시간 데이터 증강을 사용해 배치에 대해서 모델을 학습합니다: model.fit_generator(datagen.flow(x_train, y_train, batch_size=32), steps_per_epoch=len(x_train) / 32, epochs=epochs) -# 다음은 보다 "수동"인 예시입니다 +# 아래는 위 내용를 좀더 풀어 쓴 예시입니다 for e in range(epochs): print('Epoch', e) batches = 0 @@ -118,11 +136,12 @@ for e in range(epochs): model.fit(x_batch, y_batch) batches += 1 if batches >= len(x_train) / 32: - # we need to break the loop by hand because - # the generator loops indefinitely + # 제너레이터의 루프가 무한히 돌아가기 때문에 + # 직접 루프를 끊어 주어야 합니다. break ``` -`.flow_from_directory(directory)`사용한 예시: + +`.flow_from_directory(directory)`사용한 예시 ```python train_datagen = ImageDataGenerator( @@ -153,7 +172,7 @@ model.fit_generator( validation_steps=800) ``` -이미지와 마스크를 함께 변형하는 예시. +이미지와 마스크를 함께 변형하는 예시 ```python # 동일한 인수로 두 인스턴스를 생성합니다 @@ -166,7 +185,7 @@ data_gen_args = dict(featurewise_center=True, image_datagen = ImageDataGenerator(**data_gen_args) mask_datagen = ImageDataGenerator(**data_gen_args) -# fit과 flow 메서드에 동일한 시드와 키워드 인수를 제공합니다 +# fit과 flow 메소드에 동일한 시드와 키워드 인수를 제공합니다 seed = 1 image_datagen.fit(images, augment=True, seed=seed) mask_datagen.fit(masks, augment=True, seed=seed) @@ -181,7 +200,7 @@ mask_generator = mask_datagen.flow_from_directory( class_mode=None, seed=seed) -# 생성기를 하나로 합쳐 이미지와 마스크를 만들어 냅니다 +# 제너레이터를 하나로 합쳐 이미지와 마스크를 만들어 냅니다 train_generator = zip(image_generator, mask_generator) model.fit_generator( @@ -190,11 +209,9 @@ model.fit_generator( epochs=50) ``` -Example of using ```.flow_from_dataframe(dataframe, directory, - x_col, y_col)```: + ```.flow_from_dataframe(dataframe, directoryx_col, y_col)``` 사용한 예시 ```python - train_df = pandas.read_csv("./train.csv") valid_df = pandas.read_csv("./valid.csv") train_datagen = ImageDataGenerator( @@ -227,300 +244,318 @@ model.fit_generator( validation_steps=800) ``` ---- -## ImageDataGenerator 메서드 +------ -### apply_transform +## 이미지 데이터 생성 방법ImageDataGenerator Method +### apply_transform ```python apply_transform(x, transform_parameters) ``` - -주어진 매개변수에 따라 이미지에 변형을 가합니다. +주어진 매개변수Parameters에 따라 이미지에 변형을 가합니다. __인수__ - __x__: 3D 텐서, 단일 이미지. -- __transform_parameters__: 문자열을 가진 딕셔너리 - 변형을 묘사하는 - 매개변수 쌍. - 현재는 딕셔너리에서 - 다음과 같은 매개변수가 사용됩니다: - - `'theta'`: 부동소수점. 도 단위의 회전 각도. - - `'tx'`: 부동소수점. x 방향으로의 이동. - - `'ty'`: 부동소수점. y 방향으로의 이동. - - `'shear'`: 부동소수점. 도 단위의 층밀리기 각도. - - `'zx'`: 부동소수점. x 방향으로의 줌. - - `'zy'`: 부동소수점. y 방향으로의 줌. - - `'flip_horizontal'`: 불리언. 가로 뒤집기. - - `'flip_vertical'`: 불리언. 세로 뒤집기. - - `'channel_shift_intencity'`: 부동소수점. 채널 이동 강도. - - `'brightness'`: 부동소수점. 밝기 이동 강도. +- __transform_parameters__: 문자열 딕셔너리, 어떤 변형을 할 지를 나타내는 매개변수 쌍. + 현재, 딕셔너리에서 다음과 같은 매개변수가 사용됩니다: + - `'theta'`: `Float`. 도Degrees 단위의 회전 각도. + + - `'tx'`: `Float`. x 방향으로의 이동Shift. + + - `'ty'`: `Float`. y 방향으로의 이동. + + - `'shear'`: `Float`. 도 단위의 층밀리기 각도. + + - `'zx'`: `Float`. x 방향으로의 확대/축소. + + - `'zy'`: `Float`. y 방향으로의 확대/축소. + + - `'flip_horizontal'`: `Bool`. 가로로 뒤집기. + + - `'flip_vertical'`: `Bool`. 세로로 뒤집기. + + - `'channel_shift_intencity'`: `Float`. 채널의 이동 정도. + + - `'brightness'`: `Float`. 밝기의 이동 강도. __반환값__ -인풋이 변형된 버전 (인풋과 동일한 형태). - ---- -### fit +* 입력값의 변형된 형태 (입력값과 동일한 형태). + +------ + +### fit ```python fit(x, augment=False, rounds=1, seed=None) ``` +표본 데이터를 데이터 제너레이터Data Generator에 학습시킵니다. -샘플 데이터에 데이터 생성기를 학습시킵니다. - -이는 샘플 데이터 배열을 기반으로 -데이터 의존적인 변형에 관련된 내적 데이터 통걔를 계산합니다. +이 함수는 표본 데이터 배열의 데이터-의존적Data-dependent 변형에 관련된 +내적 데이터 통계치를 계산합니다. `featurewise_center`, `featurewise_std_normalization`, -혹은 `zca_whitening`이 참으로 설정되어 있을 때만 필요합니다. +혹은 `zca_whitening`이 True로 설정되어 있을 때만 필요합니다. __인수__ -- __x__: 샘플 데이터. 계수가 4이어야 합니다. - 흑백 데이터의 경우 - 채널 축이 1의 값을 가져야 하며, - RGB 데이터의 경우 3, - RGBA 데이터의 경우, 그 값이 4가 되어야 합니다. -- __augment__: 불리언 (디폴트 값: 거짓). - 무작위로 증강된 샘플에 대해서 학습할지 여부. -- __rounds__: 정수 (디폴트 값: 1). - 데이터 증강을 사용하는 경우(`augment=True`), - 사용할 데이터에 몇 번이나 증강이 적용되는지에 대한 값입니다. -- __seed__: 정수 (디폴트 값: None). 난수 시드. - ---- -### flow +- __x__: 표본 데이터. 랭크가 4이어야 합니다. + 흑백Grayscale 데이터의 경우 채널이 1개가 되어야 하며, + RGB 데이터의 경우 채널 3개, + RGBA 데이터의 경우 채널 4개가 되어야 합니다. +- __augment__: `Bool` (기본값: False). + 무작위로 증강된 표본을 학습할지 여부. +- __rounds__: `Int` (기본값: 1). + 데이터 증강을 사용하는 경우(`augment=True`), + 사용할 데이터를 몇 번이나 증강 시킬지 횟수를 지정합니다. +- __seed__: `Int` (기본값: None). 난수 시드. + +------ +### flow ```python flow(x, y=None, batch_size=32, shuffle=True, sample_weight=None, seed=None, save_to_dir=None, save_prefix='', save_format='png', subset=None) ``` - -데이터와 라벨 배열을 받아 증강된 데이터의 배치를 생성합니다. +데이터와 레이블Lable 배열을 받아 증강된 데이터의 배치를 생성합니다. __인수__ -- __x__: 인풋 데이터. 계수 4의 numpy 배열 혹은 튜플. - 튜플인 경우 첫 번째 성분이 - 이미지를 담고 - 두 번때 성분이 어떤 수정도 없이 - 아웃풋에 전달되는 또 다른 numpy 배열 - 혹은 numpy 배열의 리스트를 담습니다. - 이미지와 함께 다양한 종류의 데이터를 모델에 - 전달할 때 사용할 수 있습니다. - 흑백 데이터의 경우 이미지 배열의 채널 축의 값이 - 1이어야 하며, - RGB 데이터의 경우 3, - RGBA 데이터의 경우 4의 값을 가져야 합니다. -- __y__: 라벨. -- __batch_size__: 정수 (디폴트 값: 32). -- __shuffle__: 불리언 (디폴트 값: 참). -- __sample_weight__: 샘플 가중치. -- __seed__: 정수 (디폴트 값: None). -- __save_to_dir__: None 혹은 문자열 (디폴트 값: None). - 이는 디렉토리를 선택적으로 지정해서 - 생성된 증강 사진을 저장할 수 있도록 합니다. - (현재 작업을 시각화하는데 유용합니다). -- __save_prefix__: 문자열 (기본값: `''`). - 저장된 사진의 파일이름에 사용할 접두부호 - (`save_to_dir`이 지정된 경우에만 유의미합니다). +- __x__: 입력 데이터. 랭크 4의 NumPy 배열 혹은 튜플. + 튜플인 경우 첫 번째 원소는 이미지를 담고 + 두 번때 원소는 수정 없이 출력으로 전달되는 NumPy 배열의 리스트 + 혹은 NumPy 배열의 리스트를 담습니다. + 이미지와 함께 다양한 종류의 데이터를 모델에 전달할 때 사용할 수 있습니다. + 흑백 데이터의 경우 이미지 배열의 채널이 1이어야 하며, + RGB 데이터의 경우 채널이 3, RGBA 데이터의 경우 채널이 4 이여야 합니다. + +- __y__: 레이블. + +- __batch_size__: `Int` (기본값: 32). + +- __shuffle__: `Bool` (기본값: True). + +- __sample_weight__: 표본 가중치. + +- __seed__: `Int` (기본값: None). + +- __save_to_dir__: None 혹은 `str` (기본값: None). + 디렉토리를 직접 지정하여 생성되고 있는 증강 사진을 + 저장할 수 있도록 합니다. + (현재 작업을 시각화하는데 유용합니다). + +- __save_prefix__: `str` (기본값: `''`). + 저장된 사진의 파일 이름에 사용할 접두사 + (`save_to_dir`이 지정된 경우에만 유효합니다). + - __save_format__: "png"나 "jpeg" 중 하나 - (`save_to_dir`이 지정된 경우에만 유의미합니다). 디폴트 값: "png". -- __subset__: `ImageDataGenerator`에 `validation_split`이 설정된 경우 - 데이터의 부분세트 (`"training"` or `"validation"`). + (`save_to_dir`이 지정된 경우에만 유효합니다). 기본값: "png". + +- __subset__: `ImageDataGenerator`에서 `validation_split`이 설정된 경우 + subset의 입력으로 `"training"` 혹은 `"validation"` 을 사용할 수 있습니다. __반환값__ -`(x, y)` 튜플을 만들어내는 `Iterator` - 여기서 `x`는 이미지 데이터로 구성된 - (단일 이미지 인풋의 경우) numpy 배열 혹은 - (추가적 인풋이 존재하는 경우) numpy 배열의 리스트이고 - `y`는 그에 대응하는 라벨로 이루어진 - numpy 배열입니다. 'sample_weight'이 None이 아니라면, +* `(x, y)` 튜플을 만들어내는 `Iterator` + 여기서 `x`는 하나의 이미지 데이터를 받는 경우 Numpy 배열이며 + 여러 개의 이미지 데이터를 받는 경우 NumPy 배열의 리스트입니다. + `y`는 `x`에 대응되는 레이블로 이루어진 Numpy 배열입니다. + 'sample_weight'이 None이 아니라면, 생성된 튜플은 `(x, y, sample_weight)`의 형태를 갖습니다. - `y`가 None인 경우, numpy 배열 `x`만 반환됩니다. - ---- -### flow_from_dataframe + `y`가 None인 경우, NumPy 배열 `x`만 반환됩니다. + +------ +### flow_from_dataframe ```python -flow_from_dataframe(dataframe, directory=None, x_col='filename', y_col='class', weight_col=None, target_size=(256, 256), color_mode='rgb', classes=None, class_mode='categorical', batch_size=32, shuffle=True, seed=None, save_to_dir=None, save_prefix='', save_format='png', subset=None, interpolation='nearest', validate_filenames=True) +flow_from_dataframe(dataframe, directory=None, x_col='filename', y_col='class', weight_col = None, target_size=(256, 256), color_mode='rgb', classes=None, class_mode='categorical', batch_size=32, shuffle=True, seed=None, save_to_dir=None, save_prefix='', save_format='png', subset=None, interpolation='nearest', validate_filenames=True) ``` - -dataframe과 디렉토리의 위치를 전달받아 증강/정규화된 데이터의 배치를 생성합니다. +데이터프레임과 디렉토리의 위치를 전달받아 증강/정규화normalize된 데이터 배치를 +생성합니다. **간단한 튜토리얼은** [여기](http://bit.ly/keras_flow_from_dataframe)**에서 확인하실 수 있습니다.** - __인수__ -- __dataframe__: Pandas dataframe containing the filepaths relative to 'directory' (or absolute paths if `directory` is None) of the images in a string column. It should include other column/s depending on the `class_mode`: - - if `class_mode` is `"categorical"` (default value) it must include the `y_col` column with the - class/es of each image. Values in column can be string/list/tuple if a single class or list/tuple - if multiple classes. - - if 'class_mode' is '"binary"' or '"sparse"' it must include the given 'y_col' column with class - values as strings. - - if 'class_mode' is is `"raw"` or `"multi_output"` it should contain the columns specified in - 'y_col'. - - if 'class_mode' is '"input"' or 'None' no extra column is needed. -- __directory__: string, path to the directory to read images from. If 'None', data in 'x_col' column should be absolute paths. -- __x_col__: string, column in 'dataframe' that contains the filenames (or absolute paths if 'directory' is 'None'). -- __y_col__: string or list, column/s in dataframe that has the target data. -- __weight_col__: string, column in `dataframe` that contains the sample weights. Default: `None`. -- __target_size__: 정수의 튜플 `(높이, 넓이)`, 디폴트 값: `(256, 256)`. 모든 이미지의 크기를 재조정할 치수. -- __color_mode__: "grayscale", "rbg", "rgba" 중 하나. 디폴트 값: "rgb". 이미지가 1개 혹은 3개의 색깔 채널을 갖도록 변환할지 여부. -- __classes__: 클래스로 이루어진 선택적 리스트 (예. `['dogs', 'cats']`). 디폴트 값: None. 특별히 값을 지정하지 않으면, 클래스로 이루어진 리스트가 `y_col`에서 자동으로 유추됩니다. (이는 영숫자순으로 라벨 색인에 대응됩니다). `class_indices` 속성을 통해서 클래스 이름과 클래스 색인 간 매핑을 담은 딕셔너리를 얻을 수 있습니다. -- __class_mode__: "binary", "categorical", "input", "multi_output", "raw", "sparse" 혹은 None 중 하나. 디폴트 값: "categorical". - Mode for yielding the targets: - - `"binary"`: 1D numpy array of binary labels, - - `"categorical"`: 2D numpy array of one-hot encoded labels. Supports multi-label output. - - `"input"`: images identical to input images (mainly used to work with autoencoders), - - `"multi_output"`: list with the values of the different columns, - - `"raw"`: numpy array of values in `y_col` column(s), - - `"sparse"`: 1D numpy array of integer labels, - - `None`, no targets are returned (the generator will only yield batches of image data, which is useful to use in `model.predict_generator()`). -- __batch_size__: 데이터 배치의 크기 (디폴트 값: 32). -- __shuffle__: 데이터를 뒤섞을지 여부 (디폴트 값: 참) -- __seed__: 데이터 셔플링과 변형에 사용할 선택적 난수 시드. -- __save_to_dir__: None 혹은 문자열 (디폴트 값: None).이는 디렉토리를 선택적으로 지정해서 - 생성된 증강 사진을 저장할 수 있도록 해줍니다. (현재 작업을 시각화하는데 유용합니다). -- __save_prefix__: 문자열. 저장된 사진의 파일 이름에 사용할 접두부호 (`save_to_dir`이 설정된 경우에만 유의미합니다). -- __save_format__: "png"와 "jpeg" 중 하나 (`save_to_dir`이 설정된 경우에만 유의미합니다). 디폴트 값: "png". -- __follow_links__: 클래스 하위 디렉토리 내 심볼릭 링크를 따라갈지 여부 (디폴트 값: 거짓). -- __subset__: `ImageDataGenerator`에 `validation_split`이 설정된 경우 데이터의 부분집합 (`"training"` or `"validation"`). -- __interpolation__: Interpolation method used to resample the image if the target size is different from that of the loaded image. 지원되는 메서드로는 `"nearest"`, `"bilinear"`, 그리고 `"bicubic"`이 있습니다. -PIL 버전 1.1.3 이상이 설치된 경우, `"lanczos"`도 지원됩니다. PIL 버전 3.4.0 이상이 설치된 경우, `"box"`와 `"hamming"` 또한 지원됩니다. 디폴트 값으로 `"nearest"`가 사용됩니다. -- __validate_filenames__: Boolean, whether to validate image filenames in `x_col`. If `True`, invalid images will be ignored. Disabling this option can lead to speed-up in the execution of this function. Default: `True`. +- __dataframe__: 문자열 칼럼Column 이미지의 `directory` 상대 경로를 포함한 Pandas 데이터 프레임, `directory`가 없는 경우 절대 경로를 포함하는 Pandas 데이터 프레임. + + +`class_mode`에 따라 다양한 형태의 칼럼을 가집니다. + +- `class_mode`가 `"categorical"`(기본값) 인 경우 각 이미지의 클레스(들)은 `y_col`을 포함해야 합니다. + + 이때, 단일 클레스일 경우, 문자열/리스트/튜플 + 다수 클레스일 경우, 리스트/튜플이 칼럼의 값이 될 수 있습니다. + +- `class_mode` 가 `"binary"` 또는 `"sparse"`인 경우 클레스 값은 `string` 형태의 `y_col`을 포함해야 합니다. + +- `class_mode` 가 `"raw"` 또는 `"multi_output"`인 경우 `y_col` 가 지정된 칼럼을 포함해야 합니다. + +- `class_mode` 가 `"input"` 또는 `None` 인 경우 추가 칼럼이 필요하지 않습니다. + +- __directory__: `string`, 이미지를 읽어오기 위한 디렉토리 경로. `None` 인 경우 'x_col' 칼럼의 데이터는 절대 경로로 지정되어 있어야 한다. + +- __x_col__: `string`, 파일 이름들을 (또는 디렉토리가 `None`인 경우 절대 경로를) 포함하는 `dataframe`의 칼럼 + +- __y_col__: `string` 또는 `list`, 목푯값 데이터를 가지고 있는 `dataframe`의 칼럼(들) + +- __weight_col__: `string`, 표본의 가중치를 포함하고 있는 `dataframe`의 칼럼. 기본값 : `None` + +- __target_size__: 정수 튜플 `(높이, 넓이)`, 기본값: `(256, 256)`. 모든 이미지의 크기를 재조정하는 치수. + +- __color_mode__: "grayscale", "rbg", "rgba" 중 하나. 기본값: "rgb". 이미지가 1개 혹은 3개의 색깔 채널을 갖도록 변환할 지 여부. + +- __classes__: 클래스값을 지정할 수있는 클래스 리스트 (예. `['dogs', 'cats']`). + + 기본값: `None`. 특별히 값을 지정하지 않으면, 영숫자로 순서로 `y_col`의 레이블 인덱스에 매핑Map되는 클래스 리스트를 자동으로 유추할 것이다. + `class_indices` 속성을 통해서 클래스 이름과 클래스 인덱스 간 매핑을 담은 딕셔너리를 얻을 수 있다. + +- __class_mode__: "binary", "categorical", "input", "multi_output", "raw", "sparse" 혹은 `None` 중 하나. 기본값: "categorical". + 생성할 수 있는 목푯값(들)의 형태는 다음과 같다. + + - `"binary"`: 이진 레이블의 1D NumPy 배열, + - `"categorical"`: 원-핫 인코딩One-hot encode의 2D NumPy 배열. 다중 레이블 출력값을 지원한다, + - `"input"`: 입력 이미지와 동일한 이미지(주로 오토인코더Autoencoder에서 사용된다.), + - `"multi_output"`: 여러 칼럼의 값들을 가지고 있는 리스트, + - `"raw"`: `y_col`칼럼(들) 값들의 NumPy 배열, + - `"sparse"`: 정수 레이블의 1D NumPy 배열, + - `None`, 목푯값들이 반환되지 않습니다.(제너레이터는 `model.predict_generator()`에서 사용하는 데 유용한 이미지 데이터의 배치들만 만들어 낸다.) + +- __batch_size__: 데이터 배치의 크기 (기본값: 32). + +- __shuffle__: 데이터를 뒤섞을지 여부 (기본값: True) + +- __seed__: 데이터 셔플링Shuffling과 변형시에 사용되는 직접 지정 할 수 있는 난수 시드. + +- __save_to_dir__: `None` 혹은 `str` (기본값: None). + 생성된 증강 사진을 특정한 디렉토리에서 저장할 수 있게 해줍니다. 이는 현재 작업을 시각화하는데 유용합니다. + +- __save_prefix__: `str`. 저장된 사진의 파일 이름에 사용할 접두부호Prefix (`save_to_dir`가 설정된 경우에만 해당됩니다). + +- __save_format__: "png"와 "jpeg" 중 하나 (`save_to_dir`가 설정된 경우에만 해당됩니다). 기본값: "png". + +- __follow_links__: 클래스 하위 디렉토리 내 심볼릭 링크 Symlink를 따라갈지 여부 (기본값: False). + +- __subset__: `ImageDataGenerator`에서 `validation_split`이 설정된 경우 + subset의 입력으로 `"training"` 혹은 `"validation"` 을 사용할 수 있습니다. + +- __interpolation__: 보간 방법은 불러온 이미지가 목푯값 크기와 다르면 이미지를 다시 추출할 때 사용하는 방법입니다. +지원되는 메소드로는 `"nearest"`, `"bilinear"`, 그리고 `"bicubic"`이 있습니다. + PIL 버전 1.1.3 이상이 설치된 경우, `"lanczos"`도 지원됩니다. PIL 버전 3.4.0 이상이 설치된 경우, `"box"`와 `"hamming"` 또한 지원됩니다. 기본값으로 `"nearest"`가 사용됩니다. + +- __validate_filenames__: `Bool`, `x_col`의 이미지 파일 이름 검증할 지 여부, `True`면 유효하지 않은 이미지들은 무시될 것입니다. 이 옵션을 비활성화하면 flow_from_dataframe의 실행 속도가 빨라집니다. +기본값: True + __반환값__ -`(x, y)` 튜플을 만들어내는 A `DataFrameIterator` 여기서 `x`는 `(배치 크기, *표적 크기, 채널)` 형태의 -이미지 배치로 구성된 numpy 배열이고 `y`는 그에 상응하는 라벨로 이루어진 numpy 배열입니다. - ---- -### flow_from_directory +* `(x, y)` 튜플을 만들어내는 `DataFrameIterator`에서 `x`는 `(batch_size, *target_size, channels)` 형태의 이미지 배치로 구성된 NumPy 배열이고 `y`는 `x`에 대응되는 레이블로 이루어진 NumPy 배열입니다. + +------ + +### flow_from_directory ```python flow_from_directory(directory, target_size=(256, 256), color_mode='rgb', classes=None, class_mode='categorical', batch_size=32, shuffle=True, seed=None, save_to_dir=None, save_prefix='', save_format='png', follow_links=False, subset=None, interpolation='nearest') ``` - -디렉토리에의 경로를 전달받아 증강된 데이터의 배치를 생성합니다. +디렉토리의 경로를 전달받아 증강된 데이터의 배치를 생성합니다. __인수__ -- __directory__: string, 표적 디렉토리에의 경로. - 반드시 한 클래스 당 하나의 하위 디렉토리가 있어야 합니다. - 각 하위 디렉토리 내에 위치한 - 어떤 PNG, JPG, BMP, PPM 혹은 TIF 이미지도 - 생성자에 포함됩니다. - 세부사항은 [이 스크립트]( - https://gist.github.com/fchollet/0830affa1f7f19fd47b06d4cf89ed44d) - 를 참조하십시오. -- __target_size__: 정수 튜플 `(높이, 넓이)`, - 디폴트 값: `(256, 256)`. - 모든 이미지의 크기를 재조정할 치수. -- __color_mode__: "grayscale", "rbg", "rgba" 중 하나. 디폴트 값: "rgb". - 변환될 이미지가 - 1개, 3개, 혹은 4개의 채널을 가질지 여부. -- __classes__: 클래스 하위 디렉토리의 선택적 리스트 - (예. `['dogs', 'cats']`). 디폴트 값: None. - 특별히 값을 지정하지 않으면, 각 하위 디렉토리를 각기 다른 클래스로 - 대하는 방식으로 클래스의 리스트가 - `directory` 내 하위 디렉토리의 이름/구조에서 - 자동으로 유추됩니다 - (그리고 라벨 색인에 대응되는 클래스의 순서는 - 영숫자 순서를 따릅니다). - `class_indices` 속성을 통해서 클래스 이름과 클래스 색인 간 - 매핑을 담은 딕셔너리를 얻을 수 있습니다. +- __directory__: `string`, 목표 디렉토리의 경로. + 반드시 한 클래스 당 하나의 하위 디렉토리가 있어야 합니다. + 각 하위 디렉토리 구조 내에 있는 PNG, JPG, BMP, PPM 혹은 TIF 이미지가 + 제너레이터에 포함됩니다. + 세부사항은 [이 스크립트]( + https://gist.github.com/fchollet/0830affa1f7f19fd47b06d4cf89ed44d)를 참조하십시오. +- __target_size__: 정수 튜플 ,`(높이, 넓이)`, + 기본값: `(256, 256)`. + 모든 이미지의 크기를 재조정 할 때 치수. +- __color_mode__: "grayscale", "rbg", "rgba" 중 하나. 기본값: `"rgb"`. + 변환될 이미지가 1개, 3개, 혹은 4개의 채널을 가질지 여부. +- __classes__: 클래스 값을 지정할 수 있는 클래스 하위 디렉토리 + (예. `['dogs', 'cats']`). 기본값: `None`. + 값을 지정하지 않으면, 클래스의 리스트는 `directory` 의 하위 디렉토리의 이름/구조에서 자동으로 추론 되며, 각 하위 디렉토리는 다른 클래스로 취급됩니다. + (그리고 레이블 인덱스에 매핑되는 클래스의 순서는 영숫자 순서를 따릅니다). + `class_indices` 속성을 통해서 클래스 이름에서 클래스 인덱스로 + 매핑된 딕셔너리를 얻을 수 있습니다. - __class_mode__: "categorical", "binary", "sparse", - "input", 혹은 None 중 하나. 디폴트 값: "categorical". - 반환될 라벨 배열의 종류를 결정합니다: - - "categorical"은 2D형태의 원-핫 인코딩된 라벨입니다, - - "binary"는 1D 형태의 이진 라벨입니다, - "sparse"는 1D 형태의 정수 라벨입니다, - - "input"은 인풋 이미지와 - 동일한 이미지입니다 (주로 자동 인코더와 함께 사용합니다). - - None의 경우, 어떤 라벨되 반환되지 않습니다 - (생성자가 이미지 데이터의 배치만 만들기 때문에, - `model.predict_generator()`을 사용하는 것이 유용합니다). - class_mode가 None일 경우, - 제대로 작동하려면 데이터가 `directory` 내 하위 디렉토리에 - 위치해야 한다는 점을 유의하십시오. -- __batch_size__: 데이터 배치의 크기 (디폴트 값: 32). -- __shuffle__: 데이터를 뒤섞을지 여부 (디폴트 값: 참) - If set to False, sorts the data in alphanumeric order. -- __seed__: 데이터 셔플링과 변형에 사용할 선택적 난수 시드. -- __save_to_dir__: None 혹은 문자열 (디폴트 값: None). - 이는 디렉토리를 선택적으로 지정해서 - 생성된 증강 사진을 - 저장할 수 있도록 해줍니다 - (현재 작업을 시각화하는데 유용합니다). -- __save_prefix__: 문자열. 저장된 사진의 파일 이름에 사용할 접두부호 - (`save_to_dir`이 설정된 경우에만 유의미합니다). + "input", 혹은 None 중 하나. 기본값: "categorical". + 반환될 레이블 배열의 종류를 결정합니다: + + - `"categorical"`은 2D형태의 원-핫 인코딩된 레이블입니다, + - `"binary"`는 1D 형태의 이진 레이블입니다, + `"sparse"`는 1D 형태의 정수 레이블입니다, + - `"input"`은 입력 이미지와 + 동일한 이미지입니다 (주로 오토인코더와 함께 사용합니다). + - `None`의 경우, 어떤 레이블도 반환되지 않습니다 + (제너레이터가 이미지 데이터의 배치만 만들기 때문에, + `model.predict_generator()`을 사용하는 것이 유용합니다). + class_mode가 `None`일 경우, + 데이터가 `directory` 내 하위 디렉토리에 위치해야 제대로 작동한다는 점을 유의하십시오. +- __batch_size__: 데이터 배치의 크기 (기본값: 32). +- __shuffle__: 데이터를 뒤섞을지 여부 (기본값: True) + `False`로 설정이 된다면, 데이터는 영숫자 순서를 따를 것입니다. +- __seed__: 데이터 셔플링과 변형시에 사용되는 선택적 난수 시드. +- __save_to_dir__: `None` 혹은 `str` (디폴트 값: None). + 생성된 증강 사진을 특정한 디렉토리에서 저장할 수 있게 해줍니다. (현재 작업을 시각화하는데 유용합니다). +- __save_prefix__: `str`. 저장된 사진의 파일 이름에 사용할 접두부호 + (`save_to_dir`이 설정된 경우에만 해당됩니다.). - __save_format__: "png"와 "jpeg" 중 하나 - (`save_to_dir`이 설정된 경우에만 유의미합니다). 디폴트 값: "png". + (`save_to_dir`이 설정된 경우에만 해당됩니다). 기본값: "png". - __follow_links__: 클래스 하위 디렉토리 내 심볼릭 링크를 - 따라갈지 여부 (디폴트 값: 거짓). -- __subset__: `ImageDataGenerator`에 `validation_split`이 설정된 경우 - 데이터의 부분집합 (`"training"` or `"validation"`). -- __interpolation__: 로드된 이미지의 크기와 - 표적 크기가 다른 경우 - 이미지를 다시 샘플링하는 보간법 메서드. - 지원되는 메서드로는 `"nearest"`, `"bilinear"`, - 그리고 `"bicubic"`이 있습니다. - PIL 버전 1.1.3 이상이 설치된 경우 `"lanczos"`도 - 지원됩니다. PIL 버전 3.4.0 이상이 설치된 경우는, - `"box"`와 `"hamming"` 또한 지원됩니다. - 디폴트 값으로 `"nearest"`가 사용됩니다. + 따라갈지 여부 (기본값: False). +- __subset__: `ImageDataGenerator`에서 `validation_split`이 설정된 경우 + subset의 입력으로 `"training"` 혹은 `"validation"` 을 사용할 수 있습니다. +- __interpolation__: 보간 방법은 불러온 이미지가 목푯값 크기와 다르면 이미지를 다시 추출할 때 사용하는 방법입니다. 지원되는 메소드로는 `"nearest"`, `"bilinear"`, 그리고 `"bicubic"`이 있습니다. PIL 버전 1.1.3 이상이 설치된 경우 `"lanczos"`도 지원됩니다. PIL 버전 3.4.0 이상이 설치된 경우는,`"box"`와 `"hamming"` 또한 지원됩니다. 기본값으로 `"nearest"`가 사용됩니다. + __반환값__ -`(x, y)` 튜플을 만들어내는 `DirectoryIterator` - 여기서 `x`는 `(배치 크기, *표적 크기, 채널)`의 형태의 - 이미지 배치로 구성된 numpy 배열이고 - `y`는 그에 대응하는 라벨로 이루어진 numpy 배열입니다. - ---- -### get_random_transform +* `(x, y)` 튜플을 만들어내는 `DirectoryIterator` + 여기서 `x`는 `(batch_size, *target_size, channels)`의 형태의 + 이미지 배치로 구성된 NumPy 배열이고 `y`는 그에 대응하는 레이블로 이루어진 NumPy 배열입니다. + +------ + +### get_random_transform ```python get_random_transform(img_shape, seed=None) ``` - -변형에 대한 무작위 매개변수를 생성합니다. +변형하기 위한 무작위 매개변수를 생성합니다. __인수__ - __seed__: 난수 시드. + - __img_shape__: 정수 튜플. - 변형할 이미지의 형태입니다. + 변형할 이미지의 형태입니다. __반환값__ -변형을 묘사하는 무작위 선정된 매개변수를 포함한 -딕셔너리. - ---- -### random_transform +* 변형을 위해 무작위로 선택된 매개변수를 포함한 딕셔너리. +------ + +### random_transform ```python random_transform(x, seed=None) ``` - 이미지에 무작위 변형을 적용합니다. __인수__ @@ -530,28 +565,28 @@ __인수__ __반환값__ -인풋이 무작위로 변형된 버전 (인풋과 동일한 형태 유지). - ---- -### standardize +* 입력이 무작위로 변형된 형태 (입력과 동일한 형태) + +------ +### standardize ```python standardize(x) ``` +입력의 배치에 표준화를 적용합니다. -인풋의 배치에 정규화 구성을 적용합니다. - -`x` is changed in-place since the function is mainly used internally to standarize images and feed them to your network. If a copy of `x` would be created instead it would have a significant performance cost. If you want to apply this method without changing the input in-place you can call the method creating a copy before: +`X` 는 주로 내부에서 이미지를 표준화Standardize하고 네트워크에 공급하기 위해 사용되기 때문에 인플레이스In-place 방식으로 변경됩니다. `x`를 복사해 만든다면 성능 비용이 클 것입니다. +입력 내용을 인플레이스 방식으로 변경하지 않고 이 방법을 그대로 사용하기 위해선 먼저 복사본을 생성하세요 standarize(np.copy(x)) __인수__ -- __x__: 정규화할 인풋의 배치. +​ __x__: 표준화할 입력의 배치. __반환값__ -정규화된 인풋. - +​ 표준화된 입력값. + From ced5f4055dd39dc26b5370becc6640c3bf0f725b Mon Sep 17 00:00:00 2001 From: wonsang you <45346964+Uwonsang@users.noreply.github.com> Date: Sun, 13 Oct 2019 15:35:44 +0900 Subject: [PATCH 2/3] Retranslate_image MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit augment 인수 -> 인자 --- sources/preprocessing/image.md | 24 ++++++++++++------------ 1 file changed, 12 insertions(+), 12 deletions(-) diff --git a/sources/preprocessing/image.md b/sources/preprocessing/image.md index cf11db60..dd34d73a 100644 --- a/sources/preprocessing/image.md +++ b/sources/preprocessing/image.md @@ -11,7 +11,7 @@ keras.preprocessing.image.ImageDataGenerator(featurewise_center=False, samplewis 실시간 데이터 증강Data augmentation을 이용하여 텐서 이미지 데이터의 배치들을 생성합니다. 데이터가 배치 단위로 루프Loop를 순환합니다. -__인수__ +__인자__ - __featurewise_center__: `Bool`. 데이터셋의 특성 단위 Feature-wise로 입력 값의 평균이 0이 되도록 합니다. @@ -85,7 +85,7 @@ __인수__ - __preprocessing_function__: 각 입력에 적용되는 함수. 이미지의 크기가 재조절되고 증강된 후에 함수가 작동합니다. - 이 함수는 단일 이미지 (랭크가 3인 Numpy 텐서) 인수를 갖습니다. + 이 함수는 단일 이미지 (랭크가 3인 Numpy 텐서) 인자를 갖습니다. 그리고 단일 이미지와 동일한 형태의 Numpy 텐서를 출력해야 합니다. - __data_format__: 이미지 데이터 형식, @@ -175,7 +175,7 @@ model.fit_generator( 이미지와 마스크를 함께 변형하는 예시 ```python -# 동일한 인수로 두 인스턴스를 생성합니다 +# 동일한 인자로 두 인스턴스를 생성합니다 data_gen_args = dict(featurewise_center=True, featurewise_std_normalization=True, rotation_range=90, @@ -185,7 +185,7 @@ data_gen_args = dict(featurewise_center=True, image_datagen = ImageDataGenerator(**data_gen_args) mask_datagen = ImageDataGenerator(**data_gen_args) -# fit과 flow 메소드에 동일한 시드와 키워드 인수를 제공합니다 +# fit과 flow 메소드에 동일한 시드와 키워드 인자를 제공합니다 seed = 1 image_datagen.fit(images, augment=True, seed=seed) mask_datagen.fit(masks, augment=True, seed=seed) @@ -256,7 +256,7 @@ apply_transform(x, transform_parameters) 주어진 매개변수Parameters에 따라 이미지에 변형을 가합니다. -__인수__ +__인자__ - __x__: 3D 텐서, 단일 이미지. - __transform_parameters__: 문자열 딕셔너리, 어떤 변형을 할 지를 나타내는 매개변수 쌍. @@ -302,7 +302,7 @@ fit(x, augment=False, rounds=1, seed=None) `featurewise_center`, `featurewise_std_normalization`, 혹은 `zca_whitening`이 True로 설정되어 있을 때만 필요합니다. -__인수__ +__인자__ - __x__: 표본 데이터. 랭크가 4이어야 합니다. 흑백Grayscale 데이터의 경우 채널이 1개가 되어야 하며, @@ -325,7 +325,7 @@ flow(x, y=None, batch_size=32, shuffle=True, sample_weight=None, seed=None, save 데이터와 레이블Lable 배열을 받아 증강된 데이터의 배치를 생성합니다. -__인수__ +__인자__ - __x__: 입력 데이터. 랭크 4의 NumPy 배열 혹은 튜플. 튜플인 경우 첫 번째 원소는 이미지를 담고 @@ -383,7 +383,7 @@ flow_from_dataframe(dataframe, directory=None, x_col='filename', y_col='class', **간단한 튜토리얼은** [여기](http://bit.ly/keras_flow_from_dataframe)**에서 확인하실 수 있습니다.** -__인수__ +__인자__ - __dataframe__: 문자열 칼럼Column 이미지의 `directory` 상대 경로를 포함한 Pandas 데이터 프레임, `directory`가 없는 경우 절대 경로를 포함하는 Pandas 데이터 프레임. @@ -470,7 +470,7 @@ flow_from_directory(directory, target_size=(256, 256), color_mode='rgb', classes 디렉토리의 경로를 전달받아 증강된 데이터의 배치를 생성합니다. -__인수__ +__인자__ - __directory__: `string`, 목표 디렉토리의 경로. 반드시 한 클래스 당 하나의 하위 디렉토리가 있어야 합니다. @@ -537,7 +537,7 @@ get_random_transform(img_shape, seed=None) 변형하기 위한 무작위 매개변수를 생성합니다. -__인수__ +__인자__ - __seed__: 난수 시드. @@ -558,7 +558,7 @@ random_transform(x, seed=None) 이미지에 무작위 변형을 적용합니다. -__인수__ +__인자__ - __x__: 3D 텐서, 단일 이미지. - __seed__: 난수 시드. @@ -582,7 +582,7 @@ standardize(x) standarize(np.copy(x)) -__인수__ +__인자__ ​ __x__: 표준화할 입력의 배치. From 01b2a92f88c7254352979cebbcf72cfb59d76d7d Mon Sep 17 00:00:00 2001 From: wonsang you <45346964+Uwonsang@users.noreply.github.com> Date: Tue, 15 Oct 2019 11:07:59 +0900 Subject: [PATCH 3/3] Retranslate_image_v3 MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 아래첨자 소문자로 수정하였습니다. --- sources/preprocessing/image.md | 44 +++++++++++++++++----------------- 1 file changed, 22 insertions(+), 22 deletions(-) diff --git a/sources/preprocessing/image.md b/sources/preprocessing/image.md index dd34d73a..8af4824c 100644 --- a/sources/preprocessing/image.md +++ b/sources/preprocessing/image.md @@ -8,14 +8,14 @@ keras.preprocessing.image.ImageDataGenerator(featurewise_center=False, samplewise_center=False, featurewise_std_normalization=False, samplewise_std_normalization=False, zca_whitening=False, zca_epsilon=1e-06, rotation_range=0, width_shift_range=0.0, height_shift_range=0.0, brightness_range=None, shear_range=0.0, zoom_range=0.0, channel_shift_range=0.0, fill_mode='nearest', cval=0.0, horizontal_flip=False, vertical_flip=False, rescale=None, preprocessing_function=None, data_format='channels_last', validation_split=0.0, interpolation_order=1, dtype='float32') ``` -실시간 데이터 증강Data augmentation을 이용하여 텐서 이미지 데이터의 배치들을 생성합니다. -데이터가 배치 단위로 루프Loop를 순환합니다. +실시간 데이터 증강data augmentation을 이용하여 텐서 이미지 데이터의 배치들을 생성합니다. +데이터가 배치 단위로 루프loop를 순환합니다. __인자__ -- __featurewise_center__: `Bool`. 데이터셋의 특성 단위 Feature-wise로 입력 값의 평균이 0이 되도록 합니다. +- __featurewise_center__: `Bool`. 데이터셋의 특성 단위 feature-wise로 입력 값의 평균이 0이 되도록 합니다. -- __samplewise_center__: `Bool`. 각 표본Sample의 평균이 0이 되도록 합니다. +- __samplewise_center__: `Bool`. 각 표본sample의 평균이 0이 되도록 합니다. - __featurewise_std_normalization__: `Bool`. 입력 값을 데이터셋의 특성 단위로 구한 표준편차로 나눕니다. @@ -24,14 +24,14 @@ __인자__ - __zca_whitening__: `Bool`. ZCA 화이트닝ZCA whitening를 적용할지 여부입니다. -- __zca_epsilon__: ZCA 화이트닝의 엡실론Epsilon 값. 기본값Defalut은 1e-6입니다. +- __zca_epsilon__: ZCA 화이트닝의 엡실론Epsilon 값. 기본값defalut은 1e-6입니다. -- __rotation_range__: `Int`. 임의 회전의 각도Degree 범위입니다. +- __rotation_range__: `Int`. 임의 회전의 각도degree 범위입니다. - __width_shift_range__: `Float`, `1-D array-like` 혹은 `Int` - `Float`: < 1인 경우 전체 가로넓이의 비율, >= 1인 경우 픽셀의 개수입니다. - - `1-D array-like`: 배열Array에서 가져온 임의 요소Element입니다. + - `1-D array-like`: 배열array에서 가져온 임의 요소element입니다. - `Int`: `(-width_shift_range, +width_shift_range)` 사이 구간의 픽셀 개수입니다. - `width_shift_range=2`인 경우 유효값은 @@ -55,7 +55,7 @@ __인자__ - __brightness_range__: 두 개의 부동소수점 값으로 이루어진 리스트 혹은 튜플. 밝기 정도를 조절할 값의 범위입니다. -- __shear_range__: `Float`. 층밀리기Shear의 강도입니다. +- __shear_range__: `Float`. 층밀리기shear의 강도입니다. (도 단위의 반시계 방향 층밀리기 각도) - __zoom_range__: `Float` 혹은 [하한, 상한]. 임의 확대/축소의 범위입니다. @@ -98,7 +98,7 @@ __인자__ - __validation_split__: `Float` ( 0과 1사이의 값으로) .검증의 용도로 남겨둘 이미지의 비율입니다. -- __interpolation_order__: `int`, 스플라인 보간법Spline interpolation을 사용하기 위한 순서입니다. 높을수록 느립니다. +- __interpolation_order__: `int`, 스플라인 보간법spline interpolation을 사용하기 위한 순서입니다. 높을수록 느립니다. - __dtype__: 생성된 배열에 사용할 자료형. @@ -254,16 +254,16 @@ model.fit_generator( apply_transform(x, transform_parameters) ``` -주어진 매개변수Parameters에 따라 이미지에 변형을 가합니다. +주어진 매개변수parameters에 따라 이미지에 변형을 가합니다. __인자__ - __x__: 3D 텐서, 단일 이미지. - __transform_parameters__: 문자열 딕셔너리, 어떤 변형을 할 지를 나타내는 매개변수 쌍. 현재, 딕셔너리에서 다음과 같은 매개변수가 사용됩니다: - - `'theta'`: `Float`. 도Degrees 단위의 회전 각도. + - `'theta'`: `Float`. 도degrees 단위의 회전 각도. - - `'tx'`: `Float`. x 방향으로의 이동Shift. + - `'tx'`: `Float`. x 방향으로의 이동shift. - `'ty'`: `Float`. y 방향으로의 이동. @@ -294,9 +294,9 @@ __반환값__ fit(x, augment=False, rounds=1, seed=None) ``` -표본 데이터를 데이터 제너레이터Data Generator에 학습시킵니다. +표본 데이터를 데이터 제너레이터data Generator에 학습시킵니다. -이 함수는 표본 데이터 배열의 데이터-의존적Data-dependent 변형에 관련된 +이 함수는 표본 데이터 배열의 데이터-의존적data-dependent 변형에 관련된 내적 데이터 통계치를 계산합니다. `featurewise_center`, `featurewise_std_normalization`, @@ -305,7 +305,7 @@ fit(x, augment=False, rounds=1, seed=None) __인자__ - __x__: 표본 데이터. 랭크가 4이어야 합니다. - 흑백Grayscale 데이터의 경우 채널이 1개가 되어야 하며, + 흑백grayscale 데이터의 경우 채널이 1개가 되어야 하며, RGB 데이터의 경우 채널 3개, RGBA 데이터의 경우 채널 4개가 되어야 합니다. - __augment__: `Bool` (기본값: False). @@ -323,7 +323,7 @@ __인자__ flow(x, y=None, batch_size=32, shuffle=True, sample_weight=None, seed=None, save_to_dir=None, save_prefix='', save_format='png', subset=None) ``` -데이터와 레이블Lable 배열을 받아 증강된 데이터의 배치를 생성합니다. +데이터와 레이블lable 배열을 받아 증강된 데이터의 배치를 생성합니다. __인자__ @@ -385,7 +385,7 @@ flow_from_dataframe(dataframe, directory=None, x_col='filename', y_col='class', __인자__ -- __dataframe__: 문자열 칼럼Column 이미지의 `directory` 상대 경로를 포함한 Pandas 데이터 프레임, `directory`가 없는 경우 절대 경로를 포함하는 Pandas 데이터 프레임. +- __dataframe__: 문자열 칼럼column 이미지의 `directory` 상대 경로를 포함한 Pandas 데이터 프레임, `directory`가 없는 경우 절대 경로를 포함하는 Pandas 데이터 프레임. `class_mode`에 따라 다양한 형태의 칼럼을 가집니다. @@ -422,7 +422,7 @@ __인자__ 생성할 수 있는 목푯값(들)의 형태는 다음과 같다. - `"binary"`: 이진 레이블의 1D NumPy 배열, - - `"categorical"`: 원-핫 인코딩One-hot encode의 2D NumPy 배열. 다중 레이블 출력값을 지원한다, + - `"categorical"`: 원-핫 인코딩one-hot encode의 2D NumPy 배열. 다중 레이블 출력값을 지원한다, - `"input"`: 입력 이미지와 동일한 이미지(주로 오토인코더Autoencoder에서 사용된다.), - `"multi_output"`: 여러 칼럼의 값들을 가지고 있는 리스트, - `"raw"`: `y_col`칼럼(들) 값들의 NumPy 배열, @@ -433,16 +433,16 @@ __인자__ - __shuffle__: 데이터를 뒤섞을지 여부 (기본값: True) -- __seed__: 데이터 셔플링Shuffling과 변형시에 사용되는 직접 지정 할 수 있는 난수 시드. +- __seed__: 데이터 셔플링shuffling과 변형시에 사용되는 직접 지정 할 수 있는 난수 시드. - __save_to_dir__: `None` 혹은 `str` (기본값: None). 생성된 증강 사진을 특정한 디렉토리에서 저장할 수 있게 해줍니다. 이는 현재 작업을 시각화하는데 유용합니다. -- __save_prefix__: `str`. 저장된 사진의 파일 이름에 사용할 접두부호Prefix (`save_to_dir`가 설정된 경우에만 해당됩니다). +- __save_prefix__: `str`. 저장된 사진의 파일 이름에 사용할 접두부호prefix (`save_to_dir`가 설정된 경우에만 해당됩니다). - __save_format__: "png"와 "jpeg" 중 하나 (`save_to_dir`가 설정된 경우에만 해당됩니다). 기본값: "png". -- __follow_links__: 클래스 하위 디렉토리 내 심볼릭 링크 Symlink를 따라갈지 여부 (기본값: False). +- __follow_links__: 클래스 하위 디렉토리 내 심볼릭 링크symlink를 따라갈지 여부 (기본값: False). - __subset__: `ImageDataGenerator`에서 `validation_split`이 설정된 경우 subset의 입력으로 `"training"` 혹은 `"validation"` 을 사용할 수 있습니다. @@ -577,7 +577,7 @@ standardize(x) 입력의 배치에 표준화를 적용합니다. -`X` 는 주로 내부에서 이미지를 표준화Standardize하고 네트워크에 공급하기 위해 사용되기 때문에 인플레이스In-place 방식으로 변경됩니다. `x`를 복사해 만든다면 성능 비용이 클 것입니다. +`X` 는 주로 내부에서 이미지를 표준화standardize하고 네트워크에 공급하기 위해 사용되기 때문에 인플레이스in-place 방식으로 변경됩니다. `x`를 복사해 만든다면 성능 비용이 클 것입니다. 입력 내용을 인플레이스 방식으로 변경하지 않고 이 방법을 그대로 사용하기 위해선 먼저 복사본을 생성하세요 standarize(np.copy(x))