diff --git a/best_shuttle_bus_route.ipynb b/best_shuttle_bus_route.ipynb deleted file mode 100644 index 3d7ed0a..0000000 --- a/best_shuttle_bus_route.ipynb +++ /dev/null @@ -1,2317 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "# 최적 셔틀버스 노선 탐색" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## 데이터 준비" - ] - }, - { - "cell_type": "code", - "execution_count": 54, - "metadata": {}, - "outputs": [], - "source": [ - "import os\n", - "import pandas as pd\n", - "\n", - "# 'data/raw_data' 경로 설정\n", - "root_dir = 'data/'\n", - "visitor_city = pd.read_csv(os.path.join(root_dir, \"city_of_festival_visitors.csv\")) # 무주축제 방문객 top 18 지역들 (시군구명,od_cnts,시도명,행정동코드,위도,경도)\n", - "address = pd.read_csv(os.path.join(root_dir, \"address_with_lon_lat_final.csv\")) # 행정동코드 + 위도경도 (행정동코드,시도명,시군구명,읍면동명,동리명,위도,경도)\n", - "mooju = set(list(address[address['시군구명'] == '무주군']['행정동코드'])) # 무주군 행정동코드\n", - "other_city = list(address.merge(visitor_city, on=['시도명', '시군구명'])['행정동코드_x']) # 다른 지역들 행정동코드 모음" - ] - }, - { - "cell_type": "code", - "execution_count": 55, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
시군구명od_cnts시도명행정동코드위도경도시도 시군구
0전주시 덕진구2834전라북도451130000035.847561127.117672전라북도 전주시 덕진구
1서구1813대전광역시301700000036.355179127.383849대전광역시 서구
2전주시 완산구1561전라북도451110000035.795512127.132447전라북도 전주시 완산구
3유성구1379대전광역시302000000036.362073127.356410대전광역시 유성구
4동구1207대전광역시301100000035.886500128.635500대전광역시 동구
\n", - "
" - ], - "text/plain": [ - " 시군구명 od_cnts 시도명 행정동코드 위도 경도 시도 시군구\n", - "0 전주시 덕진구 2834 전라북도 4511300000 35.847561 127.117672 전라북도 전주시 덕진구\n", - "1 서구 1813 대전광역시 3017000000 36.355179 127.383849 대전광역시 서구\n", - "2 전주시 완산구 1561 전라북도 4511100000 35.795512 127.132447 전라북도 전주시 완산구\n", - "3 유성구 1379 대전광역시 3020000000 36.362073 127.356410 대전광역시 유성구\n", - "4 동구 1207 대전광역시 3011000000 35.886500 128.635500 대전광역시 동구" - ] - }, - "execution_count": 55, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "visitor_city['시도 시군구'] = visitor_city['시도명'].fillna('') + ' ' + visitor_city['시군구명'].fillna('')\n", - "\n", - "# 양쪽 값이 모두 null인 경우 빈 문자열 처리\n", - "visitor_city['시도 시군구'] = visitor_city['시도 시군구'].str.strip()\n", - "visitor_city.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 56, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
행정동코드시도명시군구명읍면동명동리명위도경도시도 시군구
01100000000서울특별시NaNNaN서울특별시37.566679126.978291서울특별시
11111000000서울특별시종로구NaN종로구37.580695126.982799서울특별시 종로구
21111051500서울특별시종로구청운효자동세종로37.579997126.976930서울특별시 종로구
31111051500서울특별시종로구청운효자동옥인동37.583480126.963850서울특별시 종로구
41111051500서울특별시종로구청운효자동누하동37.578998126.967561서울특별시 종로구
...........................
217725183035000강원특별자치도양양군강현면정암리38.143050128.607330강원특별자치도 양양군
217735183035000강원특별자치도양양군강현면용호리38.132320128.610700강원특별자치도 양양군
217745183035000강원특별자치도양양군강현면전진리38.124830128.624220강원특별자치도 양양군
217755183035000강원특별자치도양양군강현면물치리38.158083128.608889강원특별자치도 양양군
217765183035000강원특별자치도양양군강현면적은리38.118555128.598405강원특별자치도 양양군
\n", - "

21777 rows × 8 columns

\n", - "
" - ], - "text/plain": [ - " 행정동코드 시도명 시군구명 읍면동명 동리명 위도 경도 \\\n", - "0 1100000000 서울특별시 NaN NaN 서울특별시 37.566679 126.978291 \n", - "1 1111000000 서울특별시 종로구 NaN 종로구 37.580695 126.982799 \n", - "2 1111051500 서울특별시 종로구 청운효자동 세종로 37.579997 126.976930 \n", - "3 1111051500 서울특별시 종로구 청운효자동 옥인동 37.583480 126.963850 \n", - "4 1111051500 서울특별시 종로구 청운효자동 누하동 37.578998 126.967561 \n", - "... ... ... ... ... ... ... ... \n", - "21772 5183035000 강원특별자치도 양양군 강현면 정암리 38.143050 128.607330 \n", - "21773 5183035000 강원특별자치도 양양군 강현면 용호리 38.132320 128.610700 \n", - "21774 5183035000 강원특별자치도 양양군 강현면 전진리 38.124830 128.624220 \n", - "21775 5183035000 강원특별자치도 양양군 강현면 물치리 38.158083 128.608889 \n", - "21776 5183035000 강원특별자치도 양양군 강현면 적은리 38.118555 128.598405 \n", - "\n", - " 시도 시군구 \n", - "0 서울특별시 \n", - "1 서울특별시 종로구 \n", - "2 서울특별시 종로구 \n", - "3 서울특별시 종로구 \n", - "4 서울특별시 종로구 \n", - "... ... \n", - "21772 강원특별자치도 양양군 \n", - "21773 강원특별자치도 양양군 \n", - "21774 강원특별자치도 양양군 \n", - "21775 강원특별자치도 양양군 \n", - "21776 강원특별자치도 양양군 \n", - "\n", - "[21777 rows x 8 columns]" - ] - }, - "execution_count": 56, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "address['시도 시군구'] = address['시도명'].fillna('') + ' ' + address['시군구명'].fillna('')\n", - "\n", - "# 양쪽 값이 모두 null인 경우 빈 문자열 처리\n", - "address['시도 시군구'] = address['시도 시군구'].str.strip()\n", - "address" - ] - }, - { - "cell_type": "code", - "execution_count": 57, - "metadata": {}, - "outputs": [ - { - "name": "stderr", - "output_type": "stream", - "text": [ - " 0%| | 0/9 [00:00\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
origin_hdong_cddest_hdong_cddatestart_timeend_timegenderagemodalorigin_purposedest_purposeod_dist_avgod_duration_avgod_cnts
1096431137410045730310002023090209:0011:00100.00.051637821096
2269457303300045730250002023090220:0020:00031.05.0520247289
3874481296500045730340002023090216:0018:00040.04.054240721317
4218481707300045730320002023090213:0016:00100.00.051191001419
4773457303200045730250002023090217:0019:00040.05.051280301189
..........................................
3237279457403600045730340002023091012:0012:00011.05.0538926275
3238635457303300045730250002023091012:0012:00150.05.059476135
3239981457202500045730330002023091018:0018:00030.05.0550623336
3246027457302500045730340002023091011:0012:00030.05.0546949515
3249613478302530045730320002023091010:0011:00010.05.052183741005
\n", - "

4173 rows × 13 columns

\n", - "" - ], - "text/plain": [ - " origin_hdong_cd dest_hdong_cd date start_time end_time gender \\\n", - "1096 4311374100 4573031000 20230902 09:00 11:00 1 \n", - "2269 4573033000 4573025000 20230902 20:00 20:00 0 \n", - "3874 4812965000 4573034000 20230902 16:00 18:00 0 \n", - "4218 4817073000 4573032000 20230902 13:00 16:00 1 \n", - "4773 4573032000 4573025000 20230902 17:00 19:00 0 \n", - "... ... ... ... ... ... ... \n", - "3237279 4574036000 4573034000 20230910 12:00 12:00 0 \n", - "3238635 4573033000 4573025000 20230910 12:00 12:00 1 \n", - "3239981 4572025000 4573033000 20230910 18:00 18:00 0 \n", - "3246027 4573025000 4573034000 20230910 11:00 12:00 0 \n", - "3249613 4783025300 4573032000 20230910 10:00 11:00 0 \n", - "\n", - " age modal origin_purpose dest_purpose od_dist_avg \\\n", - "1096 0 0.0 0.0 5 163782 \n", - "2269 3 1.0 5.0 5 20247 \n", - "3874 4 0.0 4.0 5 424072 \n", - "4218 0 0.0 0.0 5 119100 \n", - "4773 4 0.0 5.0 5 128030 \n", - "... ... ... ... ... ... \n", - "3237279 1 1.0 5.0 5 38926 \n", - "3238635 5 0.0 5.0 5 9476 \n", - "3239981 3 0.0 5.0 5 50623 \n", - "3246027 3 0.0 5.0 5 46949 \n", - "3249613 1 0.0 5.0 5 218374 \n", - "\n", - " od_duration_avg od_cnts \n", - "1096 109 6 \n", - "2269 28 9 \n", - "3874 131 7 \n", - "4218 141 9 \n", - "4773 118 9 \n", - "... ... ... \n", - "3237279 27 5 \n", - "3238635 13 5 \n", - "3239981 33 6 \n", - "3246027 51 5 \n", - "3249613 100 5 \n", - "\n", - "[4173 rows x 13 columns]" - ] - }, - "execution_count": 57, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "from tqdm import tqdm\n", - "\n", - "data_frames = []\n", - "muju_codes = [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n", - "\n", - "for i in tqdm(range(2, 11)):\n", - " # print(f\"{i}번째 \", end=\" \")\n", - " index = str(i).rjust(2, '0')\n", - " df_tmp = pd.read_csv(f\"EDA/jiwon/data/od_20230901_10/od_202309{index}_1.csv\")\n", - " to_muju = df_tmp['dest_hdong_cd'].isin(muju_codes) & (df_tmp['dest_purpose'] == 5)\n", - " data_frames.append(df_tmp[to_muju])\n", - "del df_tmp\n", - "\n", - "df_od = pd.concat(data_frames, axis=0)\n", - "df_od" - ] - }, - { - "cell_type": "code", - "execution_count": 58, - "metadata": {}, - "outputs": [ - { - "name": "stderr", - "output_type": "stream", - "text": [ - "100%|██████████| 9/9 [00:18<00:00, 2.08s/it]\n" - ] - }, - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hdong_cddateagestay_cnts
0111105150020230902015738
1111105150020230902126248
2111105150020230902221350
3111105150020230902332200
4111105150020230902437772
...............
3125251830350002023091045202
3125351830350002023091057813
3125451830350002023091066296
3125551830350002023091075745
3125651830350002023091082541
\n", - "

281450 rows × 4 columns

\n", - "
" - ], - "text/plain": [ - " hdong_cd date age stay_cnts\n", - "0 1111051500 20230902 0 15738\n", - "1 1111051500 20230902 1 26248\n", - "2 1111051500 20230902 2 21350\n", - "3 1111051500 20230902 3 32200\n", - "4 1111051500 20230902 4 37772\n", - "... ... ... ... ...\n", - "31252 5183035000 20230910 4 5202\n", - "31253 5183035000 20230910 5 7813\n", - "31254 5183035000 20230910 6 6296\n", - "31255 5183035000 20230910 7 5745\n", - "31256 5183035000 20230910 8 2541\n", - "\n", - "[281450 rows x 4 columns]" - ] - }, - "execution_count": 58, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "data_frames = []\n", - "for i in tqdm(range(2, 11)):\n", - " # print(f\"9월 {i}일 \", end=\" \")\n", - " index = str(i).rjust(2, '0')\n", - " df_tmp = pd.read_csv(f\"EDA/jiwon/data/stay_20230901_15/stay_202309{index}_1.csv\")\n", - " residents = df_tmp[(df_tmp['purpose'] == 0)]\n", - " grouped_residents = residents.groupby(['hdong_cd', 'date', 'age'])['stay_cnts'].sum().reset_index()\n", - " data_frames.append(grouped_residents)\n", - "del df_tmp\n", - "\n", - "df_stay = pd.concat(data_frames, axis=0)\n", - "df_stay" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### 지역별 거주인원" - ] - }, - { - "cell_type": "code", - "execution_count": 59, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hdong_cdstay_cnts
01111051500205476.0
11111053000101129.0
2111105400038539.0
31111055000135173.0
41111056000183499.0
\n", - "
" - ], - "text/plain": [ - " hdong_cd stay_cnts\n", - "0 1111051500 205476.0\n", - "1 1111053000 101129.0\n", - "2 1111054000 38539.0\n", - "3 1111055000 135173.0\n", - "4 1111056000 183499.0" - ] - }, - "execution_count": 59, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# 지역별 전체 거주민 수\n", - "df_stay_all = df_stay.groupby(['hdong_cd', 'date'])['stay_cnts'].sum().reset_index() # 날짜별 거주인구 합산\n", - "avg_stay_cnts_all = round(df_stay_all.groupby('hdong_cd')['stay_cnts'].mean().reset_index(), 0) # 하루 평균 거주인구\n", - "avg_stay_cnts_all.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 60, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
hdong_cdstay_cnts
0111105150022012.0
1111105300011963.0
211110540005773.0
3111105500018550.0
4111105600024343.0
\n", - "
" - ], - "text/plain": [ - " hdong_cd stay_cnts\n", - "0 1111051500 22012.0\n", - "1 1111053000 11963.0\n", - "2 1111054000 5773.0\n", - "3 1111055000 18550.0\n", - "4 1111056000 24343.0" - ] - }, - "execution_count": 60, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# 지역별 20대,50대,60대 거주민 수\n", - "df_stay_age = df_stay[df_stay['age'].isin([2,5,6])] # 날짜별 20대 거주인구\n", - "avg_stay_cnts_age = round(df_stay_age.groupby(['hdong_cd'])['stay_cnts'].mean().reset_index(), 0) # 하루 평균 20대 거주인구\n", - "avg_stay_cnts_age.head()" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### 지역별 무주축제방문객 인원" - ] - }, - { - "cell_type": "code", - "execution_count": 61, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
origin_hdong_cddest_hdong_cddatestart_timeend_timegenderagemodalorigin_purposedest_purposeod_dist_avgod_duration_avgod_cnts
1096431137410045730310002023090209:0011:00100.00.051637821096
2269457303300045730250002023090220:0020:00031.05.0520247289
3874481296500045730340002023090216:0018:00040.04.054240721317
\n", - "
" - ], - "text/plain": [ - " origin_hdong_cd dest_hdong_cd date start_time end_time gender \\\n", - "1096 4311374100 4573031000 20230902 09:00 11:00 1 \n", - "2269 4573033000 4573025000 20230902 20:00 20:00 0 \n", - "3874 4812965000 4573034000 20230902 16:00 18:00 0 \n", - "\n", - " age modal origin_purpose dest_purpose od_dist_avg od_duration_avg \\\n", - "1096 0 0.0 0.0 5 163782 109 \n", - "2269 3 1.0 5.0 5 20247 28 \n", - "3874 4 0.0 4.0 5 424072 131 \n", - "\n", - " od_cnts \n", - "1096 6 \n", - "2269 9 \n", - "3874 7 " - ] - }, - "execution_count": 61, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "df_od.head(3)" - ] - }, - { - "cell_type": "code", - "execution_count": 62, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
origin_hdong_cddateageod_cnts
0111706850020230908012
111200670002023090246
211215840002023090209
311320511002023090946
4113506400020230902064
...............
1703511306600020230902012
170451130675002023090736
170551130675002023090936
1706511306750020230909412
1707518103300020230908050
\n", - "

1708 rows × 4 columns

\n", - "
" - ], - "text/plain": [ - " origin_hdong_cd date age od_cnts\n", - "0 1117068500 20230908 0 12\n", - "1 1120067000 20230902 4 6\n", - "2 1121584000 20230902 0 9\n", - "3 1132051100 20230909 4 6\n", - "4 1135064000 20230902 0 64\n", - "... ... ... ... ...\n", - "1703 5113066000 20230902 0 12\n", - "1704 5113067500 20230907 3 6\n", - "1705 5113067500 20230909 3 6\n", - "1706 5113067500 20230909 4 12\n", - "1707 5181033000 20230908 0 50\n", - "\n", - "[1708 rows x 4 columns]" - ] - }, - "execution_count": 62, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# 그룹화\n", - "df_od_group = df_od.groupby(['origin_hdong_cd', 'date', 'age'])['od_cnts'].sum().reset_index()\n", - "df_od_group" - ] - }, - { - "cell_type": "code", - "execution_count": 63, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
origin_hdong_cdod_cnts
0111706850012
111200670006
211215840009
311320511006
4113506400070
\n", - "
" - ], - "text/plain": [ - " origin_hdong_cd od_cnts\n", - "0 1117068500 12\n", - "1 1120067000 6\n", - "2 1121584000 9\n", - "3 1132051100 6\n", - "4 1135064000 70" - ] - }, - "execution_count": 63, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# 지역별 전체 무주축제방문객 수\n", - "df_od_all = df_od_group.groupby(['origin_hdong_cd', 'date'])['od_cnts'].sum().reset_index() # 날짜별 방문객수 합산\n", - "sum_od_cnts_all = round(df_od_all.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index(), 0) # 해당 지역에서 온 전체 방문객수\n", - "sum_od_cnts_all.head()" - ] - }, - { - "cell_type": "code", - "execution_count": 64, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
origin_hdong_cdod_cnts
011350640006
111380510005
211410620007
3114107200014
411440600008
.........
310488803400013
31148880350006
312488803700013
313488804000017
31448890450008
\n", - "

315 rows × 2 columns

\n", - "
" - ], - "text/plain": [ - " origin_hdong_cd od_cnts\n", - "0 1135064000 6\n", - "1 1138051000 5\n", - "2 1141062000 7\n", - "3 1141072000 14\n", - "4 1144060000 8\n", - ".. ... ...\n", - "310 4888034000 13\n", - "311 4888035000 6\n", - "312 4888037000 13\n", - "313 4888040000 17\n", - "314 4889045000 8\n", - "\n", - "[315 rows x 2 columns]" - ] - }, - "execution_count": 64, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# 지역별 20대,50대,60대 무주축제방문객 수\n", - "df_od_age = df_od_group[df_od_group['age'].isin([2,5,6])]\n", - "sum_od_cnts_age = round(df_od_age.groupby('origin_hdong_cd')['od_cnts'].sum().reset_index(), 0)\n", - "sum_od_cnts_age" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## 함수" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### 노드 간 정보" - ] - }, - { - "cell_type": "code", - "execution_count": 65, - "metadata": {}, - "outputs": [], - "source": [ - "# 시도시군구명으로 위경도 좌표를 반환하는 함수\n", - "def get_coordinates(lst):\n", - " coordinates = []\n", - " for name in lst:\n", - " try:\n", - " # '시도 시군구'로 '위도', '경도' 가져옴\n", - " target = address[address['시도 시군구'] == name][['위도','경도']].iloc[0]\n", - " x, y = target.iloc[0], target.iloc[1]\n", - " coordinates.append((x,y))\n", - " except IndexError:\n", - " # 해당 '시도 시군구'에 대한 데이터가 없는 경우\n", - " print(f\"{name} 지역의 위도, 경도 정보가 없습니다.\")\n", - " return coordinates" - ] - }, - { - "cell_type": "code", - "execution_count": 66, - "metadata": {}, - "outputs": [], - "source": [ - "import yaml\n", - "import requests\n", - "\n", - "# api 사용을 위한 key값 가져오기 \n", - "with open(\"config.yaml\", \"r\") as file:\n", - " config = yaml.safe_load(file)\n", - "naver_api_id = config['naver api']['id']\n", - "naver_api_key = config['naver api']['key']\n", - "kakao_api_key = config['kakao api']['key']\n", - "\n", - "# 네이버 api 요청 함수\n", - "def naver_request(start, goal):\n", - " # 요청\n", - " url = 'https://naveropenapi.apigw.ntruss.com/map-direction/v1/driving'\n", - " params = {\n", - " 'goal': f'{goal[1]},{goal[0]}',\n", - " 'start': f'{start[1]},{start[0]}',\n", - " }\n", - " headers = {\n", - " 'x-ncp-apigw-api-key-id': naver_api_id,\n", - " 'x-ncp-apigw-api-key': naver_api_key\n", - " }\n", - " response = requests.get(url, headers=headers, params=params)\n", - "\n", - " # 응답\n", - " data = response.json()\n", - " if data['code'] == 0:\n", - " if data['route']['traoptimal']:\n", - " summary = data['route']['traoptimal'][0]['summary']\n", - " distance = summary['distance']\n", - " duration = summary['duration']\n", - " return distance, duration\n", - " else:\n", - " print(\"응답 에러: 'traoptimal' 데이터가 없습니다.\")\n", - " return -1, -1\n", - " else:\n", - " print(\"요청 실패: \", data['message'])\n", - " return -1, -1\n", - "\n", - "# 카카오 api 요청 함수\n", - "def kakao_request(start, goal):\n", - " # 요청\n", - " url = 'https://apis-navi.kakaomobility.com/v1/directions'\n", - " params = {\n", - " 'origin': f'{start[1]},{start[0]}',\n", - " 'destination': f'{goal[1]},{goal[0]}',\n", - " 'alternatives': True,\n", - " }\n", - " headers = {\n", - " 'Authorization': f'KakaoAK {kakao_api_key}'\n", - " }\n", - " response = requests.get(url, headers=headers, params=params)\n", - "\n", - " # 응답\n", - " if response.status_code == 200:\n", - " data = response.json()\n", - " if data['routes']:\n", - " summary = data['routes'][0]['summary']\n", - " distance = summary.get('distance')\n", - " duration = summary.get('duration')\n", - " return distance, duration\n", - " else:\n", - " print(\"응답 에러: 'routes' 데이터가 없습니다.\")\n", - " return -1, -1\n", - " else:\n", - " print(\"요청 실패\")\n", - " return -1, -1" - ] - }, - { - "cell_type": "code", - "execution_count": 67, - "metadata": {}, - "outputs": [], - "source": [ - "# 노드 간 이동시간, 이동거리 테이블 반환하는 함수\n", - "def get_path_info(coordinates, request_func):\n", - " n = len(coordinates)\n", - " distance_table = [[0] * n for _ in range(n)]\n", - " duration_table = [[0] * n for _ in range(n)]\n", - "\n", - " for i in range(n):\n", - " for j in range(n):\n", - " if j > i:\n", - " start = coordinates[i]\n", - " goal = coordinates[j]\n", - " distance, duration = request_func(start, goal)\n", - " distance_table[i][j], distance_table[j][i] = distance, distance\n", - " duration_table[i][j], duration_table[j][i] = duration, duration\n", - "\n", - " return distance_table, duration_table" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### 가중치" - ] - }, - { - "cell_type": "code", - "execution_count": 68, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "지역명: 세종특별자치시\n", - "관련 행정동코드: [3600000000, 3611000000, 3611025000, 3611031000, 3611032000, 3611033000, 3611034000, 3611035000, 3611036000, 3611037000, 3611038000, 3611039000, 3611051000, 3611051500, 3611051800, 3611052000, 3611052300, 3611052500, 3611053000, 3611054000, 3611055000, 3611055500, 3611055600, 3611056000, 3611057000, 3611058000]\n", - "총 거주인원: 3048131.0 , 20/50/60대 거주인원: 290518.0 \n", - "\n", - "지역명: 대전광역시 유성구\n", - "관련 행정동코드: [3020000000, 3020052000, 3020052600, 3020052700, 3020053000, 3020054000, 3020054600, 3020054700, 3020054800, 3020055000, 3020057000, 3020058000, 3020060000, 3020061000]\n", - "총 거주인원: 3820791.0 , 20/50/60대 거주인원: 424653.0 \n", - "\n", - "지역명: 대전광역시 서구\n", - "관련 행정동코드: [3017000000, 3017051000, 3017052000, 3017053000, 3017053500, 3017054000, 3017055000, 3017055500, 3017056000, 3017057000, 3017057500, 3017058100, 3017058200, 3017058600, 3017058700, 3017058800, 3017059000, 3017059300, 3017059600, 3017059700, 3017060000, 3017063000, 3017064000, 3017065000, 3017066000]\n", - "총 거주인원: 5536840.0 , 20/50/60대 거주인원: 674439.0 \n", - "\n", - "지역명: 대전광역시 대덕구\n", - "관련 행정동코드: [3023000000, 3023051000, 3023052000, 3023052500, 3023053300, 3023054300, 3023054600, 3023055000, 3023056000, 3023057000, 3023058000, 3023060000, 3023061000]\n", - "총 거주인원: 2377042.0 , 20/50/60대 거주인원: 306052.0 \n", - "\n", - "지역명: 대전광역시 중구\n", - "관련 행정동코드: [3014000000, 3014053500, 3014055000, 3014056000, 3014057500, 3014060500, 3014062000, 3014063000, 3014064000, 3014065500, 3014067000, 3014068000, 3014069000, 3014070000, 3014071000, 3014072000, 3014073000, 3014074000]\n", - "총 거주인원: 2922017.0 , 20/50/60대 거주인원: 354956.0 \n", - "\n", - "지역명: 충청남도 금산군\n", - "관련 행정동코드: [4471000000, 4471025000, 4471031000, 4471032000, 4471033000, 4471034000, 4471035000, 4471036000, 4471037000, 4471038000, 4471039000]\n", - "총 거주인원: 554830.0 , 20/50/60대 거주인원: 76765.0 \n", - "\n", - "지역명: 충청북도 영동군\n", - "관련 행정동코드: [4374000000, 4374025000, 4374031000, 4374032000, 4374033500, 4374034000, 4374035000, 4374036000, 4374037000, 4374038000, 4374039000, 4374040000]\n", - "총 거주인원: 450046.0 , 20/50/60대 거주인원: 61760.0 \n", - "\n", - "지역명: 전라북도 무주군\n", - "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n", - "총 거주인원: 211731.0 , 20/50/60대 거주인원: 26123.0 \n", - "\n", - "[3048131, 3820791, 5536840, 2377042, 2922017, 554830, 450046, 211731]\n", - "[290518, 424653, 674439, 306052, 354956, 76765, 61760, 26123]\n" - ] - } - ], - "source": [ - "# 각 지역 거주인원\n", - "def get_residents_num(lst):\n", - " residents_num = []\n", - " residents_num_256 = []\n", - " for name in lst:\n", - " print(\"지역명:\", name)\n", - " codes = address[address['시도 시군구'] == name]['행정동코드'].unique().tolist()\n", - " print(\"관련 행정동코드: \", codes)\n", - " # 지역 내 행정동코드들의 거주인원 합산\n", - " cnt_all = 0\n", - " cnt_256 = 0\n", - " for code in codes:\n", - " tmp_for_all = avg_stay_cnts_all[avg_stay_cnts_all['hdong_cd']==code]\n", - " if not tmp_for_all.empty:\n", - " cnt_all += tmp_for_all['stay_cnts'].iloc[0]\n", - " tmp_for_256 = avg_stay_cnts_age[avg_stay_cnts_age['hdong_cd']==code]\n", - " if not tmp_for_256.empty:\n", - " cnt_256 += tmp_for_256['stay_cnts'].iloc[0]\n", - " residents_num.append(int(cnt_all))\n", - " residents_num_256.append(int(cnt_256))\n", - " print(\"총 거주인원:\", cnt_all, \", 20/50/60대 거주인원:\", cnt_256, \"\\n\")\n", - " return residents_num, residents_num_256\n", - "\n", - "# 대전 지역으로 테스트\n", - "daejun = ['세종특별자치시', '대전광역시 유성구', '대전광역시 서구', '대전광역시 대덕구', '대전광역시 중구', '충청남도 금산군', '충청북도 영동군', '전라북도 무주군']\n", - "\n", - "daejun_residents_num, daejun_residents_num_256 = get_residents_num(daejun)\n", - "\n", - "print(daejun_residents_num)\n", - "print(daejun_residents_num_256)" - ] - }, - { - "cell_type": "code", - "execution_count": 69, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "지역명: 세종특별자치시\n", - "관련 행정동코드: [3600000000, 3611000000, 3611025000, 3611031000, 3611032000, 3611033000, 3611034000, 3611035000, 3611036000, 3611037000, 3611038000, 3611039000, 3611051000, 3611051500, 3611051800, 3611052000, 3611052300, 3611052500, 3611053000, 3611054000, 3611055000, 3611055500, 3611055600, 3611056000, 3611057000, 3611058000]\n", - "총 방문객 수: 758 , 20/50/60대 방문객 수: 41 \n", - "\n", - "지역명: 대전광역시 유성구\n", - "관련 행정동코드: [3020000000, 3020052000, 3020052600, 3020052700, 3020053000, 3020054000, 3020054600, 3020054700, 3020054800, 3020055000, 3020057000, 3020058000, 3020060000, 3020061000]\n", - "총 방문객 수: 895 , 20/50/60대 방문객 수: 189 \n", - "\n", - "지역명: 대전광역시 서구\n", - "관련 행정동코드: [3017000000, 3017051000, 3017052000, 3017053000, 3017053500, 3017054000, 3017055000, 3017055500, 3017056000, 3017057000, 3017057500, 3017058100, 3017058200, 3017058600, 3017058700, 3017058800, 3017059000, 3017059300, 3017059600, 3017059700, 3017060000, 3017063000, 3017064000, 3017065000, 3017066000]\n", - "총 방문객 수: 1182 , 20/50/60대 방문객 수: 304 \n", - "\n", - "지역명: 대전광역시 대덕구\n", - "관련 행정동코드: [3023000000, 3023051000, 3023052000, 3023052500, 3023053300, 3023054300, 3023054600, 3023055000, 3023056000, 3023057000, 3023058000, 3023060000, 3023061000]\n", - "총 방문객 수: 375 , 20/50/60대 방문객 수: 60 \n", - "\n", - "지역명: 대전광역시 중구\n", - "관련 행정동코드: [3014000000, 3014053500, 3014055000, 3014056000, 3014057500, 3014060500, 3014062000, 3014063000, 3014064000, 3014065500, 3014067000, 3014068000, 3014069000, 3014070000, 3014071000, 3014072000, 3014073000, 3014074000]\n", - "총 방문객 수: 602 , 20/50/60대 방문객 수: 109 \n", - "\n", - "지역명: 충청남도 금산군\n", - "관련 행정동코드: [4471000000, 4471025000, 4471031000, 4471032000, 4471033000, 4471034000, 4471035000, 4471036000, 4471037000, 4471038000, 4471039000]\n", - "총 방문객 수: 538 , 20/50/60대 방문객 수: 92 \n", - "\n", - "지역명: 충청북도 영동군\n", - "관련 행정동코드: [4374000000, 4374025000, 4374031000, 4374032000, 4374033500, 4374034000, 4374035000, 4374036000, 4374037000, 4374038000, 4374039000, 4374040000]\n", - "총 방문객 수: 618 , 20/50/60대 방문객 수: 129 \n", - "\n", - "지역명: 전라북도 무주군\n", - "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n", - "총 방문객 수: 24957 , 20/50/60대 방문객 수: 4768 \n", - "\n", - "[758, 895, 1182, 375, 602, 538, 618, 24957]\n", - "[41, 189, 304, 60, 109, 92, 129, 4768]\n" - ] - } - ], - "source": [ - "# 각 지역 방문객\n", - "def get_visitors_num(lst):\n", - " visitors_num = []\n", - " visitors_num_256 = []\n", - " for name in lst:\n", - " print(\"지역명:\", name)\n", - " codes = address[address['시도 시군구'] == name]['행정동코드'].unique().tolist()\n", - " print(\"관련 행정동코드: \", codes)\n", - " # 지역 내 행정동코드들의 방문객 합산\n", - " cnt_all = 0\n", - " cnt_256 = 0\n", - " for code in codes:\n", - " tmp_for_all = sum_od_cnts_all[sum_od_cnts_all['origin_hdong_cd']==code]\n", - " if not tmp_for_all.empty:\n", - " cnt_all += tmp_for_all['od_cnts'].iloc[0]\n", - " tmp_for_256 = sum_od_cnts_age[sum_od_cnts_age['origin_hdong_cd']==code]\n", - " if not tmp_for_256.empty:\n", - " cnt_256 += tmp_for_256['od_cnts'].iloc[0]\n", - " visitors_num.append(int(cnt_all))\n", - " visitors_num_256.append(int(cnt_256))\n", - " print(\"총 방문객 수:\", cnt_all, \", 20/50/60대 방문객 수:\", cnt_256, \"\\n\")\n", - " return visitors_num, visitors_num_256\n", - "\n", - "# 대전 지역으로 테스트\n", - "daejun_visitors_num, daejun_visitors_num_256 = get_visitors_num(daejun)\n", - "\n", - "print(daejun_visitors_num)\n", - "print(daejun_visitors_num_256)" - ] - }, - { - "cell_type": "code", - "execution_count": 70, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
origin_hdong_cd시도 시군구od_cnts
01135064000서울특별시 노원구6
11138051000서울특별시 은평구5
21141062000서울특별시 서대문구7
31141072000서울특별시 서대문구14
41144060000서울특별시 마포구8
............
2734888025000경상남도 거창군45
2744888034000경상남도 거창군8
2754888037000경상남도 거창군8
2764888040000경상남도 거창군7
2774889045000경상남도 합천군8
\n", - "

278 rows × 3 columns

\n", - "
" - ], - "text/plain": [ - " origin_hdong_cd 시도 시군구 od_cnts\n", - "0 1135064000 서울특별시 노원구 6\n", - "1 1138051000 서울특별시 은평구 5\n", - "2 1141062000 서울특별시 서대문구 7\n", - "3 1141072000 서울특별시 서대문구 14\n", - "4 1144060000 서울특별시 마포구 8\n", - ".. ... ... ...\n", - "273 4888025000 경상남도 거창군 45\n", - "274 4888034000 경상남도 거창군 8\n", - "275 4888037000 경상남도 거창군 8\n", - "276 4888040000 경상남도 거창군 7\n", - "277 4889045000 경상남도 합천군 8\n", - "\n", - "[278 rows x 3 columns]" - ] - }, - "execution_count": 70, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# 전체 데이터에서 20대 어디서 오는지 확인\n", - "age20 = df_od[df_od['age']==2][['origin_hdong_cd', 'date', 'age', 'od_cnts']]\n", - "age20 = age20.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index()\n", - "unique_address = address.drop_duplicates(subset=['행정동코드'])\n", - "age20eng = pd.merge(age20, unique_address[['행정동코드','시도 시군구']], 'left', left_on='origin_hdong_cd', right_on='행정동코드')\n", - "age20eng = age20eng[['origin_hdong_cd', '시도 시군구', 'od_cnts']]\n", - "age20eng" - ] - }, - { - "cell_type": "code", - "execution_count": 71, - "metadata": {}, - "outputs": [], - "source": [ - "# 지역별 20/50/60대 방문율\n", - "def get_proportion(a, b, n):\n", - " lst = []\n", - " for i in range(n):\n", - " lst.append(a[i] / b[i])\n", - " return lst" - ] - }, - { - "cell_type": "code", - "execution_count": 72, - "metadata": {}, - "outputs": [], - "source": [ - "import numpy as np\n", - "\n", - "def softmax(weights):\n", - " e = np.exp(weights - np.max(weights)) # 오버플로 방지를 위해 최대값을 빼줌\n", - " return e / e.sum()\n", - "\n", - "def get_weights(nodes, weights): \n", - " residents_num, residents_num_256 = get_residents_num(nodes)\n", - " visitors_num, visitors_num_256 = get_visitors_num(nodes)\n", - " # 방식1: 해당 지역의 2/5/60대 거주민 중 축제방문객 비율. (2/5/60대 축제 관심도가 높은 곳을 우선)\n", - " # weight_age = get_proportion(visitors_num_256, residents_num_256, len(nodes))\n", - " # 방식2: 해당 지역의 전체 축제방문객 중 2/5/60대 비율. ()\n", - " weight_age = get_proportion(visitors_num_256, visitors_num, len(nodes))\n", - " # 방식3: 해당 지역의 거주민 중 2/5/60대 거주민 비율. (단순히 2/5/60대가 많은 곳을 우선)\n", - " # weight_age = get_proportion(residents_num_256, residents_num, len(nodes))\n", - "\n", - " for i, w in enumerate(weight_age):\n", - " weights[i] += w\n", - "\n", - " softmax_weights = softmax(weights)\n", - " \n", - " stations = {nodes: weight for nodes, weight in zip(nodes, softmax_weights)}\n", - " print(stations)\n", - "\n", - " return stations" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### 탐색" - ] - }, - { - "cell_type": "code", - "execution_count": 73, - "metadata": {}, - "outputs": [], - "source": [ - "import networkx as nx\n", - "\n", - "# 모든 경로 찾기\n", - "def find_all_routes(G, start, target, visited=None, path=None):\n", - " if visited is None:\n", - " visited = set()\n", - " if path is None:\n", - " path = []\n", - "\n", - " visited.add(start)\n", - " path.append(start)\n", - "\n", - " if start == target:\n", - " yield path.copy()\n", - " else:\n", - " for neighbor in G.neighbors(start):\n", - " if neighbor not in visited:\n", - " yield from find_all_routes(G, neighbor, target, visited, path)\n", - "\n", - " path.pop()\n", - " visited.remove(start)\n", - "\n", - "# 최적 경로 탐색 함수\n", - "def find_optimal_routes(G, stations, min_threshold, max_threshold, step):\n", - " optimal_routes = []\n", - " max_stops = 0\n", - " explored_routes = set() # 탐색된 경로를 저장할 집합\n", - "\n", - " # 여러 배수 값을 탐색\n", - " for threshold in np.arange(min_threshold, max_threshold + step, step):\n", - "\n", - " for station in stations.keys():\n", - " if station != \"전라북도 무주군\": # 목적지가 아니면\n", - " routes = list(find_all_routes(G, station, \"전라북도 무주군\"))\n", - "\n", - " for route in routes:\n", - " valid_route = True\n", - " total_distance = 0\n", - " total_time = 0\n", - " total_weight = 0 # 가중치 누적\n", - "\n", - " # 각 경로의 모든 구간에 대해 확인\n", - " for i in range(len(route) - 1):\n", - " current_station = route[i]\n", - "\n", - " # 현재 노드에서 무주군으로 바로 이동할 때의 거리와 시간\n", - " if \"전라북도 무주군\" in G[current_station]: # 직접 경로가 있는 경우에만\n", - " direct_distance = G[current_station][\"전라북도 무주군\"]['distance']\n", - " direct_time = G[current_station][\"전라북도 무주군\"]['time']\n", - "\n", - " # 현재 구간의 거리와 시간을 누적\n", - " total_distance += G[route[i]][route[i + 1]]['distance']\n", - " total_time += G[route[i]][route[i + 1]]['time']\n", - "\n", - " # 각 중간 노드에서도 주어진 배수(factor) 조건 확인\n", - " if total_distance > direct_distance * threshold or total_time > direct_time * threshold:\n", - " valid_route = False\n", - " break\n", - "\n", - " # 가중치 누적 (출발지 제외)\n", - " if i > 0:\n", - " total_weight += stations[current_station]\n", - "\n", - " if valid_route:\n", - " # 경로를 집합에 저장할 수 있는 형태로 변환 (정렬하여 순서 상관없이 비교 하기 위함)\n", - " route_tuple = tuple(sorted(route))\n", - "\n", - " # 만약 해당 경로가 이전 배수에서 이미 탐색되었다면 제외\n", - " if route_tuple not in explored_routes:\n", - " explored_routes.add(route_tuple) # 새로운 경로로 저장\n", - "\n", - " # 최대 정거장 수 확인\n", - " if len(route) > max_stops:\n", - " max_stops = len(route)\n", - " optimal_routes = [(route, total_distance, total_time, total_weight, threshold)]\n", - " elif len(route) == max_stops:\n", - " optimal_routes.append((route, total_distance, total_time, total_weight, threshold))\n", - "\n", - " return optimal_routes\n" - ] - }, - { - "cell_type": "code", - "execution_count": 74, - "metadata": {}, - "outputs": [], - "source": [ - "def print_optimal_routes(optimal_routes, name):\n", - " print(f\"{name}지역 최적의 셔틀 노선\")\n", - " if optimal_routes:\n", - " for route, total_distance, total_time, total_weight, threshold in optimal_routes:\n", - " # 총 거리를 km로 변환하고 소수점 아래 두째 자리까지 포맷\n", - " total_distance_km = total_distance / 1000 # 미터를 킬로미터로 변환\n", - " total_distance_formatted = f\"{total_distance_km:.2f} km\"\n", - "\n", - " # 총 시간을 시간과 분으로 변환 (반올림)\n", - " total_time_hours = total_time // 60\n", - " total_time_minutes = round(total_time % 60)\n", - "\n", - " print(f\"최적의 셔틀 노선: {route} | 총 거리: {total_distance_formatted} | 총 시간: {total_time_hours}시간 {total_time_minutes}분 | 총 가중치: {total_weight} | threshold: {threshold:.2f}\")\n", - " else:\n", - " print(\"유효한 경로가 없습니다.\")" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "---" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## 메인" - ] - }, - { - "cell_type": "code", - "execution_count": 75, - "metadata": {}, - "outputs": [], - "source": [ - "# 경유지 리스트\n", - "daejun = ['세종특별자치시', '대전광역시 유성구', '대전광역시 서구', '대전광역시 대덕구', '대전광역시 중구', '충청남도 금산군', '충청북도 영동군', '전라북도 무주군']\n", - "jeonbuk = ['전라북도 군산시', '전라북도 익산시', '전라북도 전주시 완산구', '전라북도 전주시 덕진구', '전라북도 진안군', '전라북도 장수군', '전라북도 무주군']\n", - "# 방문객 수에 근거한 노드별 초기 가중치\n", - "daejun_weights = [1, 2, 2, 1, 1, 1, 2, 0] \n", - "jeonbuk_weights = [1, 1, 2, 2, 1, 2, 0]" - ] - }, - { - "cell_type": "code", - "execution_count": 76, - "metadata": {}, - "outputs": [], - "source": [ - "def search(nodes, weights, name):\n", - " # 1. 위경도 좌표 기반으로 경유지 간 이동거리, 이동시간 테이블 만듦\n", - "\n", - " # 경유지 위경도 좌표 \n", - " coordinates = get_coordinates(nodes) \n", - "\n", - " # 네이버 api\n", - " # n_distance_table, n_duration_table = get_path_info(coordinates, naver_request)\n", - " # n_duration_min_table = [[round(value / 3600, 2) for value in row] for row in n_duration_table]\n", - "\n", - " # 카카오 api\n", - " k_distance_table, k_duration_table = get_path_info(coordinates, kakao_request)\n", - " k_duration_min_table = [[round(value / 60, 2) for value in row] for row in k_duration_table]\n", - "\n", - "\n", - " distance_table = k_distance_table\n", - " duration_table = k_duration_min_table\n", - "\n", - " # 2. 정거장 후보지와 가중치\n", - " stations = get_weights(nodes, weights) \n", - "\n", - " # 3. 탐색\n", - " # 그래프 생성\n", - " G = nx.DiGraph()\n", - "\n", - " # 그래프에 엣지 추가\n", - " for i, from_station in enumerate(stations.keys()):\n", - " for j, to_station in enumerate(stations.keys()):\n", - " if i != j:\n", - " G.add_edge(from_station, to_station, \n", - " distance=distance_table[i][j], \n", - " time=duration_table[i][j])\n", - " \n", - " # 탐색 범위 설정 (예: 1.1부터 1.5까지 0.1 간격으로 탐색)\n", - " min_factor = 1.1\n", - " max_factor = 1.5\n", - " step = 0.1\n", - "\n", - " # 최적 경로 탐색 실행\n", - " optimal_routes = find_optimal_routes(G, stations, min_factor, max_factor, step)\n", - "\n", - " # 결과 출력\n", - " print_optimal_routes(optimal_routes, name)" - ] - }, - { - "cell_type": "code", - "execution_count": 77, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "지역명: 세종특별자치시\n", - "관련 행정동코드: [3600000000, 3611000000, 3611025000, 3611031000, 3611032000, 3611033000, 3611034000, 3611035000, 3611036000, 3611037000, 3611038000, 3611039000, 3611051000, 3611051500, 3611051800, 3611052000, 3611052300, 3611052500, 3611053000, 3611054000, 3611055000, 3611055500, 3611055600, 3611056000, 3611057000, 3611058000]\n", - "총 거주인원: 3048131.0 , 20/50/60대 거주인원: 290518.0 \n", - "\n", - "지역명: 대전광역시 유성구\n", - "관련 행정동코드: [3020000000, 3020052000, 3020052600, 3020052700, 3020053000, 3020054000, 3020054600, 3020054700, 3020054800, 3020055000, 3020057000, 3020058000, 3020060000, 3020061000]\n", - "총 거주인원: 3820791.0 , 20/50/60대 거주인원: 424653.0 \n", - "\n", - "지역명: 대전광역시 서구\n", - "관련 행정동코드: [3017000000, 3017051000, 3017052000, 3017053000, 3017053500, 3017054000, 3017055000, 3017055500, 3017056000, 3017057000, 3017057500, 3017058100, 3017058200, 3017058600, 3017058700, 3017058800, 3017059000, 3017059300, 3017059600, 3017059700, 3017060000, 3017063000, 3017064000, 3017065000, 3017066000]\n", - "총 거주인원: 5536840.0 , 20/50/60대 거주인원: 674439.0 \n", - "\n", - "지역명: 대전광역시 대덕구\n", - "관련 행정동코드: [3023000000, 3023051000, 3023052000, 3023052500, 3023053300, 3023054300, 3023054600, 3023055000, 3023056000, 3023057000, 3023058000, 3023060000, 3023061000]\n", - "총 거주인원: 2377042.0 , 20/50/60대 거주인원: 306052.0 \n", - "\n", - "지역명: 대전광역시 중구\n", - "관련 행정동코드: [3014000000, 3014053500, 3014055000, 3014056000, 3014057500, 3014060500, 3014062000, 3014063000, 3014064000, 3014065500, 3014067000, 3014068000, 3014069000, 3014070000, 3014071000, 3014072000, 3014073000, 3014074000]\n", - "총 거주인원: 2922017.0 , 20/50/60대 거주인원: 354956.0 \n", - "\n", - "지역명: 충청남도 금산군\n", - "관련 행정동코드: [4471000000, 4471025000, 4471031000, 4471032000, 4471033000, 4471034000, 4471035000, 4471036000, 4471037000, 4471038000, 4471039000]\n", - "총 거주인원: 554830.0 , 20/50/60대 거주인원: 76765.0 \n", - "\n", - "지역명: 충청북도 영동군\n", - "관련 행정동코드: [4374000000, 4374025000, 4374031000, 4374032000, 4374033500, 4374034000, 4374035000, 4374036000, 4374037000, 4374038000, 4374039000, 4374040000]\n", - "총 거주인원: 450046.0 , 20/50/60대 거주인원: 61760.0 \n", - "\n", - "지역명: 전라북도 무주군\n", - "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n", - "총 거주인원: 211731.0 , 20/50/60대 거주인원: 26123.0 \n", - "\n", - "지역명: 세종특별자치시\n", - "관련 행정동코드: [3600000000, 3611000000, 3611025000, 3611031000, 3611032000, 3611033000, 3611034000, 3611035000, 3611036000, 3611037000, 3611038000, 3611039000, 3611051000, 3611051500, 3611051800, 3611052000, 3611052300, 3611052500, 3611053000, 3611054000, 3611055000, 3611055500, 3611055600, 3611056000, 3611057000, 3611058000]\n", - "총 방문객 수: 758 , 20/50/60대 방문객 수: 41 \n", - "\n", - "지역명: 대전광역시 유성구\n", - "관련 행정동코드: [3020000000, 3020052000, 3020052600, 3020052700, 3020053000, 3020054000, 3020054600, 3020054700, 3020054800, 3020055000, 3020057000, 3020058000, 3020060000, 3020061000]\n", - "총 방문객 수: 895 , 20/50/60대 방문객 수: 189 \n", - "\n", - "지역명: 대전광역시 서구\n", - "관련 행정동코드: [3017000000, 3017051000, 3017052000, 3017053000, 3017053500, 3017054000, 3017055000, 3017055500, 3017056000, 3017057000, 3017057500, 3017058100, 3017058200, 3017058600, 3017058700, 3017058800, 3017059000, 3017059300, 3017059600, 3017059700, 3017060000, 3017063000, 3017064000, 3017065000, 3017066000]\n", - "총 방문객 수: 1182 , 20/50/60대 방문객 수: 304 \n", - "\n", - "지역명: 대전광역시 대덕구\n", - "관련 행정동코드: [3023000000, 3023051000, 3023052000, 3023052500, 3023053300, 3023054300, 3023054600, 3023055000, 3023056000, 3023057000, 3023058000, 3023060000, 3023061000]\n", - "총 방문객 수: 375 , 20/50/60대 방문객 수: 60 \n", - "\n", - "지역명: 대전광역시 중구\n", - "관련 행정동코드: [3014000000, 3014053500, 3014055000, 3014056000, 3014057500, 3014060500, 3014062000, 3014063000, 3014064000, 3014065500, 3014067000, 3014068000, 3014069000, 3014070000, 3014071000, 3014072000, 3014073000, 3014074000]\n", - "총 방문객 수: 602 , 20/50/60대 방문객 수: 109 \n", - "\n", - "지역명: 충청남도 금산군\n", - "관련 행정동코드: [4471000000, 4471025000, 4471031000, 4471032000, 4471033000, 4471034000, 4471035000, 4471036000, 4471037000, 4471038000, 4471039000]\n", - "총 방문객 수: 538 , 20/50/60대 방문객 수: 92 \n", - "\n", - "지역명: 충청북도 영동군\n", - "관련 행정동코드: [4374000000, 4374025000, 4374031000, 4374032000, 4374033500, 4374034000, 4374035000, 4374036000, 4374037000, 4374038000, 4374039000, 4374040000]\n", - "총 방문객 수: 618 , 20/50/60대 방문객 수: 129 \n", - "\n", - "지역명: 전라북도 무주군\n", - "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n", - "총 방문객 수: 24957 , 20/50/60대 방문객 수: 4768 \n", - "\n", - "{'세종특별자치시': 0.0690751357958365, '대전광역시 유성구': 0.21970336845100272, '대전광역시 서구': 0.23004991987725867, '대전광역시 대덕구': 0.07679235776727512, '대전광역시 중구': 0.07842699953443562, '충청남도 금산군': 0.07764202535394257, '충청북도 영동군': 0.21916897136041014, '전라북도 무주군': 0.029141221859838744}\n", - "대전지역 최적의 셔틀 노선\n", - "최적의 셔틀 노선: ['대전광역시 중구', '대전광역시 대덕구', '대전광역시 서구', '전라북도 무주군'] | 총 거리: 75.06 km | 총 시간: 1.0시간 24분 | 총 가중치: 0.3068422776445338 | threshold: 1.40\n", - "최적의 셔틀 노선: ['대전광역시 유성구', '대전광역시 서구', '대전광역시 대덕구', '전라북도 무주군'] | 총 거리: 71.59 km | 총 시간: 1.0시간 17분 | 총 가중치: 0.3068422776445338 | threshold: 1.50\n", - "최적의 셔틀 노선: ['대전광역시 유성구', '대전광역시 서구', '대전광역시 중구', '전라북도 무주군'] | 총 거리: 64.15 km | 총 시간: 1.0시간 21분 | 총 가중치: 0.3084769194116943 | threshold: 1.50\n", - "최적의 셔틀 노선: ['대전광역시 유성구', '대전광역시 대덕구', '대전광역시 중구', '전라북도 무주군'] | 총 거리: 65.30 km | 총 시간: 1.0시간 19분 | 총 가중치: 0.15521935730171074 | threshold: 1.50\n" - ] - } - ], - "source": [ - "search(daejun, daejun_weights, \"대전\")" - ] - }, - { - "cell_type": "code", - "execution_count": 78, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "지역명: 전라북도 군산시\n", - "관련 행정동코드: [4513000000, 4513025000, 4513031000, 4513032000, 4513033000, 4513034000, 4513035000, 4513036000, 4513037000, 4513038000, 4513039000, 4513040000, 4513051500, 4513053000, 4513055000, 4513056000, 4513060500, 4513064000, 4513065000, 4513066000, 4513067000, 4513068000, 4513069000, 4513070100, 4513070200, 4513070300, 4513071000, 4513072000]\n", - "총 거주인원: 3132379.0 , 20/50/60대 거주인원: 378252.0 \n", - "\n", - "지역명: 전라북도 익산시\n", - "관련 행정동코드: [4514000000, 4514025000, 4514031000, 4514032000, 4514033000, 4514034000, 4514035000, 4514036000, 4514037000, 4514038000, 4514039000, 4514040000, 4514041000, 4514042000, 4514043000, 4514044000, 4514052000, 4514053000, 4514056000, 4514057000, 4514058000, 4514059500, 4514061000, 4514062000, 4514064600, 4514064700, 4514065200, 4514065600, 4514067000, 4514069000]\n", - "총 거주인원: 3328022.0 , 20/50/60대 거주인원: 420440.0 \n", - "\n", - "지역명: 전라북도 전주시 완산구\n", - "관련 행정동코드: [4511100000, 4511151000, 4511153000, 4511160500, 4511163500, 4511165000, 4511166000, 4511167100, 4511167200, 4511168000, 4511169100, 4511169200, 4511170100, 4511170200, 4511170300, 4511171100, 4511171200, 4511171300, 4511171400, 4511173000]\n", - "총 거주인원: 4116105.0 , 20/50/60대 거주인원: 486210.0 \n", - "\n", - "지역명: 전라북도 전주시 덕진구\n", - "관련 행정동코드: [4511300000, 4511352500, 4511354000, 4511355000, 4511356000, 4511357000, 4511358000, 4511359000, 4511360000, 4511361100, 4511361200, 4511362000, 4511364100, 4511364200, 4511365000, 4511366500, 4511367000]\n", - "총 거주인원: 3377434.0 , 20/50/60대 거주인원: 400961.0 \n", - "\n", - "지역명: 전라북도 진안군\n", - "관련 행정동코드: [4572000000, 4572025000, 4572031000, 4572032000, 4572033000, 4572034000, 4572035000, 4572036000, 4572037000, 4572038000, 4572039000, 4572040000]\n", - "총 거주인원: 179814.0 , 20/50/60대 거주인원: 24852.0 \n", - "\n", - "지역명: 전라북도 장수군\n", - "관련 행정동코드: [4574000000, 4574025000, 4574031000, 4574032000, 4574033500, 4574034000, 4574035000, 4574036000]\n", - "총 거주인원: 201626.0 , 20/50/60대 거주인원: 26141.0 \n", - "\n", - "지역명: 전라북도 무주군\n", - "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n", - "총 거주인원: 211731.0 , 20/50/60대 거주인원: 26123.0 \n", - "\n", - "지역명: 전라북도 군산시\n", - "관련 행정동코드: [4513000000, 4513025000, 4513031000, 4513032000, 4513033000, 4513034000, 4513035000, 4513036000, 4513037000, 4513038000, 4513039000, 4513040000, 4513051500, 4513053000, 4513055000, 4513056000, 4513060500, 4513064000, 4513065000, 4513066000, 4513067000, 4513068000, 4513069000, 4513070100, 4513070200, 4513070300, 4513071000, 4513072000]\n", - "총 방문객 수: 14 , 20/50/60대 방문객 수: 14 \n", - "\n", - "지역명: 전라북도 익산시\n", - "관련 행정동코드: [4514000000, 4514025000, 4514031000, 4514032000, 4514033000, 4514034000, 4514035000, 4514036000, 4514037000, 4514038000, 4514039000, 4514040000, 4514041000, 4514042000, 4514043000, 4514044000, 4514052000, 4514053000, 4514056000, 4514057000, 4514058000, 4514059500, 4514061000, 4514062000, 4514064600, 4514064700, 4514065200, 4514065600, 4514067000, 4514069000]\n", - "총 방문객 수: 21 , 20/50/60대 방문객 수: 7 \n", - "\n", - "지역명: 전라북도 전주시 완산구\n", - "관련 행정동코드: [4511100000, 4511151000, 4511153000, 4511160500, 4511163500, 4511165000, 4511166000, 4511167100, 4511167200, 4511168000, 4511169100, 4511169200, 4511170100, 4511170200, 4511170300, 4511171100, 4511171200, 4511171300, 4511171400, 4511173000]\n", - "총 방문객 수: 96 , 20/50/60대 방문객 수: 10 \n", - "\n", - "지역명: 전라북도 전주시 덕진구\n", - "관련 행정동코드: [4511300000, 4511352500, 4511354000, 4511355000, 4511356000, 4511357000, 4511358000, 4511359000, 4511360000, 4511361100, 4511361200, 4511362000, 4511364100, 4511364200, 4511365000, 4511366500, 4511367000]\n", - "총 방문객 수: 127 , 20/50/60대 방문객 수: 47 \n", - "\n", - "지역명: 전라북도 진안군\n", - "관련 행정동코드: [4572000000, 4572025000, 4572031000, 4572032000, 4572033000, 4572034000, 4572035000, 4572036000, 4572037000, 4572038000, 4572039000, 4572040000]\n", - "총 방문객 수: 277 , 20/50/60대 방문객 수: 62 \n", - "\n", - "지역명: 전라북도 장수군\n", - "관련 행정동코드: [4574000000, 4574025000, 4574031000, 4574032000, 4574033500, 4574034000, 4574035000, 4574036000]\n", - "총 방문객 수: 436 , 20/50/60대 방문객 수: 160 \n", - "\n", - "지역명: 전라북도 무주군\n", - "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n", - "총 방문객 수: 24957 , 20/50/60대 방문객 수: 4768 \n", - "\n", - "{'전라북도 군산시': 0.16290893515183477, '전라북도 익산시': 0.08364023615032236, '전라북도 전주시 완산구': 0.18079395836979623, '전라북도 전주시 덕진구': 0.23586747596828486, '전라북도 진안군': 0.0749647557263006, '전라북도 장수군': 0.23513594628281875, '전라북도 무주군': 0.026688692350642314}\n", - "전북지역 최적의 셔틀 노선\n", - "최적의 셔틀 노선: ['전라북도 전주시 완산구', '전라북도 전주시 덕진구', '전라북도 무주군'] | 총 거리: 75.56 km | 총 시간: 1.0시간 32분 | 총 가중치: 0.23586747596828486 | threshold: 1.20\n", - "최적의 셔틀 노선: ['전라북도 군산시', '전라북도 익산시', '전라북도 무주군'] | 총 거리: 118.16 km | 총 시간: 2.0시간 4분 | 총 가중치: 0.08364023615032236 | threshold: 1.30\n", - "최적의 셔틀 노선: ['전라북도 전주시 덕진구', '전라북도 군산시', '전라북도 무주군'] | 총 거리: 153.42 km | 총 시간: 2.0시간 22분 | 총 가중치: 0.16290893515183477 | threshold: 1.40\n", - "최적의 셔틀 노선: ['전라북도 전주시 덕진구', '전라북도 익산시', '전라북도 무주군'] | 총 거리: 118.14 km | 총 시간: 2.0시간 10분 | 총 가중치: 0.08364023615032236 | threshold: 1.40\n", - "최적의 셔틀 노선: ['전라북도 익산시', '전라북도 전주시 완산구', '전라북도 무주군'] | 총 거리: 104.53 km | 총 시간: 2.0시간 2분 | 총 가중치: 0.18079395836979623 | threshold: 1.50\n", - "최적의 셔틀 노선: ['전라북도 전주시 완산구', '전라북도 군산시', '전라북도 무주군'] | 총 거리: 163.53 km | 총 시간: 2.0시간 29분 | 총 가중치: 0.16290893515183477 | threshold: 1.50\n" - ] - } - ], - "source": [ - "search(jeonbuk, jeonbuk_weights, \"전북\")" - ] - } - ], - "metadata": { - "kernelspec": { - "display_name": "base", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.11.7" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -} diff --git a/dataloader/dataloader.py b/dataloader/dataloader.py index 6c0b054..7f1f4ec 100644 --- a/dataloader/dataloader.py +++ b/dataloader/dataloader.py @@ -4,34 +4,21 @@ import json sys.path.append(os.path.dirname(os.path.abspath(os.path.dirname(__file__)))) -from preprocess.dataload_preprocess import preprocess_od, preprocess_stay +from preprocess.dataload_preprocess import preprocess_od, preprocess_stay, preprocess_address, preprocess_visitor_city # paths 파일 불러오기 with open('config.json', 'r', encoding='utf-8') as f: paths = json.load(f) - -# 'data/raw_data' 경로 설정 -root_dir = paths['root_dir'] -visitor_city = pd.read_csv(os.path.join(root_dir, "city_of_festival_visitors.csv")) # 무주축제 방문객 top 18 지역들 (시군구명,od_cnts,시도명,행정동코드,위도,경도) -address = pd.read_csv(os.path.join(root_dir, "address_with_lon_lat_final.csv")) # 행정동코드 + 위도경도 (행정동코드,시도명,시군구명,읍면동명,동리명,위도,경도) -mooju = set(list(address[address['시군구명'] == '무주군']['행정동코드'])) # 무주군 행정동코드 -other_city = list(address.merge(visitor_city, on=['시도명', '시군구명'])['행정동코드_x']) # 다른 지역들 행정동코드 모음 - -visitor_city['시도 시군구'] = visitor_city['시도명'].fillna('') + ' ' + visitor_city['시군구명'].fillna('') -visitor_city['시도 시군구'] = visitor_city['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리 - -address['시도 시군구'] = address['시도명'].fillna('') + ' ' + address['시군구명'].fillna('') -address['시도 시군구'] = address['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리 - -# raw_data 경로 설정 -od_dir = paths['od_dir'] -stay_dir = paths['stay_dir'] - - -# festival od data load +# 축제기간의 od 데이터 로드 함수 def load_od(): df_od = pd.DataFrame() + od_dir = paths['od_dir'] + + address_df = load_address() + # 무주군의 행정동코드 추출 + mooju = set(address_df[address_df['시군구명'] == '무주군']['행정동코드']) + for dirpath, dirnames, filenames in os.walk(od_dir): for filename in tqdm(filenames, desc="load od data", unit="file"): if filename.endswith('.csv'): @@ -55,9 +42,10 @@ def load_od(): df_od = pd.concat([df_od, globals()[f'df_{mmdd_str}']]) return df_od -# festival stay data load +# stay 데이터 로드 함수 def load_stay(): df_stay = pd.DataFrame() + stay_dir = paths['stay_dir'] for dirpath, dirnames, filenames in os.walk(stay_dir): for filename in tqdm(filenames, desc="load stay data", unit="file"): if filename.endswith('.csv'): @@ -79,4 +67,24 @@ def load_stay(): # 동적으로 변수 생성 (예: df_0902) globals()[f'df_{mmdd_str}'] = filtered_data df_stay = pd.concat([df_stay, globals()[f'df_{mmdd_str}']]) - return df_stay \ No newline at end of file + return df_stay + +# address 데이터 로드 함수 +def load_address(): + address_path = os.path.join(paths['root_dir'], "address_with_lon_lat_final.csv") + address_df = pd.read_csv(address_path) + + address_df = preprocess_address(address_df) + + return address_df + + + +# visitor_city 데이터 로드 함수 +def load_visitor_city(): + visitor_city_path = os.path.join(paths['root_dir'], "city_of_festival_visitors.csv") + visitor_city_df = pd.read_csv(visitor_city_path) + + visitor_city_df = preprocess_visitor_city(visitor_city_df) + + return visitor_city_df \ No newline at end of file diff --git a/func/weight_by_region.py b/func/weight_by_region.py index 30b71bf..14d6c1e 100644 --- a/func/weight_by_region.py +++ b/func/weight_by_region.py @@ -5,44 +5,42 @@ sys.path.append(os.path.dirname(os.path.abspath(os.path.dirname(__file__)))) -from dataloader.dataloader import load_od, load_stay +from dataloader.dataloader import load_od, load_stay, load_address -# 'data/raw_data' 경로 설정 -with open('config.json', 'r', encoding='utf-8') as f: - paths = json.load(f) - -root_dir = paths['root_dir'] -address = pd.read_csv(os.path.join(root_dir, "address_with_lon_lat_final.csv")) # 행정동코드 + 위도경도 (행정동코드,시도명,시군구명,읍면동명,동리명,위도,경도) -address['시도 시군구'] = address['시도명'].fillna('') + ' ' + address['시군구명'].fillna('') -address['시도 시군구'] = address['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리 - - -#### -df_od = load_od() -df_stay = load_stay() +def total_number_of_residents_by_region(): + df_stay = load_stay() + + # 지역별 전체 거주민 수 + df_stay_all = df_stay.groupby(['hdong_cd', 'date'])['stay_cnts'].sum().reset_index() # 날짜별 거주인구 합산 + avg_stay_cnts_all = round(df_stay_all.groupby('hdong_cd')['stay_cnts'].mean().reset_index(), 0) # 하루 평균 거주인구 -# 지역별 전체 거주민 수 -df_stay_all = df_stay.groupby(['hdong_cd', 'date'])['stay_cnts'].sum().reset_index() # 날짜별 거주인구 합산 -avg_stay_cnts_all = round(df_stay_all.groupby('hdong_cd')['stay_cnts'].mean().reset_index(), 0) # 하루 평균 거주인구 + # 지역별 20대,50대,60대 거주민 수 + df_stay_age = df_stay[df_stay['age'].isin([2,5,6])] # 날짜별 20대 거주인구 + avg_stay_cnts_age = round(df_stay_age.groupby(['hdong_cd'])['stay_cnts'].mean().reset_index(), 0) # 하루 평균 20대 거주인구 -# 지역별 20대,50대,60대 거주민 수 -df_stay_age = df_stay[df_stay['age'].isin([2,5,6])] # 날짜별 20대 거주인구 -avg_stay_cnts_age = round(df_stay_age.groupby(['hdong_cd'])['stay_cnts'].mean().reset_index(), 0) # 하루 평균 20대 거주인구 + return avg_stay_cnts_all, avg_stay_cnts_age -# 지역별 무주축제 방문객 인원수 -df_od_group = df_od.groupby(['origin_hdong_cd', 'date', 'age'])['od_cnts'].sum().reset_index() -df_od_all = df_od_group.groupby(['origin_hdong_cd', 'date'])['od_cnts'].sum().reset_index() # 날짜별 방문객수 합산 -sum_od_cnts_all = round(df_od_all.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index(), 0) # 해당 지역에서 온 전체 방문객수 +def number_of_visitors_to_Muju_by_region(): + df_od = load_od() + + # 지역별 무주축제 방문객 인원수 + df_od_group = df_od.groupby(['origin_hdong_cd', 'date', 'age'])['od_cnts'].sum().reset_index() + df_od_all = df_od_group.groupby(['origin_hdong_cd', 'date'])['od_cnts'].sum().reset_index() # 날짜별 방문객수 합산 + sum_od_cnts_all = round(df_od_all.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index(), 0) # 해당 지역에서 온 전체 방문객수 -# 지역별 20대,50대,60대 무주축제방문객 수 -df_od_age = df_od_group[df_od_group['age'].isin([2,5,6])] -sum_od_cnts_age = round(df_od_age.groupby('origin_hdong_cd')['od_cnts'].sum().reset_index(), 0) + # 지역별 20대,50대,60대 무주축제방문객 수 + df_od_age = df_od_group[df_od_group['age'].isin([2,5,6])] + sum_od_cnts_age = round(df_od_age.groupby('origin_hdong_cd')['od_cnts'].sum().reset_index(), 0) + return sum_od_cnts_all, sum_od_cnts_age # 각 지역 거주인원 def get_residents_num(lst): + address = load_address() + avg_stay_cnts_all, avg_stay_cnts_age = total_number_of_residents_by_region() residents_num = [] residents_num_256 = [] + for name in lst: #print("지역명:", name) codes = address[address['시도 시군구'] == name]['행정동코드'].unique().tolist() @@ -64,8 +62,11 @@ def get_residents_num(lst): # 각 지역 방문객 def get_visitors_num(lst): + address = load_address() + sum_od_cnts_all, sum_od_cnts_age = number_of_visitors_to_Muju_by_region() visitors_num = [] visitors_num_256 = [] + for name in lst: #print("지역명:", name) codes = address[address['시도 시군구'] == name]['행정동코드'].unique().tolist() @@ -114,8 +115,5 @@ def get_weights(nodes, weights): stations = {nodes: weight for nodes, weight in zip(nodes, softmax_weights)} stations['전라북도 무주군'] = 0 # 무주군은 목적지이므로 가중치 0 으로 설정 - - #print("정류장 가중치") - #print(stations) return stations \ No newline at end of file diff --git a/preprocess/dataload_preprocess.py b/preprocess/dataload_preprocess.py index 321254d..14dd01f 100644 --- a/preprocess/dataload_preprocess.py +++ b/preprocess/dataload_preprocess.py @@ -29,4 +29,21 @@ def preprocess_stay(df): filtered_df = df[(df['purpose'] == 0)] grouped_residents = filtered_df.groupby(['hdong_cd', 'date', 'age'])['stay_cnts'].sum().reset_index() - return grouped_residents \ No newline at end of file + return grouped_residents + + +def preprocess_address(df): + + # 전처리: 시도명과 시군구명 결합 및 null 값 처리 + df['시도 시군구'] = df['시도명'].fillna('') + ' ' + df['시군구명'].fillna('') + df['시도 시군구'] = df['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리 + + return df + +def preprocess_visitor_city(df): + + # 전처리: 시도명과 시군구명 결합 및 null 값 처리 + df['시도 시군구'] = df['시도명'].fillna('') + ' ' + df['시군구명'].fillna('') + df['시도 시군구'] = df['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리 + + return df \ No newline at end of file diff --git a/visualization/chanwoong.ipynb b/visualization/chanwoong.ipynb deleted file mode 100644 index 2fe3e8d..0000000 --- a/visualization/chanwoong.ipynb +++ /dev/null @@ -1,946 +0,0 @@ -{ - "cells": [ - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "## 내/외부인 비율 파이차트" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### 축제 방문객 내/외부인 분포 파악" - ] - }, - { - "cell_type": "code", - "execution_count": 3, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "데이터프레임 df_0901가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0902가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0903가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0904가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0905가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0906가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0907가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0908가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0909가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0910가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0911가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0912가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0913가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0914가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0915가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0916가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0917가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0918가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0919가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0920가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0921가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0922가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0923가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0924가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0925가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0926가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0927가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0928가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0929가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_0930가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1001가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1002가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1003가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1004가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1005가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1006가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1007가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1008가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1009가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1010가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1011가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1012가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1013가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1014가 생성되었고, 기존데이터프레임에 포함합니다.\n", - "데이터프레임 df_1015가 생성되었고, 기존데이터프레임에 포함합니다.\n" - ] - } - ], - "source": [ - "import os\n", - "import pandas as pd\n", - "\n", - "# 'data/raw_data' 경로 설정\n", - "root_dir = '../data/raw_data'\n", - "df = pd.DataFrame()\n", - "address = pd.read_csv(\"../data/address_with_lon_lat_final.csv\")\n", - "mooju = set(list(address[address['시군구명'] == '무주군']['행정동코드']))\n", - "\n", - "# 전처리코드는 모두 여기에\n", - "def preprocess(df):\n", - " # dest_hdong_cd 값이 축제가 열리는 곳인 무주군 데이터만 필터링\n", - " filtered_df = df[df['dest_hdong_cd'].isin(mooju)]\n", - "\n", - " #filtered_df = df[df['dest_hdong_cd'] == 4573025000]\n", - " \"\"\"#filtered_df = df[df['dest_hdong_cd'] == 4573025000]\n", - " df = pd.merge(df, address[['행정동코드', '시도명', '시군구명']], \n", - " left_on='dest_hdong_cd', right_on='행정동코드', how='left')\n", - "\n", - " # 병합 후 불필요한 '행정동코드' 컬럼 제거 (필요에 따라)\n", - " df = df.drop(columns=['행정동코드'])\n", - "\n", - " filtered_df = df[df['시군구명'] == '무주군']\n", - "\n", - " filtered_df = filtered_df.drop(columns=['시도명', '시군구명'])\"\"\"\n", - "\n", - " # 타 지역에서 온 데이터만 필터링\n", - " #filtered_df = filtered_df[filtered_df['origin_hdong_cd'] != filtered_df['dest_hdong_cd']]\n", - " #filtered_df = filtered_df[~filtered_df['origin_hdong_cd'].isin(mooju)]\n", - "\n", - " # 체류목적이 3(쇼핑여가), 4(기타), 5(여행) 인경우만 \n", - " filtered_df = filtered_df[(filtered_df['dest_purpose'] == 3) | \n", - " (filtered_df['dest_purpose'] == 4) | \n", - " (filtered_df['dest_purpose'] == 5)]\n", - "\n", - " return filtered_df\n", - "\n", - "# 'od'로 시작하는 폴더 내의 모든 CSV 파일 처리\n", - "for dirpath, dirnames, filenames in os.walk(root_dir):\n", - " if os.path.basename(dirpath).startswith('od'):\n", - " for filename in filenames:\n", - " if filename.endswith('.csv'):\n", - " # 파일 이름에서 날짜 추출\n", - " date_str = filename.split('_')[1]\n", - " \n", - " # 파일 경로 설정 및 CSV 읽기\n", - " file_path = os.path.join(dirpath, filename)\n", - " csv_data = pd.read_csv(file_path)\n", - " \n", - " # 전처리\n", - " filtered_data = preprocess(csv_data)\n", - "\n", - " # 날짜에서 월일(MMDD) 부분 추출\n", - " mmdd_str = date_str[4:] # 'YYYYMMDD'에서 마지막 네 자리 'MMDD' 추출\n", - " \n", - " # 동적으로 변수 생성 (예: df_0901)\n", - " globals()[f'df_{mmdd_str}'] = filtered_data\n", - " \n", - " # 데이터프레임 이름 출력 (예: df_0901)\n", - " print(f\"데이터프레임 df_{mmdd_str}가 생성되었고, 기존데이터프레임에 포함합니다.\")\n", - " df = pd.concat([df, globals()[f'df_{mmdd_str}']])" - ] - }, - { - "cell_type": "code", - "execution_count": 74, - "metadata": {}, - "outputs": [], - "source": [ - "festival_df = df[(df['date'] >= 20230902) & (df['date'] <= 20230910)]\n", - "festival_df_grouped = festival_df.groupby('date')['od_cnts'].sum().reset_index()\n", - "\n", - "# 'date'와 'origin_hdong_cd'을 기준으로 'od_cnts'를 집계\n", - "festival_df_grouped_2 = festival_df.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index()\n", - "\n", - "# df_1의 'origin_hdong_cd'와 df_2의 '행정동코드'를 기준으로 병합\n", - "festival_df_grouped_2 = pd.merge(festival_df_grouped_2, address[['행정동코드', '시도명', '시군구명']], \n", - " left_on='origin_hdong_cd', right_on='행정동코드', how='left')\n", - "\n", - "# 병합 후 불필요한 '행정동코드' 컬럼 제거 (필요에 따라)\n", - "festival_df_grouped_2 = festival_df_grouped_2.drop(columns=['행정동코드'])\n", - "\n", - "festival_df_grouped_2.drop_duplicates(inplace=True)" - ] - }, - { - "cell_type": "code", - "execution_count": 75, - "metadata": {}, - "outputs": [], - "source": [ - "# '시도명'별로 'od_cnts' 합계를 구한 후 'od_cnts' 기준으로 정렬\n", - "festival_df_grouped_sido = festival_df_grouped_2.groupby('시도명')['od_cnts'].sum().reset_index()\n", - "\n", - "# 'od_cnts' 기준으로 내림차순 정렬\n", - "festival_df_grouped_sido = festival_df_grouped_sido.sort_values(by='od_cnts', ascending=False)" - ] - }, - { - "cell_type": "code", - "execution_count": 76, - "metadata": {}, - "outputs": [], - "source": [ - "# '시도명'별로 'od_cnts' 합계를 구한 후 'od_cnts' 기준으로 정렬\n", - "junbok_filtered = festival_df_grouped_2[festival_df_grouped_2['시도명'] == '전라북도']\n", - "festival_df_grouped_junbok = junbok_filtered.groupby('시군구명')['od_cnts'].sum().reset_index()\n", - "\n", - "# 'od_cnts' 기준으로 내림차순 정렬\n", - "festival_df_grouped_junbok = festival_df_grouped_junbok.sort_values(by='od_cnts', ascending=False)" - ] - }, - { - "cell_type": "code", - "execution_count": 77, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
내/외부인od_cnts
0외부인35542
1내부인8863
\n", - "
" - ], - "text/plain": [ - " 내/외부인 od_cnts\n", - "0 외부인 35542\n", - "1 내부인 8863" - ] - }, - "execution_count": 77, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# 내부인(첫 번째 행)과 외부인(나머지 행)의 데이터프레임 생성\n", - "internal_df = festival_df_grouped_junbok.iloc[[0]].copy() # .copy() 사용하여 SettingWithCopyWarning 방지\n", - "internal_df['시군구명'] = '외부인'\n", - "\n", - "external_sum = festival_df_grouped_junbok.iloc[1:]['od_cnts'].sum()\n", - "external_df = pd.DataFrame([['내부인', external_sum]], columns=['시군구명', 'od_cnts'])\n", - "\n", - "# 최종 데이터프레임 합치기\n", - "in_out_df = pd.concat([internal_df, external_df]).reset_index(drop=True)\n", - "in_out_df.columns = ['내/외부인', 'od_cnts']\n", - "\n", - "in_out_df" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### 외부인 세부분포 파악" - ] - }, - { - "cell_type": "code", - "execution_count": 78, - "metadata": {}, - "outputs": [], - "source": [ - "#festival_df_grouped_sido = festival_df_grouped_sido[1:]\n", - "festival_df_grouped_junbok = festival_df_grouped_junbok.iloc[1:]" - ] - }, - { - "cell_type": "code", - "execution_count": 79, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "전라북도\n", - " 시군구명 od_cnts 시도명\n", - "4 무주군 35542 전라북도\n", - "11 전주시 덕진구 2834 전라북도\n", - "12 전주시 완산구 1561 전라북도\n", - "10 장수군 1139 전라북도\n", - "8 익산시 772 전라북도\n", - "14 진안군 704 전라북도\n", - "1 군산시 592 전라북도\n", - "7 완주군 488 전라북도\n", - "3 남원시 259 전라북도\n", - "2 김제시 141 전라북도\n", - "13 정읍시 123 전라북도\n", - "9 임실군 109 전라북도\n", - "6 순창군 66 전라북도\n", - "0 고창군 54 전라북도\n", - "5 부안군 21 전라북도\n", - "\n", - "대전광역시\n", - " 시군구명 od_cnts 시도명\n", - "2 서구 1813 대전광역시\n", - "3 유성구 1379 대전광역시\n", - "1 동구 1207 대전광역시\n", - "4 중구 776 대전광역시\n", - "0 대덕구 562 대전광역시\n", - "\n", - "경상남도\n", - " 시군구명 od_cnts 시도명\n", - "1 거창군 658 경상남도\n", - "9 진주시 560 경상남도\n", - "16 통영시 384 경상남도\n", - "0 거제시 374 경상남도\n", - "19 함양군 323 경상남도\n", - "3 김해시 179 경상남도\n", - "5 사천시 131 경상남도\n", - "6 산청군 121 경상남도\n", - "14 창원시 의창구 115 경상남도\n", - "13 창원시 성산구 81 경상남도\n", - "11 창원시 마산합포구 70 경상남도\n", - "20 합천군 49 경상남도\n", - "18 함안군 43 경상남도\n", - "4 남해군 35 경상남도\n", - "12 창원시 마산회원구 31 경상남도\n", - "7 양산시 27 경상남도\n", - "17 하동군 15 경상남도\n", - "10 창녕군 14 경상남도\n", - "2 고성군 13 경상남도\n", - "15 창원시 진해구 7 경상남도\n", - "8 의령군 5 경상남도\n", - "\n", - "충청남도\n", - " 시군구명 od_cnts 시도명\n", - "2 금산군 882 충청남도\n", - "11 천안시 동남구 310 충청남도\n", - "12 천안시 서북구 265 충청남도\n", - "1 공주시 170 충청남도\n", - "10 예산군 153 충청남도\n", - "3 논산시 148 충청남도\n", - "9 아산시 142 충청남도\n", - "0 계룡시 125 충청남도\n", - "13 홍성군 52 충청남도\n", - "7 서산시 47 충청남도\n", - "6 부여군 41 충청남도\n", - "4 당진시 40 충청남도\n", - "5 보령시 32 충청남도\n", - "8 서천군 6 충청남도\n", - "\n", - "충청북도\n", - " 시군구명 od_cnts 시도명\n", - "3 영동군 1084 충청북도\n", - "10 청주시 흥덕구 230 충청북도\n", - "8 청주시 서원구 217 충청북도\n", - "4 옥천군 211 충청북도\n", - "7 청주시 상당구 194 충청북도\n", - "9 청주시 청원구 185 충청북도\n", - "5 음성군 60 충청북도\n", - "6 진천군 55 충청북도\n", - "2 보은군 53 충청북도\n", - "11 충주시 12 충청북도\n", - "1 단양군 7 충청북도\n", - "0 괴산군 6 충청북도\n", - "\n", - "경기도\n", - " 시군구명 od_cnts 시도명\n", - "34 화성시 202 경기도\n", - "30 이천시 133 경기도\n", - "31 평택시 132 경기도\n", - "26 용인시 기흥구 126 경기도\n", - "7 남양주시 123 경기도\n", - "33 하남시 99 경기도\n", - "10 성남시 분당구 84 경기도\n", - "0 고양시 덕양구 71 경기도\n", - "28 용인시 처인구 66 경기도\n", - "4 구리시 63 경기도\n", - "9 부천시 57 경기도\n", - "20 안성시 56 경기도\n", - "2 광명시 49 경기도\n", - "19 안산시 상록구 49 경기도\n", - "3 광주시 48 경기도\n", - "14 수원시 영통구 48 경기도\n", - "24 여주시 46 경기도\n", - "13 수원시 권선구 45 경기도\n", - "15 수원시 장안구 40 경기도\n", - "17 시흥시 38 경기도\n", - "25 오산시 37 경기도\n", - "5 군포시 33 경기도\n", - "27 용인시 수지구 31 경기도\n", - "12 성남시 중원구 20 경기도\n", - "23 양주시 19 경기도\n", - "29 의정부시 18 경기도\n", - "1 과천시 18 경기도\n", - "18 안산시 단원구 16 경기도\n", - "21 안양시 동안구 12 경기도\n", - "22 안양시 만안구 12 경기도\n", - "16 수원시 팔달구 12 경기도\n", - "6 김포시 12 경기도\n", - "11 성남시 수정구 6 경기도\n", - "32 포천시 6 경기도\n", - "8 동두천시 5 경기도\n", - "\n", - "대구광역시\n", - " 시군구명 od_cnts 시도명\n", - "1 달서구 656 대구광역시\n", - "2 달성군 335 대구광역시\n", - "4 북구 285 대구광역시\n", - "6 수성구 163 대구광역시\n", - "3 동구 126 대구광역시\n", - "5 서구 82 대구광역시\n", - "7 중구 27 대구광역시\n", - "0 남구 12 대구광역시\n", - "\n", - "경상북도\n", - " 시군구명 od_cnts 시도명\n", - "4 김천시 568 경상북도\n", - "3 구미시 393 경상북도\n", - "15 포항시 북구 146 경상북도\n", - "0 경산시 133 경상북도\n", - "13 칠곡군 117 경상북도\n", - "1 경주시 94 경상북도\n", - "7 안동시 46 경상북도\n", - "6 성주군 39 경상북도\n", - "8 영양군 29 경상북도\n", - "14 포항시 남구 28 경상북도\n", - "2 고령군 19 경상북도\n", - "10 예천군 14 경상북도\n", - "11 의성군 12 경상북도\n", - "12 청도군 12 경상북도\n", - "9 영천시 11 경상북도\n", - "5 상주시 5 경상북도\n", - "\n", - "광주광역시\n", - " 시군구명 od_cnts 시도명\n", - "0 광산구 477 광주광역시\n", - "4 서구 245 광주광역시\n", - "3 북구 223 광주광역시\n", - "1 남구 138 광주광역시\n", - "2 동구 9 광주광역시\n", - "\n", - "세종특별자치시\n", - " 시도명 od_cnts\n", - "0 세종특별자치시 999\n", - "\n", - "전라남도\n", - " 시군구명 od_cnts 시도명\n", - "11 여수시 142 전라남도\n", - "3 광양시 111 전라남도\n", - "10 순천시 103 전라남도\n", - "7 목포시 61 전라남도\n", - "5 나주시 54 전라남도\n", - "8 무안군 44 전라남도\n", - "6 담양군 24 전라남도\n", - "9 보성군 19 전라남도\n", - "13 장성군 18 전라남도\n", - "1 고흥군 14 전라남도\n", - "14 화순군 12 전라남도\n", - "0 강진군 11 전라남도\n", - "12 영광군 10 전라남도\n", - "2 곡성군 7 전라남도\n", - "4 구례군 5 전라남도\n", - "\n", - "서울특별시\n", - " 시군구명 od_cnts 시도명\n", - "16 송파구 116 서울특별시\n", - "8 노원구 70 서울특별시\n", - "17 영등포구 42 서울특별시\n", - "4 관악구 37 서울특별시\n", - "6 구로구 33 서울특별시\n", - "10 동작구 32 서울특별시\n", - "7 금천구 29 서울특별시\n", - "13 서초구 27 서울특별시\n", - "12 서대문구 26 서울특별시\n", - "1 강동구 26 서울특별시\n", - "0 강남구 23 서울특별시\n", - "3 강서구 21 서울특별시\n", - "11 마포구 19 서울특별시\n", - "15 성북구 18 서울특별시\n", - "18 용산구 12 서울특별시\n", - "20 종로구 10 서울특별시\n", - "5 광진구 9 서울특별시\n", - "9 도봉구 6 서울특별시\n", - "14 성동구 6 서울특별시\n", - "2 강북구 5 서울특별시\n", - "19 은평구 5 서울특별시\n", - "21 중구 5 서울특별시\n", - "\n", - "부산광역시\n", - " 시군구명 od_cnts 시도명\n", - "9 중구 64 부산광역시\n", - "5 부산진구 62 부산광역시\n", - "2 기장군 58 부산광역시\n", - "10 해운대구 42 부산광역시\n", - "0 강서구 40 부산광역시\n", - "4 동래구 40 부산광역시\n", - "7 사하구 24 부산광역시\n", - "1 금정구 14 부산광역시\n", - "3 남구 12 부산광역시\n", - "8 영도구 9 부산광역시\n", - "6 사상구 6 부산광역시\n", - "\n", - "인천광역시\n", - " 시군구명 od_cnts 시도명\n", - "4 서구 132 인천광역시\n", - "1 남동구 72 인천광역시\n", - "5 연수구 24 인천광역시\n", - "6 중구 15 인천광역시\n", - "0 계양구 12 인천광역시\n", - "3 부평구 11 인천광역시\n", - "2 미추홀구 10 인천광역시\n", - "\n", - "강원특별자치도\n", - " 시군구명 od_cnts 시도명\n", - "0 원주시 92 강원특별자치도\n", - "1 인제군 50 강원특별자치도\n", - "\n", - "울산광역시\n", - " 시군구명 od_cnts 시도명\n", - "2 북구 50 울산광역시\n", - "0 남구 25 울산광역시\n", - "3 중구 21 울산광역시\n", - "1 동구 20 울산광역시\n", - "\n" - ] - } - ], - "source": [ - "map_filtered = pd.DataFrame()\n", - "for i in festival_df_grouped_sido['시도명']:\n", - " # '시도명'별로 'od_cnts' 합계를 구한 후 'od_cnts' 기준으로 정렬\n", - " junbok_filtered = festival_df_grouped_2[festival_df_grouped_2['시도명'] == i]\n", - " if i == '세종특별자치시':\n", - " festival_df_grouped_junbok = junbok_filtered.groupby('시도명')['od_cnts'].sum().reset_index()\n", - " else:\n", - " festival_df_grouped_junbok = junbok_filtered.groupby('시군구명')['od_cnts'].sum().reset_index()\n", - " festival_df_grouped_junbok['시도명'] = i\n", - " # 'od_cnts' 기준으로 내림차순 정렬\n", - " festival_df_grouped_junbok = festival_df_grouped_junbok.sort_values(by='od_cnts', ascending=False)\n", - "\n", - " map_filtered = pd.concat([map_filtered, festival_df_grouped_junbok])\n", - " # 결과 출력\n", - " print(i)\n", - " print(festival_df_grouped_junbok)\n", - " print()\n", - "\n", - "#map_filtered.drop(columns=['시도명'], inplace=True)\n" - ] - }, - { - "cell_type": "code", - "execution_count": 80, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
시도명od_cnts
13전라북도44405
6대전광역시5737
2경상남도3235
14충청남도2413
15충청북도2314
1경기도1832
5대구광역시1686
3경상북도1666
4광주광역시1092
9세종특별자치시999
12전라남도635
8서울특별시577
7부산광역시371
11인천광역시276
0강원특별자치도142
10울산광역시116
\n", - "
" - ], - "text/plain": [ - " 시도명 od_cnts\n", - "13 전라북도 44405\n", - "6 대전광역시 5737\n", - "2 경상남도 3235\n", - "14 충청남도 2413\n", - "15 충청북도 2314\n", - "1 경기도 1832\n", - "5 대구광역시 1686\n", - "3 경상북도 1666\n", - "4 광주광역시 1092\n", - "9 세종특별자치시 999\n", - "12 전라남도 635\n", - "8 서울특별시 577\n", - "7 부산광역시 371\n", - "11 인천광역시 276\n", - "0 강원특별자치도 142\n", - "10 울산광역시 116" - ] - }, - "execution_count": 80, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "od_cnts_sum_by_sido = map_filtered.groupby('시도명')['od_cnts'].sum().reset_index().sort_values(by='od_cnts', ascending=False)\n", - "\n", - "od_cnts_sum_by_sido" - ] - }, - { - "cell_type": "code", - "execution_count": 91, - "metadata": {}, - "outputs": [ - { - "data": { - "text/html": [ - "
\n", - "\n", - "\n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - " \n", - "
시도명od_cnts
2전라북도44405
3충남/대전 지역9149
0전라북도 무주군 (개최지)8863
1기타8393
0경상남도3235
4충청북도2314
\n", - "
" - ], - "text/plain": [ - " 시도명 od_cnts\n", - "2 전라북도 44405\n", - "3 충남/대전 지역 9149\n", - "0 전라북도 무주군 (개최지) 8863\n", - "1 기타 8393\n", - "0 경상남도 3235\n", - "4 충청북도 2314" - ] - }, - "execution_count": 91, - "metadata": {}, - "output_type": "execute_result" - } - ], - "source": [ - "# 대전광역시, 충청남도, 세종특별자치시를 '충남/대전 지역'으로 묶기\n", - "od_cnts_sum_by_sido['시도명'] = od_cnts_sum_by_sido['시도명'].replace({\n", - " '대전광역시': '충남/대전 지역', \n", - " '충청남도': '충남/대전 지역', \n", - " '세종특별자치시': '충남/대전 지역'\n", - "})\n", - "\n", - "# 시도명별 od_cnts 합계 계산\n", - "od_cnts_sum_grouped = od_cnts_sum_by_sido.groupby('시도명')['od_cnts'].sum().reset_index()\n", - "\n", - "# od_cnts 값이 2000 미만인 항목을 '기타'로 묶기\n", - "od_cnts_sum_grouped['시도명'] = od_cnts_sum_grouped['시도명'].where(od_cnts_sum_grouped['od_cnts'] >= 2000, '기타')\n", - "\n", - "\n", - "# 시도명별 od_cnts 합계 계산\n", - "od_cnts_sum_grouped = od_cnts_sum_grouped.groupby('시도명')['od_cnts'].sum().reset_index()\n", - "new_data = pd.DataFrame({'시도명': ['전라북도 무주군 (개최지)'], 'od_cnts': [8863]})\n", - "od_cnts_sum_grouped = pd.concat([od_cnts_sum_grouped, new_data]).sort_values(by='od_cnts', ascending=False)\n", - "od_cnts_sum_grouped" - ] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [ - "### 내/외부인 비율 시각화" - ] - }, - { - "cell_type": "code", - "execution_count": 92, - "metadata": {}, - "outputs": [ - { - "data": { - "image/png": "", - "text/plain": [ - "
" - ] - }, - "metadata": {}, - "output_type": "display_data" - } - ], - "source": [ - "import pandas as pd\n", - "import matplotlib.pyplot as plt\n", - "\n", - "\n", - "plt.rcParams['font.family'] ='Malgun Gothic'\n", - "plt.rcParams['axes.unicode_minus'] =False\n", - "\n", - "# 서브플롯 생성\n", - "fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 6))\n", - "\n", - "# 왼쪽 그래프: in_out_df (30도 회전)\n", - "ax1.pie(in_out_df['od_cnts'], \n", - " labels=in_out_df['내/외부인'], \n", - " autopct='%1.1f%%', \n", - " startangle=210, \n", - " colors=['#ff7f0e', '#1f77b4']) # 내부인: 주황색, 외부인: 파란색\n", - "ax1.set_title('내/외부인 비율')\n", - "\n", - "# 오른쪽 그래프: od_cnts_sum_grouped\n", - "ax2.pie(od_cnts_sum_grouped['od_cnts'], labels=od_cnts_sum_grouped['시도명'], autopct='%1.1f%%', startangle=90, colors=plt.cm.tab20.colors)\n", - "ax2.set_title('시도별 세부 비율')\n", - "\n", - "\n", - "# 그래프 표시\n", - "plt.tight_layout()\n", - "plt.show()\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [ - "map_filtered = pd.DataFrame()\n", - "for i in festival_df_grouped_sido['시도명']:\n", - " # '시도명'별로 'od_cnts' 합계를 구한 후 'od_cnts' 기준으로 정렬\n", - " junbok_filtered = festival_df_grouped_2[festival_df_grouped_2['시도명'] == i]\n", - " if i == '세종특별자치시':\n", - " festival_df_grouped_junbok = junbok_filtered.groupby('시도명')['od_cnts'].sum().reset_index()\n", - " else:\n", - " festival_df_grouped_junbok = junbok_filtered.groupby('시군구명')['od_cnts'].sum().reset_index()\n", - " festival_df_grouped_junbok['시도명'] = i\n", - " # 'od_cnts' 기준으로 내림차순 정렬\n", - " festival_df_grouped_junbok = festival_df_grouped_junbok.sort_values(by='od_cnts', ascending=False)\n", - "\n", - " map_filtered = pd.concat([map_filtered, festival_df_grouped_junbok[festival_df_grouped_junbok['od_cnts'] >= 500]])\n", - " # 결과 출력\n", - " print(i)\n", - " print(festival_df_grouped_junbok[festival_df_grouped_junbok['od_cnts'] >= 500])\n", - " print()\n", - "\n", - "#map_filtered.drop(columns=['시도명'], inplace=True)\n" - ] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "code", - "execution_count": null, - "metadata": {}, - "outputs": [], - "source": [] - }, - { - "cell_type": "markdown", - "metadata": {}, - "source": [] - } - ], - "metadata": { - "kernelspec": { - "display_name": "Python 3", - "language": "python", - "name": "python3" - }, - "language_info": { - "codemirror_mode": { - "name": "ipython", - "version": 3 - }, - "file_extension": ".py", - "mimetype": "text/x-python", - "name": "python", - "nbconvert_exporter": "python", - "pygments_lexer": "ipython3", - "version": "3.10.4" - } - }, - "nbformat": 4, - "nbformat_minor": 2 -}