diff --git a/best_shuttle_bus_route.ipynb b/best_shuttle_bus_route.ipynb
deleted file mode 100644
index 3d7ed0a..0000000
--- a/best_shuttle_bus_route.ipynb
+++ /dev/null
@@ -1,2317 +0,0 @@
-{
- "cells": [
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "# 최적 셔틀버스 노선 탐색"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "## 데이터 준비"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 54,
- "metadata": {},
- "outputs": [],
- "source": [
- "import os\n",
- "import pandas as pd\n",
- "\n",
- "# 'data/raw_data' 경로 설정\n",
- "root_dir = 'data/'\n",
- "visitor_city = pd.read_csv(os.path.join(root_dir, \"city_of_festival_visitors.csv\")) # 무주축제 방문객 top 18 지역들 (시군구명,od_cnts,시도명,행정동코드,위도,경도)\n",
- "address = pd.read_csv(os.path.join(root_dir, \"address_with_lon_lat_final.csv\")) # 행정동코드 + 위도경도 (행정동코드,시도명,시군구명,읍면동명,동리명,위도,경도)\n",
- "mooju = set(list(address[address['시군구명'] == '무주군']['행정동코드'])) # 무주군 행정동코드\n",
- "other_city = list(address.merge(visitor_city, on=['시도명', '시군구명'])['행정동코드_x']) # 다른 지역들 행정동코드 모음"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 55,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "
\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " 시군구명 | \n",
- " od_cnts | \n",
- " 시도명 | \n",
- " 행정동코드 | \n",
- " 위도 | \n",
- " 경도 | \n",
- " 시도 시군구 | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 전주시 덕진구 | \n",
- " 2834 | \n",
- " 전라북도 | \n",
- " 4511300000 | \n",
- " 35.847561 | \n",
- " 127.117672 | \n",
- " 전라북도 전주시 덕진구 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 서구 | \n",
- " 1813 | \n",
- " 대전광역시 | \n",
- " 3017000000 | \n",
- " 36.355179 | \n",
- " 127.383849 | \n",
- " 대전광역시 서구 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 전주시 완산구 | \n",
- " 1561 | \n",
- " 전라북도 | \n",
- " 4511100000 | \n",
- " 35.795512 | \n",
- " 127.132447 | \n",
- " 전라북도 전주시 완산구 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 유성구 | \n",
- " 1379 | \n",
- " 대전광역시 | \n",
- " 3020000000 | \n",
- " 36.362073 | \n",
- " 127.356410 | \n",
- " 대전광역시 유성구 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 동구 | \n",
- " 1207 | \n",
- " 대전광역시 | \n",
- " 3011000000 | \n",
- " 35.886500 | \n",
- " 128.635500 | \n",
- " 대전광역시 동구 | \n",
- "
\n",
- " \n",
- "
\n",
- "
"
- ],
- "text/plain": [
- " 시군구명 od_cnts 시도명 행정동코드 위도 경도 시도 시군구\n",
- "0 전주시 덕진구 2834 전라북도 4511300000 35.847561 127.117672 전라북도 전주시 덕진구\n",
- "1 서구 1813 대전광역시 3017000000 36.355179 127.383849 대전광역시 서구\n",
- "2 전주시 완산구 1561 전라북도 4511100000 35.795512 127.132447 전라북도 전주시 완산구\n",
- "3 유성구 1379 대전광역시 3020000000 36.362073 127.356410 대전광역시 유성구\n",
- "4 동구 1207 대전광역시 3011000000 35.886500 128.635500 대전광역시 동구"
- ]
- },
- "execution_count": 55,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "visitor_city['시도 시군구'] = visitor_city['시도명'].fillna('') + ' ' + visitor_city['시군구명'].fillna('')\n",
- "\n",
- "# 양쪽 값이 모두 null인 경우 빈 문자열 처리\n",
- "visitor_city['시도 시군구'] = visitor_city['시도 시군구'].str.strip()\n",
- "visitor_city.head()"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 56,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " 행정동코드 | \n",
- " 시도명 | \n",
- " 시군구명 | \n",
- " 읍면동명 | \n",
- " 동리명 | \n",
- " 위도 | \n",
- " 경도 | \n",
- " 시도 시군구 | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1100000000 | \n",
- " 서울특별시 | \n",
- " NaN | \n",
- " NaN | \n",
- " 서울특별시 | \n",
- " 37.566679 | \n",
- " 126.978291 | \n",
- " 서울특별시 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1111000000 | \n",
- " 서울특별시 | \n",
- " 종로구 | \n",
- " NaN | \n",
- " 종로구 | \n",
- " 37.580695 | \n",
- " 126.982799 | \n",
- " 서울특별시 종로구 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1111051500 | \n",
- " 서울특별시 | \n",
- " 종로구 | \n",
- " 청운효자동 | \n",
- " 세종로 | \n",
- " 37.579997 | \n",
- " 126.976930 | \n",
- " 서울특별시 종로구 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 1111051500 | \n",
- " 서울특별시 | \n",
- " 종로구 | \n",
- " 청운효자동 | \n",
- " 옥인동 | \n",
- " 37.583480 | \n",
- " 126.963850 | \n",
- " 서울특별시 종로구 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 1111051500 | \n",
- " 서울특별시 | \n",
- " 종로구 | \n",
- " 청운효자동 | \n",
- " 누하동 | \n",
- " 37.578998 | \n",
- " 126.967561 | \n",
- " 서울특별시 종로구 | \n",
- "
\n",
- " \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- "
\n",
- " \n",
- " 21772 | \n",
- " 5183035000 | \n",
- " 강원특별자치도 | \n",
- " 양양군 | \n",
- " 강현면 | \n",
- " 정암리 | \n",
- " 38.143050 | \n",
- " 128.607330 | \n",
- " 강원특별자치도 양양군 | \n",
- "
\n",
- " \n",
- " 21773 | \n",
- " 5183035000 | \n",
- " 강원특별자치도 | \n",
- " 양양군 | \n",
- " 강현면 | \n",
- " 용호리 | \n",
- " 38.132320 | \n",
- " 128.610700 | \n",
- " 강원특별자치도 양양군 | \n",
- "
\n",
- " \n",
- " 21774 | \n",
- " 5183035000 | \n",
- " 강원특별자치도 | \n",
- " 양양군 | \n",
- " 강현면 | \n",
- " 전진리 | \n",
- " 38.124830 | \n",
- " 128.624220 | \n",
- " 강원특별자치도 양양군 | \n",
- "
\n",
- " \n",
- " 21775 | \n",
- " 5183035000 | \n",
- " 강원특별자치도 | \n",
- " 양양군 | \n",
- " 강현면 | \n",
- " 물치리 | \n",
- " 38.158083 | \n",
- " 128.608889 | \n",
- " 강원특별자치도 양양군 | \n",
- "
\n",
- " \n",
- " 21776 | \n",
- " 5183035000 | \n",
- " 강원특별자치도 | \n",
- " 양양군 | \n",
- " 강현면 | \n",
- " 적은리 | \n",
- " 38.118555 | \n",
- " 128.598405 | \n",
- " 강원특별자치도 양양군 | \n",
- "
\n",
- " \n",
- "
\n",
- "
21777 rows × 8 columns
\n",
- "
"
- ],
- "text/plain": [
- " 행정동코드 시도명 시군구명 읍면동명 동리명 위도 경도 \\\n",
- "0 1100000000 서울특별시 NaN NaN 서울특별시 37.566679 126.978291 \n",
- "1 1111000000 서울특별시 종로구 NaN 종로구 37.580695 126.982799 \n",
- "2 1111051500 서울특별시 종로구 청운효자동 세종로 37.579997 126.976930 \n",
- "3 1111051500 서울특별시 종로구 청운효자동 옥인동 37.583480 126.963850 \n",
- "4 1111051500 서울특별시 종로구 청운효자동 누하동 37.578998 126.967561 \n",
- "... ... ... ... ... ... ... ... \n",
- "21772 5183035000 강원특별자치도 양양군 강현면 정암리 38.143050 128.607330 \n",
- "21773 5183035000 강원특별자치도 양양군 강현면 용호리 38.132320 128.610700 \n",
- "21774 5183035000 강원특별자치도 양양군 강현면 전진리 38.124830 128.624220 \n",
- "21775 5183035000 강원특별자치도 양양군 강현면 물치리 38.158083 128.608889 \n",
- "21776 5183035000 강원특별자치도 양양군 강현면 적은리 38.118555 128.598405 \n",
- "\n",
- " 시도 시군구 \n",
- "0 서울특별시 \n",
- "1 서울특별시 종로구 \n",
- "2 서울특별시 종로구 \n",
- "3 서울특별시 종로구 \n",
- "4 서울특별시 종로구 \n",
- "... ... \n",
- "21772 강원특별자치도 양양군 \n",
- "21773 강원특별자치도 양양군 \n",
- "21774 강원특별자치도 양양군 \n",
- "21775 강원특별자치도 양양군 \n",
- "21776 강원특별자치도 양양군 \n",
- "\n",
- "[21777 rows x 8 columns]"
- ]
- },
- "execution_count": 56,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "address['시도 시군구'] = address['시도명'].fillna('') + ' ' + address['시군구명'].fillna('')\n",
- "\n",
- "# 양쪽 값이 모두 null인 경우 빈 문자열 처리\n",
- "address['시도 시군구'] = address['시도 시군구'].str.strip()\n",
- "address"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 57,
- "metadata": {},
- "outputs": [
- {
- "name": "stderr",
- "output_type": "stream",
- "text": [
- " 0%| | 0/9 [00:00, ?it/s]"
- ]
- },
- {
- "name": "stderr",
- "output_type": "stream",
- "text": [
- "100%|██████████| 9/9 [00:37<00:00, 4.20s/it]\n"
- ]
- },
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " origin_hdong_cd | \n",
- " dest_hdong_cd | \n",
- " date | \n",
- " start_time | \n",
- " end_time | \n",
- " gender | \n",
- " age | \n",
- " modal | \n",
- " origin_purpose | \n",
- " dest_purpose | \n",
- " od_dist_avg | \n",
- " od_duration_avg | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 1096 | \n",
- " 4311374100 | \n",
- " 4573031000 | \n",
- " 20230902 | \n",
- " 09:00 | \n",
- " 11:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0.0 | \n",
- " 0.0 | \n",
- " 5 | \n",
- " 163782 | \n",
- " 109 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 2269 | \n",
- " 4573033000 | \n",
- " 4573025000 | \n",
- " 20230902 | \n",
- " 20:00 | \n",
- " 20:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 1.0 | \n",
- " 5.0 | \n",
- " 5 | \n",
- " 20247 | \n",
- " 28 | \n",
- " 9 | \n",
- "
\n",
- " \n",
- " 3874 | \n",
- " 4812965000 | \n",
- " 4573034000 | \n",
- " 20230902 | \n",
- " 16:00 | \n",
- " 18:00 | \n",
- " 0 | \n",
- " 4 | \n",
- " 0.0 | \n",
- " 4.0 | \n",
- " 5 | \n",
- " 424072 | \n",
- " 131 | \n",
- " 7 | \n",
- "
\n",
- " \n",
- " 4218 | \n",
- " 4817073000 | \n",
- " 4573032000 | \n",
- " 20230902 | \n",
- " 13:00 | \n",
- " 16:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0.0 | \n",
- " 0.0 | \n",
- " 5 | \n",
- " 119100 | \n",
- " 141 | \n",
- " 9 | \n",
- "
\n",
- " \n",
- " 4773 | \n",
- " 4573032000 | \n",
- " 4573025000 | \n",
- " 20230902 | \n",
- " 17:00 | \n",
- " 19:00 | \n",
- " 0 | \n",
- " 4 | \n",
- " 0.0 | \n",
- " 5.0 | \n",
- " 5 | \n",
- " 128030 | \n",
- " 118 | \n",
- " 9 | \n",
- "
\n",
- " \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- "
\n",
- " \n",
- " 3237279 | \n",
- " 4574036000 | \n",
- " 4573034000 | \n",
- " 20230910 | \n",
- " 12:00 | \n",
- " 12:00 | \n",
- " 0 | \n",
- " 1 | \n",
- " 1.0 | \n",
- " 5.0 | \n",
- " 5 | \n",
- " 38926 | \n",
- " 27 | \n",
- " 5 | \n",
- "
\n",
- " \n",
- " 3238635 | \n",
- " 4573033000 | \n",
- " 4573025000 | \n",
- " 20230910 | \n",
- " 12:00 | \n",
- " 12:00 | \n",
- " 1 | \n",
- " 5 | \n",
- " 0.0 | \n",
- " 5.0 | \n",
- " 5 | \n",
- " 9476 | \n",
- " 13 | \n",
- " 5 | \n",
- "
\n",
- " \n",
- " 3239981 | \n",
- " 4572025000 | \n",
- " 4573033000 | \n",
- " 20230910 | \n",
- " 18:00 | \n",
- " 18:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 0.0 | \n",
- " 5.0 | \n",
- " 5 | \n",
- " 50623 | \n",
- " 33 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 3246027 | \n",
- " 4573025000 | \n",
- " 4573034000 | \n",
- " 20230910 | \n",
- " 11:00 | \n",
- " 12:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 0.0 | \n",
- " 5.0 | \n",
- " 5 | \n",
- " 46949 | \n",
- " 51 | \n",
- " 5 | \n",
- "
\n",
- " \n",
- " 3249613 | \n",
- " 4783025300 | \n",
- " 4573032000 | \n",
- " 20230910 | \n",
- " 10:00 | \n",
- " 11:00 | \n",
- " 0 | \n",
- " 1 | \n",
- " 0.0 | \n",
- " 5.0 | \n",
- " 5 | \n",
- " 218374 | \n",
- " 100 | \n",
- " 5 | \n",
- "
\n",
- " \n",
- "
\n",
- "
4173 rows × 13 columns
\n",
- "
"
- ],
- "text/plain": [
- " origin_hdong_cd dest_hdong_cd date start_time end_time gender \\\n",
- "1096 4311374100 4573031000 20230902 09:00 11:00 1 \n",
- "2269 4573033000 4573025000 20230902 20:00 20:00 0 \n",
- "3874 4812965000 4573034000 20230902 16:00 18:00 0 \n",
- "4218 4817073000 4573032000 20230902 13:00 16:00 1 \n",
- "4773 4573032000 4573025000 20230902 17:00 19:00 0 \n",
- "... ... ... ... ... ... ... \n",
- "3237279 4574036000 4573034000 20230910 12:00 12:00 0 \n",
- "3238635 4573033000 4573025000 20230910 12:00 12:00 1 \n",
- "3239981 4572025000 4573033000 20230910 18:00 18:00 0 \n",
- "3246027 4573025000 4573034000 20230910 11:00 12:00 0 \n",
- "3249613 4783025300 4573032000 20230910 10:00 11:00 0 \n",
- "\n",
- " age modal origin_purpose dest_purpose od_dist_avg \\\n",
- "1096 0 0.0 0.0 5 163782 \n",
- "2269 3 1.0 5.0 5 20247 \n",
- "3874 4 0.0 4.0 5 424072 \n",
- "4218 0 0.0 0.0 5 119100 \n",
- "4773 4 0.0 5.0 5 128030 \n",
- "... ... ... ... ... ... \n",
- "3237279 1 1.0 5.0 5 38926 \n",
- "3238635 5 0.0 5.0 5 9476 \n",
- "3239981 3 0.0 5.0 5 50623 \n",
- "3246027 3 0.0 5.0 5 46949 \n",
- "3249613 1 0.0 5.0 5 218374 \n",
- "\n",
- " od_duration_avg od_cnts \n",
- "1096 109 6 \n",
- "2269 28 9 \n",
- "3874 131 7 \n",
- "4218 141 9 \n",
- "4773 118 9 \n",
- "... ... ... \n",
- "3237279 27 5 \n",
- "3238635 13 5 \n",
- "3239981 33 6 \n",
- "3246027 51 5 \n",
- "3249613 100 5 \n",
- "\n",
- "[4173 rows x 13 columns]"
- ]
- },
- "execution_count": 57,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "from tqdm import tqdm\n",
- "\n",
- "data_frames = []\n",
- "muju_codes = [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n",
- "\n",
- "for i in tqdm(range(2, 11)):\n",
- " # print(f\"{i}번째 \", end=\" \")\n",
- " index = str(i).rjust(2, '0')\n",
- " df_tmp = pd.read_csv(f\"EDA/jiwon/data/od_20230901_10/od_202309{index}_1.csv\")\n",
- " to_muju = df_tmp['dest_hdong_cd'].isin(muju_codes) & (df_tmp['dest_purpose'] == 5)\n",
- " data_frames.append(df_tmp[to_muju])\n",
- "del df_tmp\n",
- "\n",
- "df_od = pd.concat(data_frames, axis=0)\n",
- "df_od"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 58,
- "metadata": {},
- "outputs": [
- {
- "name": "stderr",
- "output_type": "stream",
- "text": [
- "100%|██████████| 9/9 [00:18<00:00, 2.08s/it]\n"
- ]
- },
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " hdong_cd | \n",
- " date | \n",
- " age | \n",
- " stay_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1111051500 | \n",
- " 20230902 | \n",
- " 0 | \n",
- " 15738 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1111051500 | \n",
- " 20230902 | \n",
- " 1 | \n",
- " 26248 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1111051500 | \n",
- " 20230902 | \n",
- " 2 | \n",
- " 21350 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 1111051500 | \n",
- " 20230902 | \n",
- " 3 | \n",
- " 32200 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 1111051500 | \n",
- " 20230902 | \n",
- " 4 | \n",
- " 37772 | \n",
- "
\n",
- " \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- "
\n",
- " \n",
- " 31252 | \n",
- " 5183035000 | \n",
- " 20230910 | \n",
- " 4 | \n",
- " 5202 | \n",
- "
\n",
- " \n",
- " 31253 | \n",
- " 5183035000 | \n",
- " 20230910 | \n",
- " 5 | \n",
- " 7813 | \n",
- "
\n",
- " \n",
- " 31254 | \n",
- " 5183035000 | \n",
- " 20230910 | \n",
- " 6 | \n",
- " 6296 | \n",
- "
\n",
- " \n",
- " 31255 | \n",
- " 5183035000 | \n",
- " 20230910 | \n",
- " 7 | \n",
- " 5745 | \n",
- "
\n",
- " \n",
- " 31256 | \n",
- " 5183035000 | \n",
- " 20230910 | \n",
- " 8 | \n",
- " 2541 | \n",
- "
\n",
- " \n",
- "
\n",
- "
281450 rows × 4 columns
\n",
- "
"
- ],
- "text/plain": [
- " hdong_cd date age stay_cnts\n",
- "0 1111051500 20230902 0 15738\n",
- "1 1111051500 20230902 1 26248\n",
- "2 1111051500 20230902 2 21350\n",
- "3 1111051500 20230902 3 32200\n",
- "4 1111051500 20230902 4 37772\n",
- "... ... ... ... ...\n",
- "31252 5183035000 20230910 4 5202\n",
- "31253 5183035000 20230910 5 7813\n",
- "31254 5183035000 20230910 6 6296\n",
- "31255 5183035000 20230910 7 5745\n",
- "31256 5183035000 20230910 8 2541\n",
- "\n",
- "[281450 rows x 4 columns]"
- ]
- },
- "execution_count": 58,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "data_frames = []\n",
- "for i in tqdm(range(2, 11)):\n",
- " # print(f\"9월 {i}일 \", end=\" \")\n",
- " index = str(i).rjust(2, '0')\n",
- " df_tmp = pd.read_csv(f\"EDA/jiwon/data/stay_20230901_15/stay_202309{index}_1.csv\")\n",
- " residents = df_tmp[(df_tmp['purpose'] == 0)]\n",
- " grouped_residents = residents.groupby(['hdong_cd', 'date', 'age'])['stay_cnts'].sum().reset_index()\n",
- " data_frames.append(grouped_residents)\n",
- "del df_tmp\n",
- "\n",
- "df_stay = pd.concat(data_frames, axis=0)\n",
- "df_stay"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "### 지역별 거주인원"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 59,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " hdong_cd | \n",
- " stay_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1111051500 | \n",
- " 205476.0 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1111053000 | \n",
- " 101129.0 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1111054000 | \n",
- " 38539.0 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 1111055000 | \n",
- " 135173.0 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 1111056000 | \n",
- " 183499.0 | \n",
- "
\n",
- " \n",
- "
\n",
- "
"
- ],
- "text/plain": [
- " hdong_cd stay_cnts\n",
- "0 1111051500 205476.0\n",
- "1 1111053000 101129.0\n",
- "2 1111054000 38539.0\n",
- "3 1111055000 135173.0\n",
- "4 1111056000 183499.0"
- ]
- },
- "execution_count": 59,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# 지역별 전체 거주민 수\n",
- "df_stay_all = df_stay.groupby(['hdong_cd', 'date'])['stay_cnts'].sum().reset_index() # 날짜별 거주인구 합산\n",
- "avg_stay_cnts_all = round(df_stay_all.groupby('hdong_cd')['stay_cnts'].mean().reset_index(), 0) # 하루 평균 거주인구\n",
- "avg_stay_cnts_all.head()"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 60,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " hdong_cd | \n",
- " stay_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1111051500 | \n",
- " 22012.0 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1111053000 | \n",
- " 11963.0 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1111054000 | \n",
- " 5773.0 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 1111055000 | \n",
- " 18550.0 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 1111056000 | \n",
- " 24343.0 | \n",
- "
\n",
- " \n",
- "
\n",
- "
"
- ],
- "text/plain": [
- " hdong_cd stay_cnts\n",
- "0 1111051500 22012.0\n",
- "1 1111053000 11963.0\n",
- "2 1111054000 5773.0\n",
- "3 1111055000 18550.0\n",
- "4 1111056000 24343.0"
- ]
- },
- "execution_count": 60,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# 지역별 20대,50대,60대 거주민 수\n",
- "df_stay_age = df_stay[df_stay['age'].isin([2,5,6])] # 날짜별 20대 거주인구\n",
- "avg_stay_cnts_age = round(df_stay_age.groupby(['hdong_cd'])['stay_cnts'].mean().reset_index(), 0) # 하루 평균 20대 거주인구\n",
- "avg_stay_cnts_age.head()"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "### 지역별 무주축제방문객 인원"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 61,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " origin_hdong_cd | \n",
- " dest_hdong_cd | \n",
- " date | \n",
- " start_time | \n",
- " end_time | \n",
- " gender | \n",
- " age | \n",
- " modal | \n",
- " origin_purpose | \n",
- " dest_purpose | \n",
- " od_dist_avg | \n",
- " od_duration_avg | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 1096 | \n",
- " 4311374100 | \n",
- " 4573031000 | \n",
- " 20230902 | \n",
- " 09:00 | \n",
- " 11:00 | \n",
- " 1 | \n",
- " 0 | \n",
- " 0.0 | \n",
- " 0.0 | \n",
- " 5 | \n",
- " 163782 | \n",
- " 109 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 2269 | \n",
- " 4573033000 | \n",
- " 4573025000 | \n",
- " 20230902 | \n",
- " 20:00 | \n",
- " 20:00 | \n",
- " 0 | \n",
- " 3 | \n",
- " 1.0 | \n",
- " 5.0 | \n",
- " 5 | \n",
- " 20247 | \n",
- " 28 | \n",
- " 9 | \n",
- "
\n",
- " \n",
- " 3874 | \n",
- " 4812965000 | \n",
- " 4573034000 | \n",
- " 20230902 | \n",
- " 16:00 | \n",
- " 18:00 | \n",
- " 0 | \n",
- " 4 | \n",
- " 0.0 | \n",
- " 4.0 | \n",
- " 5 | \n",
- " 424072 | \n",
- " 131 | \n",
- " 7 | \n",
- "
\n",
- " \n",
- "
\n",
- "
"
- ],
- "text/plain": [
- " origin_hdong_cd dest_hdong_cd date start_time end_time gender \\\n",
- "1096 4311374100 4573031000 20230902 09:00 11:00 1 \n",
- "2269 4573033000 4573025000 20230902 20:00 20:00 0 \n",
- "3874 4812965000 4573034000 20230902 16:00 18:00 0 \n",
- "\n",
- " age modal origin_purpose dest_purpose od_dist_avg od_duration_avg \\\n",
- "1096 0 0.0 0.0 5 163782 109 \n",
- "2269 3 1.0 5.0 5 20247 28 \n",
- "3874 4 0.0 4.0 5 424072 131 \n",
- "\n",
- " od_cnts \n",
- "1096 6 \n",
- "2269 9 \n",
- "3874 7 "
- ]
- },
- "execution_count": 61,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "df_od.head(3)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 62,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " origin_hdong_cd | \n",
- " date | \n",
- " age | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1117068500 | \n",
- " 20230908 | \n",
- " 0 | \n",
- " 12 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1120067000 | \n",
- " 20230902 | \n",
- " 4 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1121584000 | \n",
- " 20230902 | \n",
- " 0 | \n",
- " 9 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 1132051100 | \n",
- " 20230909 | \n",
- " 4 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 1135064000 | \n",
- " 20230902 | \n",
- " 0 | \n",
- " 64 | \n",
- "
\n",
- " \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- "
\n",
- " \n",
- " 1703 | \n",
- " 5113066000 | \n",
- " 20230902 | \n",
- " 0 | \n",
- " 12 | \n",
- "
\n",
- " \n",
- " 1704 | \n",
- " 5113067500 | \n",
- " 20230907 | \n",
- " 3 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 1705 | \n",
- " 5113067500 | \n",
- " 20230909 | \n",
- " 3 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 1706 | \n",
- " 5113067500 | \n",
- " 20230909 | \n",
- " 4 | \n",
- " 12 | \n",
- "
\n",
- " \n",
- " 1707 | \n",
- " 5181033000 | \n",
- " 20230908 | \n",
- " 0 | \n",
- " 50 | \n",
- "
\n",
- " \n",
- "
\n",
- "
1708 rows × 4 columns
\n",
- "
"
- ],
- "text/plain": [
- " origin_hdong_cd date age od_cnts\n",
- "0 1117068500 20230908 0 12\n",
- "1 1120067000 20230902 4 6\n",
- "2 1121584000 20230902 0 9\n",
- "3 1132051100 20230909 4 6\n",
- "4 1135064000 20230902 0 64\n",
- "... ... ... ... ...\n",
- "1703 5113066000 20230902 0 12\n",
- "1704 5113067500 20230907 3 6\n",
- "1705 5113067500 20230909 3 6\n",
- "1706 5113067500 20230909 4 12\n",
- "1707 5181033000 20230908 0 50\n",
- "\n",
- "[1708 rows x 4 columns]"
- ]
- },
- "execution_count": 62,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# 그룹화\n",
- "df_od_group = df_od.groupby(['origin_hdong_cd', 'date', 'age'])['od_cnts'].sum().reset_index()\n",
- "df_od_group"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 63,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " origin_hdong_cd | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1117068500 | \n",
- " 12 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1120067000 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1121584000 | \n",
- " 9 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 1132051100 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 1135064000 | \n",
- " 70 | \n",
- "
\n",
- " \n",
- "
\n",
- "
"
- ],
- "text/plain": [
- " origin_hdong_cd od_cnts\n",
- "0 1117068500 12\n",
- "1 1120067000 6\n",
- "2 1121584000 9\n",
- "3 1132051100 6\n",
- "4 1135064000 70"
- ]
- },
- "execution_count": 63,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# 지역별 전체 무주축제방문객 수\n",
- "df_od_all = df_od_group.groupby(['origin_hdong_cd', 'date'])['od_cnts'].sum().reset_index() # 날짜별 방문객수 합산\n",
- "sum_od_cnts_all = round(df_od_all.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index(), 0) # 해당 지역에서 온 전체 방문객수\n",
- "sum_od_cnts_all.head()"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 64,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " origin_hdong_cd | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1135064000 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1138051000 | \n",
- " 5 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1141062000 | \n",
- " 7 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 1141072000 | \n",
- " 14 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 1144060000 | \n",
- " 8 | \n",
- "
\n",
- " \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- "
\n",
- " \n",
- " 310 | \n",
- " 4888034000 | \n",
- " 13 | \n",
- "
\n",
- " \n",
- " 311 | \n",
- " 4888035000 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 312 | \n",
- " 4888037000 | \n",
- " 13 | \n",
- "
\n",
- " \n",
- " 313 | \n",
- " 4888040000 | \n",
- " 17 | \n",
- "
\n",
- " \n",
- " 314 | \n",
- " 4889045000 | \n",
- " 8 | \n",
- "
\n",
- " \n",
- "
\n",
- "
315 rows × 2 columns
\n",
- "
"
- ],
- "text/plain": [
- " origin_hdong_cd od_cnts\n",
- "0 1135064000 6\n",
- "1 1138051000 5\n",
- "2 1141062000 7\n",
- "3 1141072000 14\n",
- "4 1144060000 8\n",
- ".. ... ...\n",
- "310 4888034000 13\n",
- "311 4888035000 6\n",
- "312 4888037000 13\n",
- "313 4888040000 17\n",
- "314 4889045000 8\n",
- "\n",
- "[315 rows x 2 columns]"
- ]
- },
- "execution_count": 64,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# 지역별 20대,50대,60대 무주축제방문객 수\n",
- "df_od_age = df_od_group[df_od_group['age'].isin([2,5,6])]\n",
- "sum_od_cnts_age = round(df_od_age.groupby('origin_hdong_cd')['od_cnts'].sum().reset_index(), 0)\n",
- "sum_od_cnts_age"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "## 함수"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "### 노드 간 정보"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 65,
- "metadata": {},
- "outputs": [],
- "source": [
- "# 시도시군구명으로 위경도 좌표를 반환하는 함수\n",
- "def get_coordinates(lst):\n",
- " coordinates = []\n",
- " for name in lst:\n",
- " try:\n",
- " # '시도 시군구'로 '위도', '경도' 가져옴\n",
- " target = address[address['시도 시군구'] == name][['위도','경도']].iloc[0]\n",
- " x, y = target.iloc[0], target.iloc[1]\n",
- " coordinates.append((x,y))\n",
- " except IndexError:\n",
- " # 해당 '시도 시군구'에 대한 데이터가 없는 경우\n",
- " print(f\"{name} 지역의 위도, 경도 정보가 없습니다.\")\n",
- " return coordinates"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 66,
- "metadata": {},
- "outputs": [],
- "source": [
- "import yaml\n",
- "import requests\n",
- "\n",
- "# api 사용을 위한 key값 가져오기 \n",
- "with open(\"config.yaml\", \"r\") as file:\n",
- " config = yaml.safe_load(file)\n",
- "naver_api_id = config['naver api']['id']\n",
- "naver_api_key = config['naver api']['key']\n",
- "kakao_api_key = config['kakao api']['key']\n",
- "\n",
- "# 네이버 api 요청 함수\n",
- "def naver_request(start, goal):\n",
- " # 요청\n",
- " url = 'https://naveropenapi.apigw.ntruss.com/map-direction/v1/driving'\n",
- " params = {\n",
- " 'goal': f'{goal[1]},{goal[0]}',\n",
- " 'start': f'{start[1]},{start[0]}',\n",
- " }\n",
- " headers = {\n",
- " 'x-ncp-apigw-api-key-id': naver_api_id,\n",
- " 'x-ncp-apigw-api-key': naver_api_key\n",
- " }\n",
- " response = requests.get(url, headers=headers, params=params)\n",
- "\n",
- " # 응답\n",
- " data = response.json()\n",
- " if data['code'] == 0:\n",
- " if data['route']['traoptimal']:\n",
- " summary = data['route']['traoptimal'][0]['summary']\n",
- " distance = summary['distance']\n",
- " duration = summary['duration']\n",
- " return distance, duration\n",
- " else:\n",
- " print(\"응답 에러: 'traoptimal' 데이터가 없습니다.\")\n",
- " return -1, -1\n",
- " else:\n",
- " print(\"요청 실패: \", data['message'])\n",
- " return -1, -1\n",
- "\n",
- "# 카카오 api 요청 함수\n",
- "def kakao_request(start, goal):\n",
- " # 요청\n",
- " url = 'https://apis-navi.kakaomobility.com/v1/directions'\n",
- " params = {\n",
- " 'origin': f'{start[1]},{start[0]}',\n",
- " 'destination': f'{goal[1]},{goal[0]}',\n",
- " 'alternatives': True,\n",
- " }\n",
- " headers = {\n",
- " 'Authorization': f'KakaoAK {kakao_api_key}'\n",
- " }\n",
- " response = requests.get(url, headers=headers, params=params)\n",
- "\n",
- " # 응답\n",
- " if response.status_code == 200:\n",
- " data = response.json()\n",
- " if data['routes']:\n",
- " summary = data['routes'][0]['summary']\n",
- " distance = summary.get('distance')\n",
- " duration = summary.get('duration')\n",
- " return distance, duration\n",
- " else:\n",
- " print(\"응답 에러: 'routes' 데이터가 없습니다.\")\n",
- " return -1, -1\n",
- " else:\n",
- " print(\"요청 실패\")\n",
- " return -1, -1"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 67,
- "metadata": {},
- "outputs": [],
- "source": [
- "# 노드 간 이동시간, 이동거리 테이블 반환하는 함수\n",
- "def get_path_info(coordinates, request_func):\n",
- " n = len(coordinates)\n",
- " distance_table = [[0] * n for _ in range(n)]\n",
- " duration_table = [[0] * n for _ in range(n)]\n",
- "\n",
- " for i in range(n):\n",
- " for j in range(n):\n",
- " if j > i:\n",
- " start = coordinates[i]\n",
- " goal = coordinates[j]\n",
- " distance, duration = request_func(start, goal)\n",
- " distance_table[i][j], distance_table[j][i] = distance, distance\n",
- " duration_table[i][j], duration_table[j][i] = duration, duration\n",
- "\n",
- " return distance_table, duration_table"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "### 가중치"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 68,
- "metadata": {},
- "outputs": [
- {
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "지역명: 세종특별자치시\n",
- "관련 행정동코드: [3600000000, 3611000000, 3611025000, 3611031000, 3611032000, 3611033000, 3611034000, 3611035000, 3611036000, 3611037000, 3611038000, 3611039000, 3611051000, 3611051500, 3611051800, 3611052000, 3611052300, 3611052500, 3611053000, 3611054000, 3611055000, 3611055500, 3611055600, 3611056000, 3611057000, 3611058000]\n",
- "총 거주인원: 3048131.0 , 20/50/60대 거주인원: 290518.0 \n",
- "\n",
- "지역명: 대전광역시 유성구\n",
- "관련 행정동코드: [3020000000, 3020052000, 3020052600, 3020052700, 3020053000, 3020054000, 3020054600, 3020054700, 3020054800, 3020055000, 3020057000, 3020058000, 3020060000, 3020061000]\n",
- "총 거주인원: 3820791.0 , 20/50/60대 거주인원: 424653.0 \n",
- "\n",
- "지역명: 대전광역시 서구\n",
- "관련 행정동코드: [3017000000, 3017051000, 3017052000, 3017053000, 3017053500, 3017054000, 3017055000, 3017055500, 3017056000, 3017057000, 3017057500, 3017058100, 3017058200, 3017058600, 3017058700, 3017058800, 3017059000, 3017059300, 3017059600, 3017059700, 3017060000, 3017063000, 3017064000, 3017065000, 3017066000]\n",
- "총 거주인원: 5536840.0 , 20/50/60대 거주인원: 674439.0 \n",
- "\n",
- "지역명: 대전광역시 대덕구\n",
- "관련 행정동코드: [3023000000, 3023051000, 3023052000, 3023052500, 3023053300, 3023054300, 3023054600, 3023055000, 3023056000, 3023057000, 3023058000, 3023060000, 3023061000]\n",
- "총 거주인원: 2377042.0 , 20/50/60대 거주인원: 306052.0 \n",
- "\n",
- "지역명: 대전광역시 중구\n",
- "관련 행정동코드: [3014000000, 3014053500, 3014055000, 3014056000, 3014057500, 3014060500, 3014062000, 3014063000, 3014064000, 3014065500, 3014067000, 3014068000, 3014069000, 3014070000, 3014071000, 3014072000, 3014073000, 3014074000]\n",
- "총 거주인원: 2922017.0 , 20/50/60대 거주인원: 354956.0 \n",
- "\n",
- "지역명: 충청남도 금산군\n",
- "관련 행정동코드: [4471000000, 4471025000, 4471031000, 4471032000, 4471033000, 4471034000, 4471035000, 4471036000, 4471037000, 4471038000, 4471039000]\n",
- "총 거주인원: 554830.0 , 20/50/60대 거주인원: 76765.0 \n",
- "\n",
- "지역명: 충청북도 영동군\n",
- "관련 행정동코드: [4374000000, 4374025000, 4374031000, 4374032000, 4374033500, 4374034000, 4374035000, 4374036000, 4374037000, 4374038000, 4374039000, 4374040000]\n",
- "총 거주인원: 450046.0 , 20/50/60대 거주인원: 61760.0 \n",
- "\n",
- "지역명: 전라북도 무주군\n",
- "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n",
- "총 거주인원: 211731.0 , 20/50/60대 거주인원: 26123.0 \n",
- "\n",
- "[3048131, 3820791, 5536840, 2377042, 2922017, 554830, 450046, 211731]\n",
- "[290518, 424653, 674439, 306052, 354956, 76765, 61760, 26123]\n"
- ]
- }
- ],
- "source": [
- "# 각 지역 거주인원\n",
- "def get_residents_num(lst):\n",
- " residents_num = []\n",
- " residents_num_256 = []\n",
- " for name in lst:\n",
- " print(\"지역명:\", name)\n",
- " codes = address[address['시도 시군구'] == name]['행정동코드'].unique().tolist()\n",
- " print(\"관련 행정동코드: \", codes)\n",
- " # 지역 내 행정동코드들의 거주인원 합산\n",
- " cnt_all = 0\n",
- " cnt_256 = 0\n",
- " for code in codes:\n",
- " tmp_for_all = avg_stay_cnts_all[avg_stay_cnts_all['hdong_cd']==code]\n",
- " if not tmp_for_all.empty:\n",
- " cnt_all += tmp_for_all['stay_cnts'].iloc[0]\n",
- " tmp_for_256 = avg_stay_cnts_age[avg_stay_cnts_age['hdong_cd']==code]\n",
- " if not tmp_for_256.empty:\n",
- " cnt_256 += tmp_for_256['stay_cnts'].iloc[0]\n",
- " residents_num.append(int(cnt_all))\n",
- " residents_num_256.append(int(cnt_256))\n",
- " print(\"총 거주인원:\", cnt_all, \", 20/50/60대 거주인원:\", cnt_256, \"\\n\")\n",
- " return residents_num, residents_num_256\n",
- "\n",
- "# 대전 지역으로 테스트\n",
- "daejun = ['세종특별자치시', '대전광역시 유성구', '대전광역시 서구', '대전광역시 대덕구', '대전광역시 중구', '충청남도 금산군', '충청북도 영동군', '전라북도 무주군']\n",
- "\n",
- "daejun_residents_num, daejun_residents_num_256 = get_residents_num(daejun)\n",
- "\n",
- "print(daejun_residents_num)\n",
- "print(daejun_residents_num_256)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 69,
- "metadata": {},
- "outputs": [
- {
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "지역명: 세종특별자치시\n",
- "관련 행정동코드: [3600000000, 3611000000, 3611025000, 3611031000, 3611032000, 3611033000, 3611034000, 3611035000, 3611036000, 3611037000, 3611038000, 3611039000, 3611051000, 3611051500, 3611051800, 3611052000, 3611052300, 3611052500, 3611053000, 3611054000, 3611055000, 3611055500, 3611055600, 3611056000, 3611057000, 3611058000]\n",
- "총 방문객 수: 758 , 20/50/60대 방문객 수: 41 \n",
- "\n",
- "지역명: 대전광역시 유성구\n",
- "관련 행정동코드: [3020000000, 3020052000, 3020052600, 3020052700, 3020053000, 3020054000, 3020054600, 3020054700, 3020054800, 3020055000, 3020057000, 3020058000, 3020060000, 3020061000]\n",
- "총 방문객 수: 895 , 20/50/60대 방문객 수: 189 \n",
- "\n",
- "지역명: 대전광역시 서구\n",
- "관련 행정동코드: [3017000000, 3017051000, 3017052000, 3017053000, 3017053500, 3017054000, 3017055000, 3017055500, 3017056000, 3017057000, 3017057500, 3017058100, 3017058200, 3017058600, 3017058700, 3017058800, 3017059000, 3017059300, 3017059600, 3017059700, 3017060000, 3017063000, 3017064000, 3017065000, 3017066000]\n",
- "총 방문객 수: 1182 , 20/50/60대 방문객 수: 304 \n",
- "\n",
- "지역명: 대전광역시 대덕구\n",
- "관련 행정동코드: [3023000000, 3023051000, 3023052000, 3023052500, 3023053300, 3023054300, 3023054600, 3023055000, 3023056000, 3023057000, 3023058000, 3023060000, 3023061000]\n",
- "총 방문객 수: 375 , 20/50/60대 방문객 수: 60 \n",
- "\n",
- "지역명: 대전광역시 중구\n",
- "관련 행정동코드: [3014000000, 3014053500, 3014055000, 3014056000, 3014057500, 3014060500, 3014062000, 3014063000, 3014064000, 3014065500, 3014067000, 3014068000, 3014069000, 3014070000, 3014071000, 3014072000, 3014073000, 3014074000]\n",
- "총 방문객 수: 602 , 20/50/60대 방문객 수: 109 \n",
- "\n",
- "지역명: 충청남도 금산군\n",
- "관련 행정동코드: [4471000000, 4471025000, 4471031000, 4471032000, 4471033000, 4471034000, 4471035000, 4471036000, 4471037000, 4471038000, 4471039000]\n",
- "총 방문객 수: 538 , 20/50/60대 방문객 수: 92 \n",
- "\n",
- "지역명: 충청북도 영동군\n",
- "관련 행정동코드: [4374000000, 4374025000, 4374031000, 4374032000, 4374033500, 4374034000, 4374035000, 4374036000, 4374037000, 4374038000, 4374039000, 4374040000]\n",
- "총 방문객 수: 618 , 20/50/60대 방문객 수: 129 \n",
- "\n",
- "지역명: 전라북도 무주군\n",
- "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n",
- "총 방문객 수: 24957 , 20/50/60대 방문객 수: 4768 \n",
- "\n",
- "[758, 895, 1182, 375, 602, 538, 618, 24957]\n",
- "[41, 189, 304, 60, 109, 92, 129, 4768]\n"
- ]
- }
- ],
- "source": [
- "# 각 지역 방문객\n",
- "def get_visitors_num(lst):\n",
- " visitors_num = []\n",
- " visitors_num_256 = []\n",
- " for name in lst:\n",
- " print(\"지역명:\", name)\n",
- " codes = address[address['시도 시군구'] == name]['행정동코드'].unique().tolist()\n",
- " print(\"관련 행정동코드: \", codes)\n",
- " # 지역 내 행정동코드들의 방문객 합산\n",
- " cnt_all = 0\n",
- " cnt_256 = 0\n",
- " for code in codes:\n",
- " tmp_for_all = sum_od_cnts_all[sum_od_cnts_all['origin_hdong_cd']==code]\n",
- " if not tmp_for_all.empty:\n",
- " cnt_all += tmp_for_all['od_cnts'].iloc[0]\n",
- " tmp_for_256 = sum_od_cnts_age[sum_od_cnts_age['origin_hdong_cd']==code]\n",
- " if not tmp_for_256.empty:\n",
- " cnt_256 += tmp_for_256['od_cnts'].iloc[0]\n",
- " visitors_num.append(int(cnt_all))\n",
- " visitors_num_256.append(int(cnt_256))\n",
- " print(\"총 방문객 수:\", cnt_all, \", 20/50/60대 방문객 수:\", cnt_256, \"\\n\")\n",
- " return visitors_num, visitors_num_256\n",
- "\n",
- "# 대전 지역으로 테스트\n",
- "daejun_visitors_num, daejun_visitors_num_256 = get_visitors_num(daejun)\n",
- "\n",
- "print(daejun_visitors_num)\n",
- "print(daejun_visitors_num_256)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 70,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " origin_hdong_cd | \n",
- " 시도 시군구 | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 1135064000 | \n",
- " 서울특별시 노원구 | \n",
- " 6 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 1138051000 | \n",
- " 서울특별시 은평구 | \n",
- " 5 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 1141062000 | \n",
- " 서울특별시 서대문구 | \n",
- " 7 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 1141072000 | \n",
- " 서울특별시 서대문구 | \n",
- " 14 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 1144060000 | \n",
- " 서울특별시 마포구 | \n",
- " 8 | \n",
- "
\n",
- " \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- " ... | \n",
- "
\n",
- " \n",
- " 273 | \n",
- " 4888025000 | \n",
- " 경상남도 거창군 | \n",
- " 45 | \n",
- "
\n",
- " \n",
- " 274 | \n",
- " 4888034000 | \n",
- " 경상남도 거창군 | \n",
- " 8 | \n",
- "
\n",
- " \n",
- " 275 | \n",
- " 4888037000 | \n",
- " 경상남도 거창군 | \n",
- " 8 | \n",
- "
\n",
- " \n",
- " 276 | \n",
- " 4888040000 | \n",
- " 경상남도 거창군 | \n",
- " 7 | \n",
- "
\n",
- " \n",
- " 277 | \n",
- " 4889045000 | \n",
- " 경상남도 합천군 | \n",
- " 8 | \n",
- "
\n",
- " \n",
- "
\n",
- "
278 rows × 3 columns
\n",
- "
"
- ],
- "text/plain": [
- " origin_hdong_cd 시도 시군구 od_cnts\n",
- "0 1135064000 서울특별시 노원구 6\n",
- "1 1138051000 서울특별시 은평구 5\n",
- "2 1141062000 서울특별시 서대문구 7\n",
- "3 1141072000 서울특별시 서대문구 14\n",
- "4 1144060000 서울특별시 마포구 8\n",
- ".. ... ... ...\n",
- "273 4888025000 경상남도 거창군 45\n",
- "274 4888034000 경상남도 거창군 8\n",
- "275 4888037000 경상남도 거창군 8\n",
- "276 4888040000 경상남도 거창군 7\n",
- "277 4889045000 경상남도 합천군 8\n",
- "\n",
- "[278 rows x 3 columns]"
- ]
- },
- "execution_count": 70,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# 전체 데이터에서 20대 어디서 오는지 확인\n",
- "age20 = df_od[df_od['age']==2][['origin_hdong_cd', 'date', 'age', 'od_cnts']]\n",
- "age20 = age20.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index()\n",
- "unique_address = address.drop_duplicates(subset=['행정동코드'])\n",
- "age20eng = pd.merge(age20, unique_address[['행정동코드','시도 시군구']], 'left', left_on='origin_hdong_cd', right_on='행정동코드')\n",
- "age20eng = age20eng[['origin_hdong_cd', '시도 시군구', 'od_cnts']]\n",
- "age20eng"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 71,
- "metadata": {},
- "outputs": [],
- "source": [
- "# 지역별 20/50/60대 방문율\n",
- "def get_proportion(a, b, n):\n",
- " lst = []\n",
- " for i in range(n):\n",
- " lst.append(a[i] / b[i])\n",
- " return lst"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 72,
- "metadata": {},
- "outputs": [],
- "source": [
- "import numpy as np\n",
- "\n",
- "def softmax(weights):\n",
- " e = np.exp(weights - np.max(weights)) # 오버플로 방지를 위해 최대값을 빼줌\n",
- " return e / e.sum()\n",
- "\n",
- "def get_weights(nodes, weights): \n",
- " residents_num, residents_num_256 = get_residents_num(nodes)\n",
- " visitors_num, visitors_num_256 = get_visitors_num(nodes)\n",
- " # 방식1: 해당 지역의 2/5/60대 거주민 중 축제방문객 비율. (2/5/60대 축제 관심도가 높은 곳을 우선)\n",
- " # weight_age = get_proportion(visitors_num_256, residents_num_256, len(nodes))\n",
- " # 방식2: 해당 지역의 전체 축제방문객 중 2/5/60대 비율. ()\n",
- " weight_age = get_proportion(visitors_num_256, visitors_num, len(nodes))\n",
- " # 방식3: 해당 지역의 거주민 중 2/5/60대 거주민 비율. (단순히 2/5/60대가 많은 곳을 우선)\n",
- " # weight_age = get_proportion(residents_num_256, residents_num, len(nodes))\n",
- "\n",
- " for i, w in enumerate(weight_age):\n",
- " weights[i] += w\n",
- "\n",
- " softmax_weights = softmax(weights)\n",
- " \n",
- " stations = {nodes: weight for nodes, weight in zip(nodes, softmax_weights)}\n",
- " print(stations)\n",
- "\n",
- " return stations"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "### 탐색"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 73,
- "metadata": {},
- "outputs": [],
- "source": [
- "import networkx as nx\n",
- "\n",
- "# 모든 경로 찾기\n",
- "def find_all_routes(G, start, target, visited=None, path=None):\n",
- " if visited is None:\n",
- " visited = set()\n",
- " if path is None:\n",
- " path = []\n",
- "\n",
- " visited.add(start)\n",
- " path.append(start)\n",
- "\n",
- " if start == target:\n",
- " yield path.copy()\n",
- " else:\n",
- " for neighbor in G.neighbors(start):\n",
- " if neighbor not in visited:\n",
- " yield from find_all_routes(G, neighbor, target, visited, path)\n",
- "\n",
- " path.pop()\n",
- " visited.remove(start)\n",
- "\n",
- "# 최적 경로 탐색 함수\n",
- "def find_optimal_routes(G, stations, min_threshold, max_threshold, step):\n",
- " optimal_routes = []\n",
- " max_stops = 0\n",
- " explored_routes = set() # 탐색된 경로를 저장할 집합\n",
- "\n",
- " # 여러 배수 값을 탐색\n",
- " for threshold in np.arange(min_threshold, max_threshold + step, step):\n",
- "\n",
- " for station in stations.keys():\n",
- " if station != \"전라북도 무주군\": # 목적지가 아니면\n",
- " routes = list(find_all_routes(G, station, \"전라북도 무주군\"))\n",
- "\n",
- " for route in routes:\n",
- " valid_route = True\n",
- " total_distance = 0\n",
- " total_time = 0\n",
- " total_weight = 0 # 가중치 누적\n",
- "\n",
- " # 각 경로의 모든 구간에 대해 확인\n",
- " for i in range(len(route) - 1):\n",
- " current_station = route[i]\n",
- "\n",
- " # 현재 노드에서 무주군으로 바로 이동할 때의 거리와 시간\n",
- " if \"전라북도 무주군\" in G[current_station]: # 직접 경로가 있는 경우에만\n",
- " direct_distance = G[current_station][\"전라북도 무주군\"]['distance']\n",
- " direct_time = G[current_station][\"전라북도 무주군\"]['time']\n",
- "\n",
- " # 현재 구간의 거리와 시간을 누적\n",
- " total_distance += G[route[i]][route[i + 1]]['distance']\n",
- " total_time += G[route[i]][route[i + 1]]['time']\n",
- "\n",
- " # 각 중간 노드에서도 주어진 배수(factor) 조건 확인\n",
- " if total_distance > direct_distance * threshold or total_time > direct_time * threshold:\n",
- " valid_route = False\n",
- " break\n",
- "\n",
- " # 가중치 누적 (출발지 제외)\n",
- " if i > 0:\n",
- " total_weight += stations[current_station]\n",
- "\n",
- " if valid_route:\n",
- " # 경로를 집합에 저장할 수 있는 형태로 변환 (정렬하여 순서 상관없이 비교 하기 위함)\n",
- " route_tuple = tuple(sorted(route))\n",
- "\n",
- " # 만약 해당 경로가 이전 배수에서 이미 탐색되었다면 제외\n",
- " if route_tuple not in explored_routes:\n",
- " explored_routes.add(route_tuple) # 새로운 경로로 저장\n",
- "\n",
- " # 최대 정거장 수 확인\n",
- " if len(route) > max_stops:\n",
- " max_stops = len(route)\n",
- " optimal_routes = [(route, total_distance, total_time, total_weight, threshold)]\n",
- " elif len(route) == max_stops:\n",
- " optimal_routes.append((route, total_distance, total_time, total_weight, threshold))\n",
- "\n",
- " return optimal_routes\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 74,
- "metadata": {},
- "outputs": [],
- "source": [
- "def print_optimal_routes(optimal_routes, name):\n",
- " print(f\"{name}지역 최적의 셔틀 노선\")\n",
- " if optimal_routes:\n",
- " for route, total_distance, total_time, total_weight, threshold in optimal_routes:\n",
- " # 총 거리를 km로 변환하고 소수점 아래 두째 자리까지 포맷\n",
- " total_distance_km = total_distance / 1000 # 미터를 킬로미터로 변환\n",
- " total_distance_formatted = f\"{total_distance_km:.2f} km\"\n",
- "\n",
- " # 총 시간을 시간과 분으로 변환 (반올림)\n",
- " total_time_hours = total_time // 60\n",
- " total_time_minutes = round(total_time % 60)\n",
- "\n",
- " print(f\"최적의 셔틀 노선: {route} | 총 거리: {total_distance_formatted} | 총 시간: {total_time_hours}시간 {total_time_minutes}분 | 총 가중치: {total_weight} | threshold: {threshold:.2f}\")\n",
- " else:\n",
- " print(\"유효한 경로가 없습니다.\")"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "---"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "## 메인"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 75,
- "metadata": {},
- "outputs": [],
- "source": [
- "# 경유지 리스트\n",
- "daejun = ['세종특별자치시', '대전광역시 유성구', '대전광역시 서구', '대전광역시 대덕구', '대전광역시 중구', '충청남도 금산군', '충청북도 영동군', '전라북도 무주군']\n",
- "jeonbuk = ['전라북도 군산시', '전라북도 익산시', '전라북도 전주시 완산구', '전라북도 전주시 덕진구', '전라북도 진안군', '전라북도 장수군', '전라북도 무주군']\n",
- "# 방문객 수에 근거한 노드별 초기 가중치\n",
- "daejun_weights = [1, 2, 2, 1, 1, 1, 2, 0] \n",
- "jeonbuk_weights = [1, 1, 2, 2, 1, 2, 0]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 76,
- "metadata": {},
- "outputs": [],
- "source": [
- "def search(nodes, weights, name):\n",
- " # 1. 위경도 좌표 기반으로 경유지 간 이동거리, 이동시간 테이블 만듦\n",
- "\n",
- " # 경유지 위경도 좌표 \n",
- " coordinates = get_coordinates(nodes) \n",
- "\n",
- " # 네이버 api\n",
- " # n_distance_table, n_duration_table = get_path_info(coordinates, naver_request)\n",
- " # n_duration_min_table = [[round(value / 3600, 2) for value in row] for row in n_duration_table]\n",
- "\n",
- " # 카카오 api\n",
- " k_distance_table, k_duration_table = get_path_info(coordinates, kakao_request)\n",
- " k_duration_min_table = [[round(value / 60, 2) for value in row] for row in k_duration_table]\n",
- "\n",
- "\n",
- " distance_table = k_distance_table\n",
- " duration_table = k_duration_min_table\n",
- "\n",
- " # 2. 정거장 후보지와 가중치\n",
- " stations = get_weights(nodes, weights) \n",
- "\n",
- " # 3. 탐색\n",
- " # 그래프 생성\n",
- " G = nx.DiGraph()\n",
- "\n",
- " # 그래프에 엣지 추가\n",
- " for i, from_station in enumerate(stations.keys()):\n",
- " for j, to_station in enumerate(stations.keys()):\n",
- " if i != j:\n",
- " G.add_edge(from_station, to_station, \n",
- " distance=distance_table[i][j], \n",
- " time=duration_table[i][j])\n",
- " \n",
- " # 탐색 범위 설정 (예: 1.1부터 1.5까지 0.1 간격으로 탐색)\n",
- " min_factor = 1.1\n",
- " max_factor = 1.5\n",
- " step = 0.1\n",
- "\n",
- " # 최적 경로 탐색 실행\n",
- " optimal_routes = find_optimal_routes(G, stations, min_factor, max_factor, step)\n",
- "\n",
- " # 결과 출력\n",
- " print_optimal_routes(optimal_routes, name)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 77,
- "metadata": {},
- "outputs": [
- {
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "지역명: 세종특별자치시\n",
- "관련 행정동코드: [3600000000, 3611000000, 3611025000, 3611031000, 3611032000, 3611033000, 3611034000, 3611035000, 3611036000, 3611037000, 3611038000, 3611039000, 3611051000, 3611051500, 3611051800, 3611052000, 3611052300, 3611052500, 3611053000, 3611054000, 3611055000, 3611055500, 3611055600, 3611056000, 3611057000, 3611058000]\n",
- "총 거주인원: 3048131.0 , 20/50/60대 거주인원: 290518.0 \n",
- "\n",
- "지역명: 대전광역시 유성구\n",
- "관련 행정동코드: [3020000000, 3020052000, 3020052600, 3020052700, 3020053000, 3020054000, 3020054600, 3020054700, 3020054800, 3020055000, 3020057000, 3020058000, 3020060000, 3020061000]\n",
- "총 거주인원: 3820791.0 , 20/50/60대 거주인원: 424653.0 \n",
- "\n",
- "지역명: 대전광역시 서구\n",
- "관련 행정동코드: [3017000000, 3017051000, 3017052000, 3017053000, 3017053500, 3017054000, 3017055000, 3017055500, 3017056000, 3017057000, 3017057500, 3017058100, 3017058200, 3017058600, 3017058700, 3017058800, 3017059000, 3017059300, 3017059600, 3017059700, 3017060000, 3017063000, 3017064000, 3017065000, 3017066000]\n",
- "총 거주인원: 5536840.0 , 20/50/60대 거주인원: 674439.0 \n",
- "\n",
- "지역명: 대전광역시 대덕구\n",
- "관련 행정동코드: [3023000000, 3023051000, 3023052000, 3023052500, 3023053300, 3023054300, 3023054600, 3023055000, 3023056000, 3023057000, 3023058000, 3023060000, 3023061000]\n",
- "총 거주인원: 2377042.0 , 20/50/60대 거주인원: 306052.0 \n",
- "\n",
- "지역명: 대전광역시 중구\n",
- "관련 행정동코드: [3014000000, 3014053500, 3014055000, 3014056000, 3014057500, 3014060500, 3014062000, 3014063000, 3014064000, 3014065500, 3014067000, 3014068000, 3014069000, 3014070000, 3014071000, 3014072000, 3014073000, 3014074000]\n",
- "총 거주인원: 2922017.0 , 20/50/60대 거주인원: 354956.0 \n",
- "\n",
- "지역명: 충청남도 금산군\n",
- "관련 행정동코드: [4471000000, 4471025000, 4471031000, 4471032000, 4471033000, 4471034000, 4471035000, 4471036000, 4471037000, 4471038000, 4471039000]\n",
- "총 거주인원: 554830.0 , 20/50/60대 거주인원: 76765.0 \n",
- "\n",
- "지역명: 충청북도 영동군\n",
- "관련 행정동코드: [4374000000, 4374025000, 4374031000, 4374032000, 4374033500, 4374034000, 4374035000, 4374036000, 4374037000, 4374038000, 4374039000, 4374040000]\n",
- "총 거주인원: 450046.0 , 20/50/60대 거주인원: 61760.0 \n",
- "\n",
- "지역명: 전라북도 무주군\n",
- "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n",
- "총 거주인원: 211731.0 , 20/50/60대 거주인원: 26123.0 \n",
- "\n",
- "지역명: 세종특별자치시\n",
- "관련 행정동코드: [3600000000, 3611000000, 3611025000, 3611031000, 3611032000, 3611033000, 3611034000, 3611035000, 3611036000, 3611037000, 3611038000, 3611039000, 3611051000, 3611051500, 3611051800, 3611052000, 3611052300, 3611052500, 3611053000, 3611054000, 3611055000, 3611055500, 3611055600, 3611056000, 3611057000, 3611058000]\n",
- "총 방문객 수: 758 , 20/50/60대 방문객 수: 41 \n",
- "\n",
- "지역명: 대전광역시 유성구\n",
- "관련 행정동코드: [3020000000, 3020052000, 3020052600, 3020052700, 3020053000, 3020054000, 3020054600, 3020054700, 3020054800, 3020055000, 3020057000, 3020058000, 3020060000, 3020061000]\n",
- "총 방문객 수: 895 , 20/50/60대 방문객 수: 189 \n",
- "\n",
- "지역명: 대전광역시 서구\n",
- "관련 행정동코드: [3017000000, 3017051000, 3017052000, 3017053000, 3017053500, 3017054000, 3017055000, 3017055500, 3017056000, 3017057000, 3017057500, 3017058100, 3017058200, 3017058600, 3017058700, 3017058800, 3017059000, 3017059300, 3017059600, 3017059700, 3017060000, 3017063000, 3017064000, 3017065000, 3017066000]\n",
- "총 방문객 수: 1182 , 20/50/60대 방문객 수: 304 \n",
- "\n",
- "지역명: 대전광역시 대덕구\n",
- "관련 행정동코드: [3023000000, 3023051000, 3023052000, 3023052500, 3023053300, 3023054300, 3023054600, 3023055000, 3023056000, 3023057000, 3023058000, 3023060000, 3023061000]\n",
- "총 방문객 수: 375 , 20/50/60대 방문객 수: 60 \n",
- "\n",
- "지역명: 대전광역시 중구\n",
- "관련 행정동코드: [3014000000, 3014053500, 3014055000, 3014056000, 3014057500, 3014060500, 3014062000, 3014063000, 3014064000, 3014065500, 3014067000, 3014068000, 3014069000, 3014070000, 3014071000, 3014072000, 3014073000, 3014074000]\n",
- "총 방문객 수: 602 , 20/50/60대 방문객 수: 109 \n",
- "\n",
- "지역명: 충청남도 금산군\n",
- "관련 행정동코드: [4471000000, 4471025000, 4471031000, 4471032000, 4471033000, 4471034000, 4471035000, 4471036000, 4471037000, 4471038000, 4471039000]\n",
- "총 방문객 수: 538 , 20/50/60대 방문객 수: 92 \n",
- "\n",
- "지역명: 충청북도 영동군\n",
- "관련 행정동코드: [4374000000, 4374025000, 4374031000, 4374032000, 4374033500, 4374034000, 4374035000, 4374036000, 4374037000, 4374038000, 4374039000, 4374040000]\n",
- "총 방문객 수: 618 , 20/50/60대 방문객 수: 129 \n",
- "\n",
- "지역명: 전라북도 무주군\n",
- "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n",
- "총 방문객 수: 24957 , 20/50/60대 방문객 수: 4768 \n",
- "\n",
- "{'세종특별자치시': 0.0690751357958365, '대전광역시 유성구': 0.21970336845100272, '대전광역시 서구': 0.23004991987725867, '대전광역시 대덕구': 0.07679235776727512, '대전광역시 중구': 0.07842699953443562, '충청남도 금산군': 0.07764202535394257, '충청북도 영동군': 0.21916897136041014, '전라북도 무주군': 0.029141221859838744}\n",
- "대전지역 최적의 셔틀 노선\n",
- "최적의 셔틀 노선: ['대전광역시 중구', '대전광역시 대덕구', '대전광역시 서구', '전라북도 무주군'] | 총 거리: 75.06 km | 총 시간: 1.0시간 24분 | 총 가중치: 0.3068422776445338 | threshold: 1.40\n",
- "최적의 셔틀 노선: ['대전광역시 유성구', '대전광역시 서구', '대전광역시 대덕구', '전라북도 무주군'] | 총 거리: 71.59 km | 총 시간: 1.0시간 17분 | 총 가중치: 0.3068422776445338 | threshold: 1.50\n",
- "최적의 셔틀 노선: ['대전광역시 유성구', '대전광역시 서구', '대전광역시 중구', '전라북도 무주군'] | 총 거리: 64.15 km | 총 시간: 1.0시간 21분 | 총 가중치: 0.3084769194116943 | threshold: 1.50\n",
- "최적의 셔틀 노선: ['대전광역시 유성구', '대전광역시 대덕구', '대전광역시 중구', '전라북도 무주군'] | 총 거리: 65.30 km | 총 시간: 1.0시간 19분 | 총 가중치: 0.15521935730171074 | threshold: 1.50\n"
- ]
- }
- ],
- "source": [
- "search(daejun, daejun_weights, \"대전\")"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 78,
- "metadata": {},
- "outputs": [
- {
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "지역명: 전라북도 군산시\n",
- "관련 행정동코드: [4513000000, 4513025000, 4513031000, 4513032000, 4513033000, 4513034000, 4513035000, 4513036000, 4513037000, 4513038000, 4513039000, 4513040000, 4513051500, 4513053000, 4513055000, 4513056000, 4513060500, 4513064000, 4513065000, 4513066000, 4513067000, 4513068000, 4513069000, 4513070100, 4513070200, 4513070300, 4513071000, 4513072000]\n",
- "총 거주인원: 3132379.0 , 20/50/60대 거주인원: 378252.0 \n",
- "\n",
- "지역명: 전라북도 익산시\n",
- "관련 행정동코드: [4514000000, 4514025000, 4514031000, 4514032000, 4514033000, 4514034000, 4514035000, 4514036000, 4514037000, 4514038000, 4514039000, 4514040000, 4514041000, 4514042000, 4514043000, 4514044000, 4514052000, 4514053000, 4514056000, 4514057000, 4514058000, 4514059500, 4514061000, 4514062000, 4514064600, 4514064700, 4514065200, 4514065600, 4514067000, 4514069000]\n",
- "총 거주인원: 3328022.0 , 20/50/60대 거주인원: 420440.0 \n",
- "\n",
- "지역명: 전라북도 전주시 완산구\n",
- "관련 행정동코드: [4511100000, 4511151000, 4511153000, 4511160500, 4511163500, 4511165000, 4511166000, 4511167100, 4511167200, 4511168000, 4511169100, 4511169200, 4511170100, 4511170200, 4511170300, 4511171100, 4511171200, 4511171300, 4511171400, 4511173000]\n",
- "총 거주인원: 4116105.0 , 20/50/60대 거주인원: 486210.0 \n",
- "\n",
- "지역명: 전라북도 전주시 덕진구\n",
- "관련 행정동코드: [4511300000, 4511352500, 4511354000, 4511355000, 4511356000, 4511357000, 4511358000, 4511359000, 4511360000, 4511361100, 4511361200, 4511362000, 4511364100, 4511364200, 4511365000, 4511366500, 4511367000]\n",
- "총 거주인원: 3377434.0 , 20/50/60대 거주인원: 400961.0 \n",
- "\n",
- "지역명: 전라북도 진안군\n",
- "관련 행정동코드: [4572000000, 4572025000, 4572031000, 4572032000, 4572033000, 4572034000, 4572035000, 4572036000, 4572037000, 4572038000, 4572039000, 4572040000]\n",
- "총 거주인원: 179814.0 , 20/50/60대 거주인원: 24852.0 \n",
- "\n",
- "지역명: 전라북도 장수군\n",
- "관련 행정동코드: [4574000000, 4574025000, 4574031000, 4574032000, 4574033500, 4574034000, 4574035000, 4574036000]\n",
- "총 거주인원: 201626.0 , 20/50/60대 거주인원: 26141.0 \n",
- "\n",
- "지역명: 전라북도 무주군\n",
- "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n",
- "총 거주인원: 211731.0 , 20/50/60대 거주인원: 26123.0 \n",
- "\n",
- "지역명: 전라북도 군산시\n",
- "관련 행정동코드: [4513000000, 4513025000, 4513031000, 4513032000, 4513033000, 4513034000, 4513035000, 4513036000, 4513037000, 4513038000, 4513039000, 4513040000, 4513051500, 4513053000, 4513055000, 4513056000, 4513060500, 4513064000, 4513065000, 4513066000, 4513067000, 4513068000, 4513069000, 4513070100, 4513070200, 4513070300, 4513071000, 4513072000]\n",
- "총 방문객 수: 14 , 20/50/60대 방문객 수: 14 \n",
- "\n",
- "지역명: 전라북도 익산시\n",
- "관련 행정동코드: [4514000000, 4514025000, 4514031000, 4514032000, 4514033000, 4514034000, 4514035000, 4514036000, 4514037000, 4514038000, 4514039000, 4514040000, 4514041000, 4514042000, 4514043000, 4514044000, 4514052000, 4514053000, 4514056000, 4514057000, 4514058000, 4514059500, 4514061000, 4514062000, 4514064600, 4514064700, 4514065200, 4514065600, 4514067000, 4514069000]\n",
- "총 방문객 수: 21 , 20/50/60대 방문객 수: 7 \n",
- "\n",
- "지역명: 전라북도 전주시 완산구\n",
- "관련 행정동코드: [4511100000, 4511151000, 4511153000, 4511160500, 4511163500, 4511165000, 4511166000, 4511167100, 4511167200, 4511168000, 4511169100, 4511169200, 4511170100, 4511170200, 4511170300, 4511171100, 4511171200, 4511171300, 4511171400, 4511173000]\n",
- "총 방문객 수: 96 , 20/50/60대 방문객 수: 10 \n",
- "\n",
- "지역명: 전라북도 전주시 덕진구\n",
- "관련 행정동코드: [4511300000, 4511352500, 4511354000, 4511355000, 4511356000, 4511357000, 4511358000, 4511359000, 4511360000, 4511361100, 4511361200, 4511362000, 4511364100, 4511364200, 4511365000, 4511366500, 4511367000]\n",
- "총 방문객 수: 127 , 20/50/60대 방문객 수: 47 \n",
- "\n",
- "지역명: 전라북도 진안군\n",
- "관련 행정동코드: [4572000000, 4572025000, 4572031000, 4572032000, 4572033000, 4572034000, 4572035000, 4572036000, 4572037000, 4572038000, 4572039000, 4572040000]\n",
- "총 방문객 수: 277 , 20/50/60대 방문객 수: 62 \n",
- "\n",
- "지역명: 전라북도 장수군\n",
- "관련 행정동코드: [4574000000, 4574025000, 4574031000, 4574032000, 4574033500, 4574034000, 4574035000, 4574036000]\n",
- "총 방문객 수: 436 , 20/50/60대 방문객 수: 160 \n",
- "\n",
- "지역명: 전라북도 무주군\n",
- "관련 행정동코드: [4573000000, 4573025000, 4573031000, 4573032000, 4573033000, 4573034000, 4573035000]\n",
- "총 방문객 수: 24957 , 20/50/60대 방문객 수: 4768 \n",
- "\n",
- "{'전라북도 군산시': 0.16290893515183477, '전라북도 익산시': 0.08364023615032236, '전라북도 전주시 완산구': 0.18079395836979623, '전라북도 전주시 덕진구': 0.23586747596828486, '전라북도 진안군': 0.0749647557263006, '전라북도 장수군': 0.23513594628281875, '전라북도 무주군': 0.026688692350642314}\n",
- "전북지역 최적의 셔틀 노선\n",
- "최적의 셔틀 노선: ['전라북도 전주시 완산구', '전라북도 전주시 덕진구', '전라북도 무주군'] | 총 거리: 75.56 km | 총 시간: 1.0시간 32분 | 총 가중치: 0.23586747596828486 | threshold: 1.20\n",
- "최적의 셔틀 노선: ['전라북도 군산시', '전라북도 익산시', '전라북도 무주군'] | 총 거리: 118.16 km | 총 시간: 2.0시간 4분 | 총 가중치: 0.08364023615032236 | threshold: 1.30\n",
- "최적의 셔틀 노선: ['전라북도 전주시 덕진구', '전라북도 군산시', '전라북도 무주군'] | 총 거리: 153.42 km | 총 시간: 2.0시간 22분 | 총 가중치: 0.16290893515183477 | threshold: 1.40\n",
- "최적의 셔틀 노선: ['전라북도 전주시 덕진구', '전라북도 익산시', '전라북도 무주군'] | 총 거리: 118.14 km | 총 시간: 2.0시간 10분 | 총 가중치: 0.08364023615032236 | threshold: 1.40\n",
- "최적의 셔틀 노선: ['전라북도 익산시', '전라북도 전주시 완산구', '전라북도 무주군'] | 총 거리: 104.53 km | 총 시간: 2.0시간 2분 | 총 가중치: 0.18079395836979623 | threshold: 1.50\n",
- "최적의 셔틀 노선: ['전라북도 전주시 완산구', '전라북도 군산시', '전라북도 무주군'] | 총 거리: 163.53 km | 총 시간: 2.0시간 29분 | 총 가중치: 0.16290893515183477 | threshold: 1.50\n"
- ]
- }
- ],
- "source": [
- "search(jeonbuk, jeonbuk_weights, \"전북\")"
- ]
- }
- ],
- "metadata": {
- "kernelspec": {
- "display_name": "base",
- "language": "python",
- "name": "python3"
- },
- "language_info": {
- "codemirror_mode": {
- "name": "ipython",
- "version": 3
- },
- "file_extension": ".py",
- "mimetype": "text/x-python",
- "name": "python",
- "nbconvert_exporter": "python",
- "pygments_lexer": "ipython3",
- "version": "3.11.7"
- }
- },
- "nbformat": 4,
- "nbformat_minor": 2
-}
diff --git a/dataloader/dataloader.py b/dataloader/dataloader.py
index 6c0b054..7f1f4ec 100644
--- a/dataloader/dataloader.py
+++ b/dataloader/dataloader.py
@@ -4,34 +4,21 @@
import json
sys.path.append(os.path.dirname(os.path.abspath(os.path.dirname(__file__))))
-from preprocess.dataload_preprocess import preprocess_od, preprocess_stay
+from preprocess.dataload_preprocess import preprocess_od, preprocess_stay, preprocess_address, preprocess_visitor_city
# paths 파일 불러오기
with open('config.json', 'r', encoding='utf-8') as f:
paths = json.load(f)
-
-# 'data/raw_data' 경로 설정
-root_dir = paths['root_dir']
-visitor_city = pd.read_csv(os.path.join(root_dir, "city_of_festival_visitors.csv")) # 무주축제 방문객 top 18 지역들 (시군구명,od_cnts,시도명,행정동코드,위도,경도)
-address = pd.read_csv(os.path.join(root_dir, "address_with_lon_lat_final.csv")) # 행정동코드 + 위도경도 (행정동코드,시도명,시군구명,읍면동명,동리명,위도,경도)
-mooju = set(list(address[address['시군구명'] == '무주군']['행정동코드'])) # 무주군 행정동코드
-other_city = list(address.merge(visitor_city, on=['시도명', '시군구명'])['행정동코드_x']) # 다른 지역들 행정동코드 모음
-
-visitor_city['시도 시군구'] = visitor_city['시도명'].fillna('') + ' ' + visitor_city['시군구명'].fillna('')
-visitor_city['시도 시군구'] = visitor_city['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리
-
-address['시도 시군구'] = address['시도명'].fillna('') + ' ' + address['시군구명'].fillna('')
-address['시도 시군구'] = address['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리
-
-# raw_data 경로 설정
-od_dir = paths['od_dir']
-stay_dir = paths['stay_dir']
-
-
-# festival od data load
+# 축제기간의 od 데이터 로드 함수
def load_od():
df_od = pd.DataFrame()
+ od_dir = paths['od_dir']
+
+ address_df = load_address()
+ # 무주군의 행정동코드 추출
+ mooju = set(address_df[address_df['시군구명'] == '무주군']['행정동코드'])
+
for dirpath, dirnames, filenames in os.walk(od_dir):
for filename in tqdm(filenames, desc="load od data", unit="file"):
if filename.endswith('.csv'):
@@ -55,9 +42,10 @@ def load_od():
df_od = pd.concat([df_od, globals()[f'df_{mmdd_str}']])
return df_od
-# festival stay data load
+# stay 데이터 로드 함수
def load_stay():
df_stay = pd.DataFrame()
+ stay_dir = paths['stay_dir']
for dirpath, dirnames, filenames in os.walk(stay_dir):
for filename in tqdm(filenames, desc="load stay data", unit="file"):
if filename.endswith('.csv'):
@@ -79,4 +67,24 @@ def load_stay():
# 동적으로 변수 생성 (예: df_0902)
globals()[f'df_{mmdd_str}'] = filtered_data
df_stay = pd.concat([df_stay, globals()[f'df_{mmdd_str}']])
- return df_stay
\ No newline at end of file
+ return df_stay
+
+# address 데이터 로드 함수
+def load_address():
+ address_path = os.path.join(paths['root_dir'], "address_with_lon_lat_final.csv")
+ address_df = pd.read_csv(address_path)
+
+ address_df = preprocess_address(address_df)
+
+ return address_df
+
+
+
+# visitor_city 데이터 로드 함수
+def load_visitor_city():
+ visitor_city_path = os.path.join(paths['root_dir'], "city_of_festival_visitors.csv")
+ visitor_city_df = pd.read_csv(visitor_city_path)
+
+ visitor_city_df = preprocess_visitor_city(visitor_city_df)
+
+ return visitor_city_df
\ No newline at end of file
diff --git a/func/weight_by_region.py b/func/weight_by_region.py
index 30b71bf..14d6c1e 100644
--- a/func/weight_by_region.py
+++ b/func/weight_by_region.py
@@ -5,44 +5,42 @@
sys.path.append(os.path.dirname(os.path.abspath(os.path.dirname(__file__))))
-from dataloader.dataloader import load_od, load_stay
+from dataloader.dataloader import load_od, load_stay, load_address
-# 'data/raw_data' 경로 설정
-with open('config.json', 'r', encoding='utf-8') as f:
- paths = json.load(f)
-
-root_dir = paths['root_dir']
-address = pd.read_csv(os.path.join(root_dir, "address_with_lon_lat_final.csv")) # 행정동코드 + 위도경도 (행정동코드,시도명,시군구명,읍면동명,동리명,위도,경도)
-address['시도 시군구'] = address['시도명'].fillna('') + ' ' + address['시군구명'].fillna('')
-address['시도 시군구'] = address['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리
-
-
-####
-df_od = load_od()
-df_stay = load_stay()
+def total_number_of_residents_by_region():
+ df_stay = load_stay()
+
+ # 지역별 전체 거주민 수
+ df_stay_all = df_stay.groupby(['hdong_cd', 'date'])['stay_cnts'].sum().reset_index() # 날짜별 거주인구 합산
+ avg_stay_cnts_all = round(df_stay_all.groupby('hdong_cd')['stay_cnts'].mean().reset_index(), 0) # 하루 평균 거주인구
-# 지역별 전체 거주민 수
-df_stay_all = df_stay.groupby(['hdong_cd', 'date'])['stay_cnts'].sum().reset_index() # 날짜별 거주인구 합산
-avg_stay_cnts_all = round(df_stay_all.groupby('hdong_cd')['stay_cnts'].mean().reset_index(), 0) # 하루 평균 거주인구
+ # 지역별 20대,50대,60대 거주민 수
+ df_stay_age = df_stay[df_stay['age'].isin([2,5,6])] # 날짜별 20대 거주인구
+ avg_stay_cnts_age = round(df_stay_age.groupby(['hdong_cd'])['stay_cnts'].mean().reset_index(), 0) # 하루 평균 20대 거주인구
-# 지역별 20대,50대,60대 거주민 수
-df_stay_age = df_stay[df_stay['age'].isin([2,5,6])] # 날짜별 20대 거주인구
-avg_stay_cnts_age = round(df_stay_age.groupby(['hdong_cd'])['stay_cnts'].mean().reset_index(), 0) # 하루 평균 20대 거주인구
+ return avg_stay_cnts_all, avg_stay_cnts_age
-# 지역별 무주축제 방문객 인원수
-df_od_group = df_od.groupby(['origin_hdong_cd', 'date', 'age'])['od_cnts'].sum().reset_index()
-df_od_all = df_od_group.groupby(['origin_hdong_cd', 'date'])['od_cnts'].sum().reset_index() # 날짜별 방문객수 합산
-sum_od_cnts_all = round(df_od_all.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index(), 0) # 해당 지역에서 온 전체 방문객수
+def number_of_visitors_to_Muju_by_region():
+ df_od = load_od()
+
+ # 지역별 무주축제 방문객 인원수
+ df_od_group = df_od.groupby(['origin_hdong_cd', 'date', 'age'])['od_cnts'].sum().reset_index()
+ df_od_all = df_od_group.groupby(['origin_hdong_cd', 'date'])['od_cnts'].sum().reset_index() # 날짜별 방문객수 합산
+ sum_od_cnts_all = round(df_od_all.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index(), 0) # 해당 지역에서 온 전체 방문객수
-# 지역별 20대,50대,60대 무주축제방문객 수
-df_od_age = df_od_group[df_od_group['age'].isin([2,5,6])]
-sum_od_cnts_age = round(df_od_age.groupby('origin_hdong_cd')['od_cnts'].sum().reset_index(), 0)
+ # 지역별 20대,50대,60대 무주축제방문객 수
+ df_od_age = df_od_group[df_od_group['age'].isin([2,5,6])]
+ sum_od_cnts_age = round(df_od_age.groupby('origin_hdong_cd')['od_cnts'].sum().reset_index(), 0)
+ return sum_od_cnts_all, sum_od_cnts_age
# 각 지역 거주인원
def get_residents_num(lst):
+ address = load_address()
+ avg_stay_cnts_all, avg_stay_cnts_age = total_number_of_residents_by_region()
residents_num = []
residents_num_256 = []
+
for name in lst:
#print("지역명:", name)
codes = address[address['시도 시군구'] == name]['행정동코드'].unique().tolist()
@@ -64,8 +62,11 @@ def get_residents_num(lst):
# 각 지역 방문객
def get_visitors_num(lst):
+ address = load_address()
+ sum_od_cnts_all, sum_od_cnts_age = number_of_visitors_to_Muju_by_region()
visitors_num = []
visitors_num_256 = []
+
for name in lst:
#print("지역명:", name)
codes = address[address['시도 시군구'] == name]['행정동코드'].unique().tolist()
@@ -114,8 +115,5 @@ def get_weights(nodes, weights):
stations = {nodes: weight for nodes, weight in zip(nodes, softmax_weights)}
stations['전라북도 무주군'] = 0 # 무주군은 목적지이므로 가중치 0 으로 설정
-
- #print("정류장 가중치")
- #print(stations)
return stations
\ No newline at end of file
diff --git a/preprocess/dataload_preprocess.py b/preprocess/dataload_preprocess.py
index 321254d..14dd01f 100644
--- a/preprocess/dataload_preprocess.py
+++ b/preprocess/dataload_preprocess.py
@@ -29,4 +29,21 @@ def preprocess_stay(df):
filtered_df = df[(df['purpose'] == 0)]
grouped_residents = filtered_df.groupby(['hdong_cd', 'date', 'age'])['stay_cnts'].sum().reset_index()
- return grouped_residents
\ No newline at end of file
+ return grouped_residents
+
+
+def preprocess_address(df):
+
+ # 전처리: 시도명과 시군구명 결합 및 null 값 처리
+ df['시도 시군구'] = df['시도명'].fillna('') + ' ' + df['시군구명'].fillna('')
+ df['시도 시군구'] = df['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리
+
+ return df
+
+def preprocess_visitor_city(df):
+
+ # 전처리: 시도명과 시군구명 결합 및 null 값 처리
+ df['시도 시군구'] = df['시도명'].fillna('') + ' ' + df['시군구명'].fillna('')
+ df['시도 시군구'] = df['시도 시군구'].str.strip() # 양쪽 값이 모두 null인 경우 빈 문자열 처리
+
+ return df
\ No newline at end of file
diff --git a/visualization/chanwoong.ipynb b/visualization/chanwoong.ipynb
deleted file mode 100644
index 2fe3e8d..0000000
--- a/visualization/chanwoong.ipynb
+++ /dev/null
@@ -1,946 +0,0 @@
-{
- "cells": [
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "## 내/외부인 비율 파이차트"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "### 축제 방문객 내/외부인 분포 파악"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 3,
- "metadata": {},
- "outputs": [
- {
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "데이터프레임 df_0901가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0902가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0903가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0904가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0905가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0906가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0907가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0908가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0909가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0910가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0911가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0912가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0913가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0914가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0915가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0916가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0917가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0918가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0919가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0920가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0921가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0922가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0923가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0924가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0925가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0926가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0927가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0928가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0929가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_0930가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1001가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1002가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1003가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1004가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1005가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1006가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1007가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1008가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1009가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1010가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1011가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1012가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1013가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1014가 생성되었고, 기존데이터프레임에 포함합니다.\n",
- "데이터프레임 df_1015가 생성되었고, 기존데이터프레임에 포함합니다.\n"
- ]
- }
- ],
- "source": [
- "import os\n",
- "import pandas as pd\n",
- "\n",
- "# 'data/raw_data' 경로 설정\n",
- "root_dir = '../data/raw_data'\n",
- "df = pd.DataFrame()\n",
- "address = pd.read_csv(\"../data/address_with_lon_lat_final.csv\")\n",
- "mooju = set(list(address[address['시군구명'] == '무주군']['행정동코드']))\n",
- "\n",
- "# 전처리코드는 모두 여기에\n",
- "def preprocess(df):\n",
- " # dest_hdong_cd 값이 축제가 열리는 곳인 무주군 데이터만 필터링\n",
- " filtered_df = df[df['dest_hdong_cd'].isin(mooju)]\n",
- "\n",
- " #filtered_df = df[df['dest_hdong_cd'] == 4573025000]\n",
- " \"\"\"#filtered_df = df[df['dest_hdong_cd'] == 4573025000]\n",
- " df = pd.merge(df, address[['행정동코드', '시도명', '시군구명']], \n",
- " left_on='dest_hdong_cd', right_on='행정동코드', how='left')\n",
- "\n",
- " # 병합 후 불필요한 '행정동코드' 컬럼 제거 (필요에 따라)\n",
- " df = df.drop(columns=['행정동코드'])\n",
- "\n",
- " filtered_df = df[df['시군구명'] == '무주군']\n",
- "\n",
- " filtered_df = filtered_df.drop(columns=['시도명', '시군구명'])\"\"\"\n",
- "\n",
- " # 타 지역에서 온 데이터만 필터링\n",
- " #filtered_df = filtered_df[filtered_df['origin_hdong_cd'] != filtered_df['dest_hdong_cd']]\n",
- " #filtered_df = filtered_df[~filtered_df['origin_hdong_cd'].isin(mooju)]\n",
- "\n",
- " # 체류목적이 3(쇼핑여가), 4(기타), 5(여행) 인경우만 \n",
- " filtered_df = filtered_df[(filtered_df['dest_purpose'] == 3) | \n",
- " (filtered_df['dest_purpose'] == 4) | \n",
- " (filtered_df['dest_purpose'] == 5)]\n",
- "\n",
- " return filtered_df\n",
- "\n",
- "# 'od'로 시작하는 폴더 내의 모든 CSV 파일 처리\n",
- "for dirpath, dirnames, filenames in os.walk(root_dir):\n",
- " if os.path.basename(dirpath).startswith('od'):\n",
- " for filename in filenames:\n",
- " if filename.endswith('.csv'):\n",
- " # 파일 이름에서 날짜 추출\n",
- " date_str = filename.split('_')[1]\n",
- " \n",
- " # 파일 경로 설정 및 CSV 읽기\n",
- " file_path = os.path.join(dirpath, filename)\n",
- " csv_data = pd.read_csv(file_path)\n",
- " \n",
- " # 전처리\n",
- " filtered_data = preprocess(csv_data)\n",
- "\n",
- " # 날짜에서 월일(MMDD) 부분 추출\n",
- " mmdd_str = date_str[4:] # 'YYYYMMDD'에서 마지막 네 자리 'MMDD' 추출\n",
- " \n",
- " # 동적으로 변수 생성 (예: df_0901)\n",
- " globals()[f'df_{mmdd_str}'] = filtered_data\n",
- " \n",
- " # 데이터프레임 이름 출력 (예: df_0901)\n",
- " print(f\"데이터프레임 df_{mmdd_str}가 생성되었고, 기존데이터프레임에 포함합니다.\")\n",
- " df = pd.concat([df, globals()[f'df_{mmdd_str}']])"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 74,
- "metadata": {},
- "outputs": [],
- "source": [
- "festival_df = df[(df['date'] >= 20230902) & (df['date'] <= 20230910)]\n",
- "festival_df_grouped = festival_df.groupby('date')['od_cnts'].sum().reset_index()\n",
- "\n",
- "# 'date'와 'origin_hdong_cd'을 기준으로 'od_cnts'를 집계\n",
- "festival_df_grouped_2 = festival_df.groupby(['origin_hdong_cd'])['od_cnts'].sum().reset_index()\n",
- "\n",
- "# df_1의 'origin_hdong_cd'와 df_2의 '행정동코드'를 기준으로 병합\n",
- "festival_df_grouped_2 = pd.merge(festival_df_grouped_2, address[['행정동코드', '시도명', '시군구명']], \n",
- " left_on='origin_hdong_cd', right_on='행정동코드', how='left')\n",
- "\n",
- "# 병합 후 불필요한 '행정동코드' 컬럼 제거 (필요에 따라)\n",
- "festival_df_grouped_2 = festival_df_grouped_2.drop(columns=['행정동코드'])\n",
- "\n",
- "festival_df_grouped_2.drop_duplicates(inplace=True)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 75,
- "metadata": {},
- "outputs": [],
- "source": [
- "# '시도명'별로 'od_cnts' 합계를 구한 후 'od_cnts' 기준으로 정렬\n",
- "festival_df_grouped_sido = festival_df_grouped_2.groupby('시도명')['od_cnts'].sum().reset_index()\n",
- "\n",
- "# 'od_cnts' 기준으로 내림차순 정렬\n",
- "festival_df_grouped_sido = festival_df_grouped_sido.sort_values(by='od_cnts', ascending=False)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 76,
- "metadata": {},
- "outputs": [],
- "source": [
- "# '시도명'별로 'od_cnts' 합계를 구한 후 'od_cnts' 기준으로 정렬\n",
- "junbok_filtered = festival_df_grouped_2[festival_df_grouped_2['시도명'] == '전라북도']\n",
- "festival_df_grouped_junbok = junbok_filtered.groupby('시군구명')['od_cnts'].sum().reset_index()\n",
- "\n",
- "# 'od_cnts' 기준으로 내림차순 정렬\n",
- "festival_df_grouped_junbok = festival_df_grouped_junbok.sort_values(by='od_cnts', ascending=False)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 77,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " 내/외부인 | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 0 | \n",
- " 외부인 | \n",
- " 35542 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 내부인 | \n",
- " 8863 | \n",
- "
\n",
- " \n",
- "
\n",
- "
"
- ],
- "text/plain": [
- " 내/외부인 od_cnts\n",
- "0 외부인 35542\n",
- "1 내부인 8863"
- ]
- },
- "execution_count": 77,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# 내부인(첫 번째 행)과 외부인(나머지 행)의 데이터프레임 생성\n",
- "internal_df = festival_df_grouped_junbok.iloc[[0]].copy() # .copy() 사용하여 SettingWithCopyWarning 방지\n",
- "internal_df['시군구명'] = '외부인'\n",
- "\n",
- "external_sum = festival_df_grouped_junbok.iloc[1:]['od_cnts'].sum()\n",
- "external_df = pd.DataFrame([['내부인', external_sum]], columns=['시군구명', 'od_cnts'])\n",
- "\n",
- "# 최종 데이터프레임 합치기\n",
- "in_out_df = pd.concat([internal_df, external_df]).reset_index(drop=True)\n",
- "in_out_df.columns = ['내/외부인', 'od_cnts']\n",
- "\n",
- "in_out_df"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "### 외부인 세부분포 파악"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 78,
- "metadata": {},
- "outputs": [],
- "source": [
- "#festival_df_grouped_sido = festival_df_grouped_sido[1:]\n",
- "festival_df_grouped_junbok = festival_df_grouped_junbok.iloc[1:]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 79,
- "metadata": {},
- "outputs": [
- {
- "name": "stdout",
- "output_type": "stream",
- "text": [
- "전라북도\n",
- " 시군구명 od_cnts 시도명\n",
- "4 무주군 35542 전라북도\n",
- "11 전주시 덕진구 2834 전라북도\n",
- "12 전주시 완산구 1561 전라북도\n",
- "10 장수군 1139 전라북도\n",
- "8 익산시 772 전라북도\n",
- "14 진안군 704 전라북도\n",
- "1 군산시 592 전라북도\n",
- "7 완주군 488 전라북도\n",
- "3 남원시 259 전라북도\n",
- "2 김제시 141 전라북도\n",
- "13 정읍시 123 전라북도\n",
- "9 임실군 109 전라북도\n",
- "6 순창군 66 전라북도\n",
- "0 고창군 54 전라북도\n",
- "5 부안군 21 전라북도\n",
- "\n",
- "대전광역시\n",
- " 시군구명 od_cnts 시도명\n",
- "2 서구 1813 대전광역시\n",
- "3 유성구 1379 대전광역시\n",
- "1 동구 1207 대전광역시\n",
- "4 중구 776 대전광역시\n",
- "0 대덕구 562 대전광역시\n",
- "\n",
- "경상남도\n",
- " 시군구명 od_cnts 시도명\n",
- "1 거창군 658 경상남도\n",
- "9 진주시 560 경상남도\n",
- "16 통영시 384 경상남도\n",
- "0 거제시 374 경상남도\n",
- "19 함양군 323 경상남도\n",
- "3 김해시 179 경상남도\n",
- "5 사천시 131 경상남도\n",
- "6 산청군 121 경상남도\n",
- "14 창원시 의창구 115 경상남도\n",
- "13 창원시 성산구 81 경상남도\n",
- "11 창원시 마산합포구 70 경상남도\n",
- "20 합천군 49 경상남도\n",
- "18 함안군 43 경상남도\n",
- "4 남해군 35 경상남도\n",
- "12 창원시 마산회원구 31 경상남도\n",
- "7 양산시 27 경상남도\n",
- "17 하동군 15 경상남도\n",
- "10 창녕군 14 경상남도\n",
- "2 고성군 13 경상남도\n",
- "15 창원시 진해구 7 경상남도\n",
- "8 의령군 5 경상남도\n",
- "\n",
- "충청남도\n",
- " 시군구명 od_cnts 시도명\n",
- "2 금산군 882 충청남도\n",
- "11 천안시 동남구 310 충청남도\n",
- "12 천안시 서북구 265 충청남도\n",
- "1 공주시 170 충청남도\n",
- "10 예산군 153 충청남도\n",
- "3 논산시 148 충청남도\n",
- "9 아산시 142 충청남도\n",
- "0 계룡시 125 충청남도\n",
- "13 홍성군 52 충청남도\n",
- "7 서산시 47 충청남도\n",
- "6 부여군 41 충청남도\n",
- "4 당진시 40 충청남도\n",
- "5 보령시 32 충청남도\n",
- "8 서천군 6 충청남도\n",
- "\n",
- "충청북도\n",
- " 시군구명 od_cnts 시도명\n",
- "3 영동군 1084 충청북도\n",
- "10 청주시 흥덕구 230 충청북도\n",
- "8 청주시 서원구 217 충청북도\n",
- "4 옥천군 211 충청북도\n",
- "7 청주시 상당구 194 충청북도\n",
- "9 청주시 청원구 185 충청북도\n",
- "5 음성군 60 충청북도\n",
- "6 진천군 55 충청북도\n",
- "2 보은군 53 충청북도\n",
- "11 충주시 12 충청북도\n",
- "1 단양군 7 충청북도\n",
- "0 괴산군 6 충청북도\n",
- "\n",
- "경기도\n",
- " 시군구명 od_cnts 시도명\n",
- "34 화성시 202 경기도\n",
- "30 이천시 133 경기도\n",
- "31 평택시 132 경기도\n",
- "26 용인시 기흥구 126 경기도\n",
- "7 남양주시 123 경기도\n",
- "33 하남시 99 경기도\n",
- "10 성남시 분당구 84 경기도\n",
- "0 고양시 덕양구 71 경기도\n",
- "28 용인시 처인구 66 경기도\n",
- "4 구리시 63 경기도\n",
- "9 부천시 57 경기도\n",
- "20 안성시 56 경기도\n",
- "2 광명시 49 경기도\n",
- "19 안산시 상록구 49 경기도\n",
- "3 광주시 48 경기도\n",
- "14 수원시 영통구 48 경기도\n",
- "24 여주시 46 경기도\n",
- "13 수원시 권선구 45 경기도\n",
- "15 수원시 장안구 40 경기도\n",
- "17 시흥시 38 경기도\n",
- "25 오산시 37 경기도\n",
- "5 군포시 33 경기도\n",
- "27 용인시 수지구 31 경기도\n",
- "12 성남시 중원구 20 경기도\n",
- "23 양주시 19 경기도\n",
- "29 의정부시 18 경기도\n",
- "1 과천시 18 경기도\n",
- "18 안산시 단원구 16 경기도\n",
- "21 안양시 동안구 12 경기도\n",
- "22 안양시 만안구 12 경기도\n",
- "16 수원시 팔달구 12 경기도\n",
- "6 김포시 12 경기도\n",
- "11 성남시 수정구 6 경기도\n",
- "32 포천시 6 경기도\n",
- "8 동두천시 5 경기도\n",
- "\n",
- "대구광역시\n",
- " 시군구명 od_cnts 시도명\n",
- "1 달서구 656 대구광역시\n",
- "2 달성군 335 대구광역시\n",
- "4 북구 285 대구광역시\n",
- "6 수성구 163 대구광역시\n",
- "3 동구 126 대구광역시\n",
- "5 서구 82 대구광역시\n",
- "7 중구 27 대구광역시\n",
- "0 남구 12 대구광역시\n",
- "\n",
- "경상북도\n",
- " 시군구명 od_cnts 시도명\n",
- "4 김천시 568 경상북도\n",
- "3 구미시 393 경상북도\n",
- "15 포항시 북구 146 경상북도\n",
- "0 경산시 133 경상북도\n",
- "13 칠곡군 117 경상북도\n",
- "1 경주시 94 경상북도\n",
- "7 안동시 46 경상북도\n",
- "6 성주군 39 경상북도\n",
- "8 영양군 29 경상북도\n",
- "14 포항시 남구 28 경상북도\n",
- "2 고령군 19 경상북도\n",
- "10 예천군 14 경상북도\n",
- "11 의성군 12 경상북도\n",
- "12 청도군 12 경상북도\n",
- "9 영천시 11 경상북도\n",
- "5 상주시 5 경상북도\n",
- "\n",
- "광주광역시\n",
- " 시군구명 od_cnts 시도명\n",
- "0 광산구 477 광주광역시\n",
- "4 서구 245 광주광역시\n",
- "3 북구 223 광주광역시\n",
- "1 남구 138 광주광역시\n",
- "2 동구 9 광주광역시\n",
- "\n",
- "세종특별자치시\n",
- " 시도명 od_cnts\n",
- "0 세종특별자치시 999\n",
- "\n",
- "전라남도\n",
- " 시군구명 od_cnts 시도명\n",
- "11 여수시 142 전라남도\n",
- "3 광양시 111 전라남도\n",
- "10 순천시 103 전라남도\n",
- "7 목포시 61 전라남도\n",
- "5 나주시 54 전라남도\n",
- "8 무안군 44 전라남도\n",
- "6 담양군 24 전라남도\n",
- "9 보성군 19 전라남도\n",
- "13 장성군 18 전라남도\n",
- "1 고흥군 14 전라남도\n",
- "14 화순군 12 전라남도\n",
- "0 강진군 11 전라남도\n",
- "12 영광군 10 전라남도\n",
- "2 곡성군 7 전라남도\n",
- "4 구례군 5 전라남도\n",
- "\n",
- "서울특별시\n",
- " 시군구명 od_cnts 시도명\n",
- "16 송파구 116 서울특별시\n",
- "8 노원구 70 서울특별시\n",
- "17 영등포구 42 서울특별시\n",
- "4 관악구 37 서울특별시\n",
- "6 구로구 33 서울특별시\n",
- "10 동작구 32 서울특별시\n",
- "7 금천구 29 서울특별시\n",
- "13 서초구 27 서울특별시\n",
- "12 서대문구 26 서울특별시\n",
- "1 강동구 26 서울특별시\n",
- "0 강남구 23 서울특별시\n",
- "3 강서구 21 서울특별시\n",
- "11 마포구 19 서울특별시\n",
- "15 성북구 18 서울특별시\n",
- "18 용산구 12 서울특별시\n",
- "20 종로구 10 서울특별시\n",
- "5 광진구 9 서울특별시\n",
- "9 도봉구 6 서울특별시\n",
- "14 성동구 6 서울특별시\n",
- "2 강북구 5 서울특별시\n",
- "19 은평구 5 서울특별시\n",
- "21 중구 5 서울특별시\n",
- "\n",
- "부산광역시\n",
- " 시군구명 od_cnts 시도명\n",
- "9 중구 64 부산광역시\n",
- "5 부산진구 62 부산광역시\n",
- "2 기장군 58 부산광역시\n",
- "10 해운대구 42 부산광역시\n",
- "0 강서구 40 부산광역시\n",
- "4 동래구 40 부산광역시\n",
- "7 사하구 24 부산광역시\n",
- "1 금정구 14 부산광역시\n",
- "3 남구 12 부산광역시\n",
- "8 영도구 9 부산광역시\n",
- "6 사상구 6 부산광역시\n",
- "\n",
- "인천광역시\n",
- " 시군구명 od_cnts 시도명\n",
- "4 서구 132 인천광역시\n",
- "1 남동구 72 인천광역시\n",
- "5 연수구 24 인천광역시\n",
- "6 중구 15 인천광역시\n",
- "0 계양구 12 인천광역시\n",
- "3 부평구 11 인천광역시\n",
- "2 미추홀구 10 인천광역시\n",
- "\n",
- "강원특별자치도\n",
- " 시군구명 od_cnts 시도명\n",
- "0 원주시 92 강원특별자치도\n",
- "1 인제군 50 강원특별자치도\n",
- "\n",
- "울산광역시\n",
- " 시군구명 od_cnts 시도명\n",
- "2 북구 50 울산광역시\n",
- "0 남구 25 울산광역시\n",
- "3 중구 21 울산광역시\n",
- "1 동구 20 울산광역시\n",
- "\n"
- ]
- }
- ],
- "source": [
- "map_filtered = pd.DataFrame()\n",
- "for i in festival_df_grouped_sido['시도명']:\n",
- " # '시도명'별로 'od_cnts' 합계를 구한 후 'od_cnts' 기준으로 정렬\n",
- " junbok_filtered = festival_df_grouped_2[festival_df_grouped_2['시도명'] == i]\n",
- " if i == '세종특별자치시':\n",
- " festival_df_grouped_junbok = junbok_filtered.groupby('시도명')['od_cnts'].sum().reset_index()\n",
- " else:\n",
- " festival_df_grouped_junbok = junbok_filtered.groupby('시군구명')['od_cnts'].sum().reset_index()\n",
- " festival_df_grouped_junbok['시도명'] = i\n",
- " # 'od_cnts' 기준으로 내림차순 정렬\n",
- " festival_df_grouped_junbok = festival_df_grouped_junbok.sort_values(by='od_cnts', ascending=False)\n",
- "\n",
- " map_filtered = pd.concat([map_filtered, festival_df_grouped_junbok])\n",
- " # 결과 출력\n",
- " print(i)\n",
- " print(festival_df_grouped_junbok)\n",
- " print()\n",
- "\n",
- "#map_filtered.drop(columns=['시도명'], inplace=True)\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 80,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " 시도명 | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 13 | \n",
- " 전라북도 | \n",
- " 44405 | \n",
- "
\n",
- " \n",
- " 6 | \n",
- " 대전광역시 | \n",
- " 5737 | \n",
- "
\n",
- " \n",
- " 2 | \n",
- " 경상남도 | \n",
- " 3235 | \n",
- "
\n",
- " \n",
- " 14 | \n",
- " 충청남도 | \n",
- " 2413 | \n",
- "
\n",
- " \n",
- " 15 | \n",
- " 충청북도 | \n",
- " 2314 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 경기도 | \n",
- " 1832 | \n",
- "
\n",
- " \n",
- " 5 | \n",
- " 대구광역시 | \n",
- " 1686 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 경상북도 | \n",
- " 1666 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 광주광역시 | \n",
- " 1092 | \n",
- "
\n",
- " \n",
- " 9 | \n",
- " 세종특별자치시 | \n",
- " 999 | \n",
- "
\n",
- " \n",
- " 12 | \n",
- " 전라남도 | \n",
- " 635 | \n",
- "
\n",
- " \n",
- " 8 | \n",
- " 서울특별시 | \n",
- " 577 | \n",
- "
\n",
- " \n",
- " 7 | \n",
- " 부산광역시 | \n",
- " 371 | \n",
- "
\n",
- " \n",
- " 11 | \n",
- " 인천광역시 | \n",
- " 276 | \n",
- "
\n",
- " \n",
- " 0 | \n",
- " 강원특별자치도 | \n",
- " 142 | \n",
- "
\n",
- " \n",
- " 10 | \n",
- " 울산광역시 | \n",
- " 116 | \n",
- "
\n",
- " \n",
- "
\n",
- "
"
- ],
- "text/plain": [
- " 시도명 od_cnts\n",
- "13 전라북도 44405\n",
- "6 대전광역시 5737\n",
- "2 경상남도 3235\n",
- "14 충청남도 2413\n",
- "15 충청북도 2314\n",
- "1 경기도 1832\n",
- "5 대구광역시 1686\n",
- "3 경상북도 1666\n",
- "4 광주광역시 1092\n",
- "9 세종특별자치시 999\n",
- "12 전라남도 635\n",
- "8 서울특별시 577\n",
- "7 부산광역시 371\n",
- "11 인천광역시 276\n",
- "0 강원특별자치도 142\n",
- "10 울산광역시 116"
- ]
- },
- "execution_count": 80,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "od_cnts_sum_by_sido = map_filtered.groupby('시도명')['od_cnts'].sum().reset_index().sort_values(by='od_cnts', ascending=False)\n",
- "\n",
- "od_cnts_sum_by_sido"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 91,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "text/html": [
- "\n",
- "\n",
- "
\n",
- " \n",
- " \n",
- " | \n",
- " 시도명 | \n",
- " od_cnts | \n",
- "
\n",
- " \n",
- " \n",
- " \n",
- " 2 | \n",
- " 전라북도 | \n",
- " 44405 | \n",
- "
\n",
- " \n",
- " 3 | \n",
- " 충남/대전 지역 | \n",
- " 9149 | \n",
- "
\n",
- " \n",
- " 0 | \n",
- " 전라북도 무주군 (개최지) | \n",
- " 8863 | \n",
- "
\n",
- " \n",
- " 1 | \n",
- " 기타 | \n",
- " 8393 | \n",
- "
\n",
- " \n",
- " 0 | \n",
- " 경상남도 | \n",
- " 3235 | \n",
- "
\n",
- " \n",
- " 4 | \n",
- " 충청북도 | \n",
- " 2314 | \n",
- "
\n",
- " \n",
- "
\n",
- "
"
- ],
- "text/plain": [
- " 시도명 od_cnts\n",
- "2 전라북도 44405\n",
- "3 충남/대전 지역 9149\n",
- "0 전라북도 무주군 (개최지) 8863\n",
- "1 기타 8393\n",
- "0 경상남도 3235\n",
- "4 충청북도 2314"
- ]
- },
- "execution_count": 91,
- "metadata": {},
- "output_type": "execute_result"
- }
- ],
- "source": [
- "# 대전광역시, 충청남도, 세종특별자치시를 '충남/대전 지역'으로 묶기\n",
- "od_cnts_sum_by_sido['시도명'] = od_cnts_sum_by_sido['시도명'].replace({\n",
- " '대전광역시': '충남/대전 지역', \n",
- " '충청남도': '충남/대전 지역', \n",
- " '세종특별자치시': '충남/대전 지역'\n",
- "})\n",
- "\n",
- "# 시도명별 od_cnts 합계 계산\n",
- "od_cnts_sum_grouped = od_cnts_sum_by_sido.groupby('시도명')['od_cnts'].sum().reset_index()\n",
- "\n",
- "# od_cnts 값이 2000 미만인 항목을 '기타'로 묶기\n",
- "od_cnts_sum_grouped['시도명'] = od_cnts_sum_grouped['시도명'].where(od_cnts_sum_grouped['od_cnts'] >= 2000, '기타')\n",
- "\n",
- "\n",
- "# 시도명별 od_cnts 합계 계산\n",
- "od_cnts_sum_grouped = od_cnts_sum_grouped.groupby('시도명')['od_cnts'].sum().reset_index()\n",
- "new_data = pd.DataFrame({'시도명': ['전라북도 무주군 (개최지)'], 'od_cnts': [8863]})\n",
- "od_cnts_sum_grouped = pd.concat([od_cnts_sum_grouped, new_data]).sort_values(by='od_cnts', ascending=False)\n",
- "od_cnts_sum_grouped"
- ]
- },
- {
- "cell_type": "markdown",
- "metadata": {},
- "source": [
- "### 내/외부인 비율 시각화"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": 92,
- "metadata": {},
- "outputs": [
- {
- "data": {
- "image/png": "",
- "text/plain": [
- "