diff --git "a/221013 \353\202\230\353\254\264\354\234\204\355\202\244 \355\212\270\353\236\231 \354\240\225\353\263\264 \355\201\254\353\241\244\353\247\201.ipynb" "b/221013 \353\202\230\353\254\264\354\234\204\355\202\244 \355\212\270\353\236\231 \354\240\225\353\263\264 \355\201\254\353\241\244\353\247\201.ipynb" new file mode 100644 index 0000000..aa44075 --- /dev/null +++ "b/221013 \353\202\230\353\254\264\354\234\204\355\202\244 \355\212\270\353\236\231 \354\240\225\353\263\264 \355\201\254\353\241\244\353\247\201.ipynb" @@ -0,0 +1,260 @@ +{ + "cells": [ + { + "cell_type": "code", + "execution_count": 2, + "id": "64523b0f", + "metadata": {}, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "/var/folders/z_/w5_jprkx4n9grd7jx_1lqz8r0000gn/T/ipykernel_6098/2399819394.py:10: DeprecationWarning: executable_path has been deprecated, please pass in a Service object\n", + " driver = webdriver.Chrome(executable_path='/Users/kimsieun/Documents/Daitgirls/FinalProject/chromedriver')\n" + ] + } + ], + "source": [ + "from selenium import webdriver\n", + "from bs4 import BeautifulSoup\n", + "from selenium.webdriver.chrome.service import Service\n", + "from webdriver_manager.chrome import ChromeDriverManager\n", + "import pandas as pd\n", + "\n", + "chrome_optios = webdriver.ChromeOptions()\n", + "# driver = webdriver.Chrome(service=Service(ChromeDriverManager(os_type=\"mac_arm64\").install()))\n", + "# driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=chrome_option)\n", + "driver = webdriver.Chrome(executable_path='/Users/kimsieun/Documents/Daitgirls/FinalProject/chromedriver')" + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "id": "1f6b0467", + "metadata": {}, + "outputs": [], + "source": [ + "# 크롤링할 주소 설정\n", + "url = 'https://namu.wiki/w/%ED%81%AC%EB%A0%88%EC%9D%B4%EC%A7%80%EB%A0%88%EC%9D%B4%EC%8B%B1%20%EC%B9%B4%ED%8A%B8%EB%9D%BC%EC%9D%B4%EB%8D%94/%ED%8A%B8%EB%9E%99/1920' #카트 트랙 랭킹 \n", + "driver.get(url)" + ] + }, + { + "cell_type": "code", + "execution_count": 16, + "id": "ed5db561", + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "1920 수상한 증기 공장\n", + " \n", + "러쉬플러스\n", + "난이도●●○○○\n", + "랩3바퀴\n", + "트랙 길이9.5km\n", + "진행 방향시계방향\n", + "트랙 분류아이템전\n", + "AI 주행X\n", + "서버 \n", + "첫 등장일2013년 12월 26일\n", + "리그 트랙-\n", + "라이센스모바일: 루키\n", + "약칭증기공장\n" + ] + } + ], + "source": [ + "# 소스를 읽어 BeatuifulSoup를 이용해 파싱\n", + "html = driver.page_source # 브라우저가 가지고 있는 정보를 가져옴\n", + "soup = BeautifulSoup(html, \"html.parser\")\n", + "track_list = soup.select(\"table.UQjgK8i0._f0b7325cc9e2662864c573d822bf4dca\")\n", + "# print(track_list[0].prettify())\n", + "trs = track_list[0].select(\"tr\") \n", + "for tr in trs:\n", + " print(tr.text)" + ] + }, + { + "cell_type": "code", + "execution_count": 35, + "id": "91cb0379", + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + " | 트랙 이름 | \n", + "태그 | \n", + "난이도 | \n", + "랩 | \n", + "트랙 길이 | \n", + "진행 방향 | \n", + "트랙 분류 | \n", + "AI 주행 | \n", + "첫 등장일 | \n", + "리그 트랙 | \n", + "라이센스 | \n", + "약칭 | \n", + "
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", + "1920 수상한 증기 공장 | \n", + "러쉬플러스 | \n", + "●●○○○ | \n", + "3바퀴 | \n", + "9.5km | \n", + "시계방향 | \n", + "아이템전 | \n", + "X | \n", + "2013년 12월 26일 | \n", + "- | \n", + "모바일: 루키 | \n", + "증기공장 | \n", + "
1 | \n", + "1920 기차역 질주 | \n", + "\n", + " | ●●○○○[구3] | \n", + "2바퀴 | \n", + "8.6km | \n", + "시계방향 | \n", + "스피드전 | \n", + "X | \n", + "2013년 12월 26일 | \n", + "- | \n", + "- | \n", + "기차역 | \n", + "
2 | \n", + "1920 아슬아슬 비행장 | \n", + "노멀 러쉬플러스 | \n", + "●●●○○[구2] | \n", + "2바퀴 | \n", + "10.5km[8] | \n", + "시계방향 | \n", + "스피드전 | \n", + "X | \n", + "2014년 1월 23일 | \n", + "- | \n", + "모바일: 루키 | \n", + "1920, 1920비행장 | \n", + "