데이터분석/예시코드

웹 스크래핑 : 네이버 영화 평점

이규승 2022. 6. 1. 14:33
728x90
import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.naver?sel=pnt&date=20210101',headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

tr = soup.select('#old_content > table > tbody > tr') 

for tr2 in tr:
  a = tr2.select_one('a')
  if a is not None:
    rank = tr2.select_one('img')['alt']
    title = a.text
    star = tr2.select_one('td.point').text
    print(rank,title,star)
    
    ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ
01 그린 북 9.59
02 가버나움 9.59
03 가나의 혼인잔치: 언약 9.59
04 디지몬 어드벤처 라스트 에볼루션 : 인연 9.55
05 먼 훗날 우리 9.54
06 베일리 어게인 9.53
07 언플랜드 9.52
08 원더 9.50
09 극장판 바이올렛 에버가든 9.49
010 아일라 9.49
11 당갈 9.49
12 포드 V 페라리 9.49
13 주전장 9.48
14 쇼생크 탈출 9.44
15 터미네이터 2:오리지널 9.44
16 나 홀로 집에 9.43
17 덕구 9.42
.
.
.
728x90

'데이터분석 > 예시코드' 카테고리의 다른 글

LSTM으로 주식을 예측  (1) 2022.06.03
네이버 영화 리뷰 데이터로 감성분류  (0) 2022.06.02
웹 스크래핑 : 기초  (0) 2022.05.29
RNN을 이용한 텍스트 생성  (0) 2022.05.27
CountVectorizer, TfidfVectorizer  (0) 2022.05.26