웹 스크래핑 : 네이버 영화 평점

데이터분석/예시코드

웹 스크래핑 : 네이버 영화 평점

이규승 2022. 6. 1. 14:33

728x90

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.naver?sel=pnt&date=20210101',headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

tr = soup.select('#old_content > table > tbody > tr') 

for tr2 in tr:
  a = tr2.select_one('a')
  if a is not None:
    rank = tr2.select_one('img')['alt']
    title = a.text
    star = tr2.select_one('td.point').text
    print(rank,title,star)
    
    ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ
01 그린 북 9.59
02 가버나움 9.59
03 가나의 혼인잔치: 언약 9.59
04 디지몬 어드벤처 라스트 에볼루션 : 인연 9.55
05 먼 훗날 우리 9.54
06 베일리 어게인 9.53
07 언플랜드 9.52
08 원더 9.50
09 극장판 바이올렛 에버가든 9.49
010 아일라 9.49
11 당갈 9.49
12 포드 V 페라리 9.49
13 주전장 9.48
14 쇼생크 탈출 9.44
15 터미네이터 2:오리지널 9.44
16 나 홀로 집에 9.43
17 덕구 9.42
.
.
.

728x90

저작자표시 (새창열림)

'데이터분석 > 예시코드' 카테고리의 다른 글

LSTM으로 주식을 예측 (1)	2022.06.03
네이버 영화 리뷰 데이터로 감성분류 (0)	2022.06.02
웹 스크래핑 : 기초 (0)	2022.05.29
RNN을 이용한 텍스트 생성 (0)	2022.05.27
CountVectorizer, TfidfVectorizer (0)	2022.05.26

현재글웹 스크래핑 : 네이버 영화 평점

혼자 공부하는 방

sklearn, 텐서플로, SVM, rnn, Keras, 빅데이터분석기사 실기, 분류모델, countvectorizer, TensorFlow, sqld, TfidfVectorizer, 프로그래머스, DBSCAN, konlpy, lstm, Ensemble, 배깅, 앙상블, 선형회귀모델, Logistic Regression,

Today :
Yesterday :

혼자 공부하는 방

웹 스크래핑 : 네이버 영화 평점

'데이터분석 > 예시코드' 카테고리의 다른 글

'데이터분석/예시코드'의 다른글

티스토리툴바

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

웹 스크래핑 : 네이버 영화 평점

'데이터분석 > 예시코드' 카테고리의 다른 글

'데이터분석/예시코드'의 다른글

관련글

티스토리툴바