watcha.net 사이트에서 수집한 영화 및 영화 리뷰 데이터
- txt 파일
- sql 파일
Dataset Info
- Movie data
- 데이터수: 13,791 건
- 포함정보: code, title, filmrate, year, genre, running_time, nation, review_count
- 예시: muz6xu, 배트맨 대 슈퍼맨: 저스티스의 시작, 12세 관람가, 2016, 액션, 151, 미국, 4344
- Review data
- 데이터수: 2,392,174 건
- 포함정보: comment_code, movie_unique_id(movie.code), usercode, rating, like_count, updated_at, text
- 수집기간: 2012/11/08 ~ 2016/04/27
- 예시: c8480f23b2eb9, mjvntm, 6UXd5ya55V2K, 4, 0, 2016-04-27 14:02:10, 슬프면서 아픔이 느껴지는 영화
활용 예시
- 리뷰수가 많은 영화 TOP 100 (sql)
select title, filmrate, year, genre, running_time, nation, avg, review_count from movie, (select movie_unique_id, avg(rating) as avg, count(*) as cnt from review group by movie_unique_id order by cnt desc limit 100) as review_data where review_data.movie_unique_id = movie.code;