Movie Dataset

watcha.net 사이트에서 수집한 영화 및 영화 리뷰 데이터


Dataset Info

  • Movie data
    • 데이터수: 13,791 건
    • 포함정보: code, title, filmrate, year, genre, running_time, nation, review_count
    • 예시: muz6xu, 배트맨 대 슈퍼맨: 저스티스의 시작, 12세 관람가, 2016, 액션, 151, 미국, 4344
  • Review data
    • 데이터수: 2,392,174 건
    • 포함정보: comment_code, movie_unique_id(movie.code), usercode, rating, like_count, updated_at, text
    • 수집기간: 2012/11/08 ~ 2016/04/27
    • 예시: c8480f23b2eb9, mjvntm, 6UXd5ya55V2K, 4, 0, 2016-04-27 14:02:10, 슬프면서 아픔이 느껴지는 영화

활용 예시

  • 리뷰수가 많은 영화 TOP 100 (sql)
    select 
        title, filmrate, year, genre, running_time, 
        nation, avg, review_count 
    from movie, 
        (select 
            movie_unique_id, 
            avg(rating) as avg, 
            count(*) as cnt 
        from review 
        group by movie_unique_id 
        order by cnt desc limit 100) 
    as review_data 
    where review_data.movie_unique_id = movie.code;

댓글 남기기

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.

%d 블로거가 이것을 좋아합니다: