SlideShare a Scribd company logo
1 of 19
豆瓣电影数据分析
Douban Movie Data Analysis
汇报人:张童银
02 数据说明
Data description
01 分析范围
Analysis scope
03 数据结果
Data results
04 结论与建议
Conclusion and Suggestion
目录
CONTENT
分析范围
一、分析范围
分析对象: 豆瓣电影数据,不包含电视剧、综艺等其他类型
分析范围: 电影发行量、评分表现、受关注程度
数据说明
二、数据说明
数据来源
www.douban.com,通过Python爬虫获取量
数据总量
8869条电影数据
统计时间
2020年8月
数据结果
在我们在我们菜品的价格区间中,10-50元价格区间的菜品最
受欢迎。
菜品的价格,是影响一家餐馆生意好坏的重要因素之一,尤
其是对中小餐馆而言,更是如此。现在餐饮业的竞争相当激
烈,一家餐馆想要脱颖而出,一般需要有特色菜。
每年电影数量变化
全从数据来看,从1980年开始,电
影年产量开始迅速增长。数据中,
发行最早的是《一个国家的诞生
The Birth of a Nation》,1915年2
月8日于美国上映。
在我们在我们菜品的价格区间中,10-50元价格区间的菜品最
受欢迎。
菜品的价格,是影响一家餐馆生意好坏的重要因素之一,尤
其是对中小餐馆而言,更是如此。现在餐饮业的竞争相当激
烈,一家餐馆想要脱颖而出,一般需要有特色菜。
每年电影数量变化
我们将时间线缩短至近20年,再进
一步观察。可以看到,在2019年电
影发行量达到了一个峰值,全年共
有624部电影上映,同比增长
26.8%,市场非常火热。
为什么菜馆的麻辣香锅最受欢迎,可能因为麻
辣香锅口味重,且便捷。
菜品的及时更新和调整有利于我们更好的了解
顾客需求,更好的销售自己的产品,产生最大
的利润。要做到及时更新菜品,及时对菜品进行
分析。
评分分布与变化情况
评分情况呈左偏分布,形态基本符
合正态分布,中间区域的评分情况
占多数,极端好评和差评的电影均
为少数。经计算得出,电影评分均
值为7.18,高于中位数6。以7.18为
分界,高于这个评分的,可认为是
质量不错的电影。
为什么菜馆的麻辣香锅最受欢迎,可能因为麻
辣香锅口味重,且便捷。
菜品的及时更新和调整有利于我们更好的了解
顾客需求,更好的销售自己的产品,产生最大
的利润。要做到及时更新菜品,及时对菜品进行
分析。
评分分布与变化情况
以上是每年电影评分的箱线图,橘
色的线代表中位数。我们可以明显
看到,随着年份的变化,橘色线所
在的位置也在逐渐下移。也就意味
着评分正在逐年下降。这样就意味
着,电影质量越来越差,市场鱼龙
混杂。
评分与观看人数
高分热片(右上角区域)
这一类电影是那些观看人数众
多且好评如潮的佳作。这些电
影成功地吸引了大量观众,同
时赢得了他们的高度认可
冷门佳片(右下角区域)
这类电影通常是艺术性与商业
性的巧妙结合,可能因为其独
特之处而在后期获得了更多的
关注。
烂片(左下角区域)
观众对这类电影的评价普遍较
差,可能导致口碑和票房双双
受挫。
评分与电影类型及数量的相关性数
数据结果
最受欢迎的电影类型为剧情(4661)、喜剧
(2555)、动作(1962)、爱情(1884)、惊
悚(1369)和犯罪(1229)这5大类,括号内为
出现的频次。且主要的评价区域依然集中在中位
偏上,也就是6至8分的位置。其中剧情类型的电
影,好评占比最大。
调研结论
电影的语言选择基本上与其制片国家密切相关。
经济和文化发达的国家通常拥有更多的电影产业
资源和技术支持,因此在国际市场上发行的电影
更倾向于使用该国语言。
国家电影总数量分布数
数据结果
美国电影数量最多,3259条,占总数据样本的
36.7%,非常强势。其次为中日英法,头部效应
非常明显。此外,电影数量少的原因也有很多,
比如没有被我们关注到,导致没有被网站收录。
也有可能电影所代表的的文娱产业,在经济高速
发展的国家会远高于落后国家。
调研结论
通过相关性分析,我们可以了解观众的文化差异
和年龄群体对于不同类型电影的偏好,有助于电
影产业更精准地迎合观众口味,提高市场竞争力。
电影语种统计
数据结果
排名前5的语种分别为英语、普通话、日语、粤语、
法语。与各国电影总量成正比关系,基本在什么
国家发行,用的就是什么语言。
调研结论
通过相关性分析,我们可以了解观众的文化差异
和年龄群体对于不同类型电影的偏好,有助于电
影产业更精准地迎合观众口味,提高市场竞争力。
电影类型分布情况
数据结果
电影类型与评分的数据显示,最受欢迎的电影类
型分别为剧情、喜剧、动作、爱情、惊悚和犯罪。
这种趋势反映了观众对深刻情节、轻松喜剧、刺
激动作以及感人爱情的普遍喜好。不同类型电影
的高评分可能与观众对于故事情节、幽默感、视
觉效果和情感体验的需求有关。
调研结论
通过相关性分析,我们可以了解观众的文化差异
和年龄群体对于不同类型电影的偏好,有助于电
影产业更精准地迎合观众口味,提高市场竞争力。
结论与分析
结论与分析
美国电影产业的主导地位
数据显示,美国电影数量最多,占据总
数据样本的36.7%,凸显了美国在全球
电影产业中的强势地位。
全球电影产业分布不均衡
参影数量在全球范围内呈现不均衡分布,
这可能是由于经济、文化、技术等因素
的差异导致的。一些国家由于资源丰富,
拥有更强大的电影产业,而一些国家则
受到限制,影响了其电影制作数量和国
际市场份额。
中日英法等国头部效应显著
中国、日本、英国、法国等国家紧随美
国,呈现头部效应。可能是由于其文化
输出、创意实力和经济状况等多方面因
素的共同作用。
语言与制片国关联紧密
排名前5的语种与各国电影总量正
相关,表明制片国家语言与电影产
出密切相关。
电影数量少的国家原因多样
数量较少的国家原因包括被忽视、
未被网站收录,以及经济滞后等,
需要进一步深入分析。。
A
B
C
D
E
THANKS
感谢您的观看 For Watching
汇报人:张童银

More Related Content

More from jeffery57

某教育网站想要提升用户转化率,提出了主页改版方案。网站目前使用轮播图形式推广上新课程,现决定新增主页上方资源位进行课程更新与预告。为确保主页优化的有效性,...
某教育网站想要提升用户转化率,提出了主页改版方案。网站目前使用轮播图形式推广上新课程,现决定新增主页上方资源位进行课程更新与预告。为确保主页优化的有效性,...某教育网站想要提升用户转化率,提出了主页改版方案。网站目前使用轮播图形式推广上新课程,现决定新增主页上方资源位进行课程更新与预告。为确保主页优化的有效性,...
某教育网站想要提升用户转化率,提出了主页改版方案。网站目前使用轮播图形式推广上新课程,现决定新增主页上方资源位进行课程更新与预告。为确保主页优化的有效性,...
jeffery57
 

More from jeffery57 (12)

大数据岗位需求调研。出于转行数据类岗位的需求,对近5年的相关招聘信息进行分析,主要想了解,大数据类岗位有哪些细分职位,以及他们所要求的技能有哪些。
大数据岗位需求调研。出于转行数据类岗位的需求,对近5年的相关招聘信息进行分析,主要想了解,大数据类岗位有哪些细分职位,以及他们所要求的技能有哪些。大数据岗位需求调研。出于转行数据类岗位的需求,对近5年的相关招聘信息进行分析,主要想了解,大数据类岗位有哪些细分职位,以及他们所要求的技能有哪些。
大数据岗位需求调研。出于转行数据类岗位的需求,对近5年的相关招聘信息进行分析,主要想了解,大数据类岗位有哪些细分职位,以及他们所要求的技能有哪些。
 
互联网活动参会经历,让我了解到了当今的时代已经是AI时代。AIGC技术在多个行业的应用案例不断涌现,如GPT-3、DALL-E等生成式AI技术已经在各行业...
互联网活动参会经历,让我了解到了当今的时代已经是AI时代。AIGC技术在多个行业的应用案例不断涌现,如GPT-3、DALL-E等生成式AI技术已经在各行业...互联网活动参会经历,让我了解到了当今的时代已经是AI时代。AIGC技术在多个行业的应用案例不断涌现,如GPT-3、DALL-E等生成式AI技术已经在各行业...
互联网活动参会经历,让我了解到了当今的时代已经是AI时代。AIGC技术在多个行业的应用案例不断涌现,如GPT-3、DALL-E等生成式AI技术已经在各行业...
 
数字媒体引领读书社交新时代:我的小红书之旅。在这个数字媒体引领的读书社交新时代,我的小红书之旅正是其中的见证者和推动者。
数字媒体引领读书社交新时代:我的小红书之旅。在这个数字媒体引领的读书社交新时代,我的小红书之旅正是其中的见证者和推动者。数字媒体引领读书社交新时代:我的小红书之旅。在这个数字媒体引领的读书社交新时代,我的小红书之旅正是其中的见证者和推动者。
数字媒体引领读书社交新时代:我的小红书之旅。在这个数字媒体引领的读书社交新时代,我的小红书之旅正是其中的见证者和推动者。
 
社交产品创新的底层逻辑的思考:通过满足用户需求、抓住社会趋势和整合技术创新,提供更有吸引力和创新性的社交体验。
社交产品创新的底层逻辑的思考:通过满足用户需求、抓住社会趋势和整合技术创新,提供更有吸引力和创新性的社交体验。社交产品创新的底层逻辑的思考:通过满足用户需求、抓住社会趋势和整合技术创新,提供更有吸引力和创新性的社交体验。
社交产品创新的底层逻辑的思考:通过满足用户需求、抓住社会趋势和整合技术创新,提供更有吸引力和创新性的社交体验。
 
对过去2009年到2019年的双十一销售额进行复盘与预测,并以预测值为目标GMV,进行数据建模,预测2020年的销售额
对过去2009年到2019年的双十一销售额进行复盘与预测,并以预测值为目标GMV,进行数据建模,预测2020年的销售额对过去2009年到2019年的双十一销售额进行复盘与预测,并以预测值为目标GMV,进行数据建模,预测2020年的销售额
对过去2009年到2019年的双十一销售额进行复盘与预测,并以预测值为目标GMV,进行数据建模,预测2020年的销售额
 
市场部新增了一个渠道资源位,可以用来推广商品,需要基于以往的商品转化数据,运用AHP分析法选择一个效果最优的商品。
市场部新增了一个渠道资源位,可以用来推广商品,需要基于以往的商品转化数据,运用AHP分析法选择一个效果最优的商品。市场部新增了一个渠道资源位,可以用来推广商品,需要基于以往的商品转化数据,运用AHP分析法选择一个效果最优的商品。
市场部新增了一个渠道资源位,可以用来推广商品,需要基于以往的商品转化数据,运用AHP分析法选择一个效果最优的商品。
 
基于电商的用户消费行为分析,对往期的消费者数据进行各维度的特征分析,找到用户消费规律
基于电商的用户消费行为分析,对往期的消费者数据进行各维度的特征分析,找到用户消费规律基于电商的用户消费行为分析,对往期的消费者数据进行各维度的特征分析,找到用户消费规律
基于电商的用户消费行为分析,对往期的消费者数据进行各维度的特征分析,找到用户消费规律
 
基于RFM的用户精细化管理,通过对交易环节中最为核心的3个维度 —— 最近消费、消费频率、消费金额,细分客户群体,从而体现不同客户的价值。
基于RFM的用户精细化管理,通过对交易环节中最为核心的3个维度 —— 最近消费、消费频率、消费金额,细分客户群体,从而体现不同客户的价值。基于RFM的用户精细化管理,通过对交易环节中最为核心的3个维度 —— 最近消费、消费频率、消费金额,细分客户群体,从而体现不同客户的价值。
基于RFM的用户精细化管理,通过对交易环节中最为核心的3个维度 —— 最近消费、消费频率、消费金额,细分客户群体,从而体现不同客户的价值。
 
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作
 
某教育网站想要提升用户转化率,提出了主页改版方案。网站目前使用轮播图形式推广上新课程,现决定新增主页上方资源位进行课程更新与预告。为确保主页优化的有效性,...
某教育网站想要提升用户转化率,提出了主页改版方案。网站目前使用轮播图形式推广上新课程,现决定新增主页上方资源位进行课程更新与预告。为确保主页优化的有效性,...某教育网站想要提升用户转化率,提出了主页改版方案。网站目前使用轮播图形式推广上新课程,现决定新增主页上方资源位进行课程更新与预告。为确保主页优化的有效性,...
某教育网站想要提升用户转化率,提出了主页改版方案。网站目前使用轮播图形式推广上新课程,现决定新增主页上方资源位进行课程更新与预告。为确保主页优化的有效性,...
 
直播电商行业分析报告.pptx
直播电商行业分析报告.pptx直播电商行业分析报告.pptx
直播电商行业分析报告.pptx
 
2020年新冠疫情可视化分析.pptx
2020年新冠疫情可视化分析.pptx2020年新冠疫情可视化分析.pptx
2020年新冠疫情可视化分析.pptx
 

豆瓣电影数据分析报告。旨在揭示该平台上电影的趋势和用户偏好。通过对豆瓣电影数据的仔细研究,我深入挖掘了不同电影类型的受欢迎程度、用户评分与票房的关系、导演和演员的影响等方面的信息。