近年,国内电影市场增长迅速,电影已然成了国民娱乐业越来越重要的一环。中国电影诞生于1905年,历经了中国半封建、
半殖民地时期,革命战争时期,新中国建设时期,文革时期,改革开放时期和全面建设小康社会新时期等各个历史阶段;经历了从无声到有声,从黑白到彩色,从模拟到数字,
从传统到现代的技术变革进程。在不同的发展阶段,中国电影都留下了优秀的代表作。
然而,关于诸多中国电影早期的代表作,却因为缺少记录而被人遗忘。本项目着手这点,采用python爬虫技术前往各大主流网页(诸如豆瓣、IMDB等)进行数据挖掘,并进行严格的数据筛选,整理出二十世纪中国电影的片单。基于这份资料,本项目进行多方位的整理,从多个方面对中国各个时期的电影进行分析,并由团队进行可视化处理,使用户可以方便的筛选数据。
项目成员平时喜欢欣赏老电影,从第一部电影《定军山》,后来的《霸王别姬》,中国老电影的道路非常曲折,可以说也是我国文艺发展史的缩影。所以一个基于数据挖掘的中国老电影数据采集与分析项目便酝酿出来了,将专业知识与兴趣爱好相结合,并对中国电影史进行了总结。这也就是为什么项目成员选择了这个话题。