基于SQL和pandas的欧洲足球数据分析【附图详解】 - 知乎
我又又又搬运了以前的存货来分享啦!
项目来源:
https://www.kaggle.com/hugomathien/soccer
项目简介:
利用SQL和pandas对11支球队在7个赛季中的25979场比赛数据,分析各球队在每个赛季的主客场得分情况以及联赛积分情况。
PS: 项目本身提供的是sqlite文件,为了更贴近现实中的工作场景,我将其中的表都输出成csv文件,再利用Navicat for MySQL 导入到MYSQL当中。(文末附资源链接)本次项目同样在jupyter上运行。
导入模块:
数据库中的表格:
国家名单:
将country表和league表连接起来:
按队名排序中的前十名:
输出spain主客队比赛的信息:
统计各个国家的各个联赛的各个赛季中stage大于10的球队主客队平均得分,主客队平均分之和与差,以及总和:
列出几支球队的各赛季平均得分趋势图:
列出几支球队的各赛季平均主客队分差趋势图:
求各赛季各球队的积分(赢球得3分,平局得1分,输球不得分):
列出几支球队的各赛季积分趋势图:
结束语
此次项目的数据提供了不少数据,就连球员的EA SPORT游戏中的数据都有,不过这个项目我主要也是拿来练手,并没有刻意去将全部的数据都拿来分析,大概感兴趣的话也可以自己尝试一下。我把最初kaggle提供的sqlite文件,后面我自己输出的csv文件和sql文件以及本次完整代码都放到了网盘上,需要的朋友自行下载:链接:https://pan.baidu.com/s/1CbrdX0q18W9v-PgNyZfRPg 提取码:1024
了解更多内容,可以关注我的数据分析专栏。
相关文章
发表评论
评论列表
- 这篇文章还没有收到评论,赶紧来抢沙发吧~