首页 > 咨询向导 > 正文

使用numpy的arange()函数生成等差的数组用于分段统计

作者：admin栏目：咨询向导2024-03-07 17:4050

　　案例分析练习：

FIFA2018球员数据分析

　　一、首先要明确分析的目标

　　当获取一份数据集时，应该对数据信息做个总体的了解。

　　1、加载数据文件

　　2、简单查看下数据，有哪些列，都是什么类型的值

　　head方法默认显示头部的5行

　　默认显示

数据字段信息

　　3、看下数据整体统计信息，了解下数据总体分布。

　　在这里插入图片描述

　　二、对数据进行预处理

　　所有需要分析的数据都需要查看，对于数值型，可以看describe⽅法输出的信息，重点关注最⼤值、最⼩值、平均值、行数等数据。

　　1、对需要分析的字段依次查看是否有null值

　　执行显示：name没有null值

　　执行显示：full_name没有null值

　　执行显示：nationality没有null值

　　在这里插入图片描述

　　执行显示：league有253条null值数据，需要进行处理

　　所在联赛、俱乐部都没有值，身价和周薪也是0，253条数据对于一万多条数据来说影响还好，可以删除。

　　删除数据一般放在后面进行，这里因为其他列数据也是异常，所以可以先删掉

　　2、使用drop方法删除league空值数据

　　检查一下是否已删除成功

　　在查看下club是否还有空值

　　3、如果觉得age最小值有问题，单独输出来看下；其他列处理方法类似。

　　4、 eur_value为0的列可以使用平均值来填充（只有几条数据，也可以删除）

　　查看eur_value为0的列是否填充成功

　　在这里插入图片描述

eur_wage列最⼩值也是0，也需要检查下

　　5、最后看下有⽆重复值（如果有可以⽤drop_duplicates处理）

　　指定列判断是否有重复值

　　也可以单独查看full_name是否有重复值

　　在这里插入图片描述

随便找条full_name重复的记录看下

　　数据清洗完毕，开始分析

　　三、确定分析维度和指标

　　1、查看数据样本总数

　　在这里插入图片描述

　　2、对于数值类型列的⼀些常⻅的统计学指标，使用describe方法查看

　　在这里插入图片描述

　　3、对于离散类型数据，直接使用groupby分组，如：国家、俱乐部等维度

　　在这里插入图片描述

将ID列重命名为player_count

　　使用sort_values()函数按照运动员数量进行排序

　　pandas中的sort_values()函数原理类似于SQL中的order by，可以将数据集依照某个字段中的数据进行排序，该函数即可根据指定列数据也可根据指定行的数据排序。

　　在这里插入图片描述

运动员数量⼤于100的国家列表

　　使用league列进行分组统计各⼤联赛得运动员数量

　　求各俱乐部平均周薪

　　使用groupby先对club进行分组，再用mean()方法求得英超联赛English Premier League各个俱乐部球员的平均⽉薪，然后排序sort_values()

　　4、对于连续型数据，通常使用分区间的方式；如：年龄、时间等维度，使用pd.cut()方法分区间进行统计。

使用numpy的arange()函数生成等差的数组用于分段统计

　　在这里插入图片描述

使用cut()将数据进行分区间

　　在这里插入图片描述

以年龄的维度，对已分出区间的数据进行groupby分组统计。

　　在这里插入图片描述

　　四、可视化展示

　　简单的折线图展示：

　　在这里插入图片描述

　　为了使图标展示更好看处理index

　　在这里插入图片描述

　　柱状图展示：

　　在这里插入图片描述

使用numpy的arange()函数生成等差的数组用于分段统计

使用numpy的arange()函数生成等差的数组用于分段统计

admin 管理员

相关推荐

乒乓球世锦赛2023最新消息（乒乓球世锦赛2023最新消息樊振东和黄石谁赢了）

本文目录一览：1、2023年世界乒乓球锦标赛男单冠军是谁2、...

admin
2024-09-30
18 0 0
世界杯最新战报（世界杯最新战报乒乓球）

本文目录一览：1、今年世界杯哪个国家的比赛让人最感动2、怎么看世界杯的比赛单子...

admin
2024-09-30
18 0 0
2020欧洲杯比分全图（2020欧洲杯比赛表）

本文目录一览：1、2020欧洲杯比分结果表2、2020年欧洲杯决赛比分是多少?...

admin
2024-09-30
16 0 0
英超球队排名名单（英超球队排行）

本文目录一览：1、英超联赛球队排名2、英超球队排名...

admin
2024-09-30
18 0 0
詹姆斯目前总得分（詹姆斯目前总得分最新排名）

本文目录一览：1、詹姆斯生涯一共得了多少分?2、勒布朗詹姆斯总得分是多少...

admin
2024-09-30
18 0 0
08奥运男篮故意输给西班牙（男蓝08年奥运会）

本文目录一览：1、08中国男篮vs西班牙比分?2、...

admin
2024-09-30
16 0 0
2022世预赛欧洲区积分榜最新（世预赛欧洲区最新积分榜2019）

本文目录一览：1、2022世界杯、世预赛(欧洲、亚洲)实时积分表、赛制2、...

admin
2024-09-30
16 0 0
nba战况排名（nba目前战绩排名）

本文目录一览：1、nba战况排名2、nba排名季后赛战况...

admin
2024-09-30
18 0 0
奥布拉克（奥布拉克身价）

本文目录一览：1、奥布拉克奥布拉克履历2、奥布拉克是哪国的...

admin
2024-09-30
15 0 0
中国u19国青太强了（u19国青中乙遭开门黑）

本文目录一览：1、熊猫杯中国U19队3:1胜乌拉圭U19国青,三战全胜得冠军2、...

admin
2024-09-30
15 0 0

发表列表

评论列表

还没有评论，快来说点什么吧~