3.2 numpy中的描述性统计函数
· 数值数据的描述性统计主要包括
o 最小值、平均值、中位数、最大值、四分位数、极差、标准差、方差、协方差和变异系数等。
· numpy库包含一些常用的统计函数
· 该库是基于numpy的,所以你可以自然地使用这些函数来进行描述性统计
3.3 中等数值特征的描述性统计方法
· 提供更方便的计算均值等方法,如[''].mean()
· 方法
o 可以一次性获取所有数值特征的非空值个数、均值、四分位数、标准差
3.4 数据:分类特征的描述统计
· 为了描述分类特征的分布,可以使用频率表。 库中实现频数统计的方法是。
· 为类提供将目标要素的数据类型转换为类别的方法。
· 除了支持传统的数值类型外,该方法还可以支持类型数据的描述性统计。 四个统计量分别是列中非空元素的个数、类别数、最大类别数和最大类别数。
4. 时间序列数据的转换与处理
4.1 将字符串时间转换为标准时间
· 大多数情况下:分析时间类型数据的前提是将原本的字符串时间转换为标准时间类型
· 继承numpy库以及库的时间相关模块,提供6个时间相关类
类型
· 最基本、最常用的时间类型
· 大多数情况下,与时间相关的字符串会被转换为
o 功能:实现字符串转换为
· 值得注意的是,打字时间有限
有功能
· 除了将数据字直接转换为格式外,还可以单独提取数据并将其转换为或
· 转换时这两个函数可用于转换数据,也可用于创建时间序列数据。 它们的参数非常相似。
· 在日常使用中,两者的区别比较小:一种是用来指代一系列时间点的数据结构,一种是用来指代一系列时间段的数据结构。
提取时间序列数据信息:类的共同属性
· 大多数与时间相关的数据处理和统计分析过程中,都需要提取该时间中的年、月等数据
从 和 中提取信息
· 从类属性中提取相应信息并可以以类属性的形式实现
· 值得注意的是,与方法相比没有属性,因此该属性不能用于提取周名称数据。 如果要提取信息名称,可以提取属性,然后分别分配0-6这四个标签。
加减时间数据:类
· 它是与时间相关的类别中的异常值。 不仅可以用正数来表示单位时间,也可以用负数来表示单位时间。
· 使用类轻松实现与常规时间相关的类的时间算术运算
· 函数中的时间段没有年月,所有周期名称、对应单位及其说明如下表
· 种类
o 使用 ,您可以轻松地在某个时间上添加或减去一段时间
o 除了实现时间平移之外,还可以将两个时间序列直接相减,得到
欢迎大家加入人工智能圈子,参与交流