我觉得总结和重复对一个学科会有帮助,所以我写了这篇文章,方便知识结构。 本片主要介绍统计学中的一些基本概念。 想要深入学习统计学,就必须熟悉它的基本概念,所以这篇文章是对统计知识的介绍。
统计学是利用概率论和数理统计的基本原理来研究数据的收集、组织和分析的方法论。
基本概念
变量():研究对象中各观测单元的某种特征。
变量值( 的值):变量的观测结果。
同质():相似的事物或现象。
():在同质基础上观察到的或测量到的值之间的差异。
总体():根据研究目的确定的同质个体的总和。
样本():从总体中随机选择的代表性部分。
抽样():从群体中抽取观察到的个体形成样本的过程。
参数():描述总体的特征量。 用希腊字母μ、σ、π表示。
统计量():描述样本的特征量。 用拉丁字母或英文字母\bar{x}、S、P表示。
误差:观测值与真实值之间的差异。
(1)随机误差(error):不恒定、随机变化的误差。 抽样误差:抽样造成的样本统计量与总体参数之间的差异。
(2)系统误差(error):仪器未校准、测量者的倾向等。一般是方向性偏高或偏低。
(3)粗差:由各种误差引起的误差。 数据记录错误、仪器故障等。
概率 ():观察中随机事件发生的概率。 代表作:P.
概率推理:由于抽样误差,推理是概率性的。习惯上称P≤0.05为小概率事件,表明某事
事件发生的概率很小,即低概率事件的“实际不可能”。
随机事件:0
统计类型
数值变量( ):又称连续变量、定量变量。
变量的值是用定量的方法测量的,以数值表示,通常具有一定的测量单位。 获得的数据称为测量数据。
分类变量( )也称为定性变量,其变量值是采用定性方法获得的。 即按观察值的属性(类别)进行分组和计数。
无序和有序分类变量。
1.无序分类变量( ):获得的数据称为计数数据。
(1)二元分类变量:两个相互对立的类别,如治疗结果分为两类:治愈和未治愈。
(2)多分类变量:例如测量某一人群的血型时,结果分为A型、B型、AB型、O型,表现出多个相互不相容的类别。
2、序数分类变量( ):各类别之间有一定程度的差异,且排列有序,具有半定量意义,又称半定量变量。 获得的数据称为等级数据。
暂时就这些,稍后我会更新。