统计研究中的总体()是指我们获取信息的所有对象,每个对象称为个体()。
样本( )是总体的一部分,样本中包含的个体数量称为样本量( size )。
从样本中收集信息作为对总体进行某些评估的基础的活动称为抽样调查( )。
抽样调查的三个要点( ):
想象一位厨师正在准备一锅晚餐汤。 为了确保汤的味道恰到好处,他舀了一两勺并尝了尝。 此时,整锅汤就是需要评价的整体,一勺对应的是抽取的样本。 假设你刚加盐后尝一下,结果可能是咸的。 正确的做法是搅拌均匀,然后品尝,实现随机取样。 最后的汤量和吃的人数有关,但不管锅大还是小,只要一两勺就够味道了。
参数( )用于描述总体,参数为固定数字; 统计量( )是基于对抽样数据的分析和总结,不同的样本对应不同的统计量。 抽样调查是通过统计来估计总体参数。
通常用希腊字母来表示总体的模型参数,用相应的拉丁字母来表示从样本中得到的统计值。
为了避免人为因素(自发反应、方便样本)造成的偏差,实际操作中常用简单随机抽样(SRS:)方法,即利用无需人为选择的机会来选择样本。 常见的简单随机抽样方法:
常见的随机数生成器网站:
在实际应用中,常常引入如下采样设计( )来防止偏差,提高效率:
以食堂调查为例,为了收集一年级新生对食堂食品质量的反馈,可以做如下设计:
识别并避免抽样偏差: