1. 能将两个相关变量的数据制作散点图,并能利用散点图了解变量之间的相关性。 2.理解最小二乘法的思想,能够根据给定的线性回归方程的系数公式建立线性回归方程。 3.了解独立性测试的基本思想、方法和简单应用(只需要22个列联表)。 4.了解回归分析的基本思想、方法和简单应用。 函数关系是确定性关系,相关关系是非确定性关系。 函数关系是因果关系,而相关性不一定是因果关系,也可能是伴随关系。 求回归方程的关键是正确求出系数a和b。 由于a和b的计算量较大,因此计算时要仔细、分层,避免计算造成误差。 回归分析是对两个具有相关性的变量进行统计分析的方法。 只有当散点图大致呈线性时,得到的回归线方程才具有实际意义。 否则,得到的回归直线方程是没有意义的。 两个变量之间呈线性相关 (1) 正相关 在散点图中,点分散在从 到 的区域中。 对于两个变量之间的这种相关性,我们称之为正相关。 (2) 负相关 在散点图中,点分散在从 到 的区域中。 两个变量之间的这种相关性称为负相关性。 (3)线性相关和回归线。 如果散点图中点的分布整体上大致相同,则称两个变量之间存在线性相关。 这条直线称为回归线。 如何利用散点图判断两个变量之间是否存在相关性? 如图10页第9章所示,有5组(x,y)数据。 去掉这组数据后,剩下的4组数据有很强的线性相关性。 Page 11 第 9 章 2. 回归直线方程 (1) 最小二乘法: 求出样本数据点与回归直线最小的回归直线的方法称为最小二乘法。 (2) 回归方程:方程 y 是两个具有线性相关变量的一组数据 (x) 的回归方程,其中 a Page 12 第 9 章 工人月工资(元)随劳动产值(千元)变化) 回归线方程=60+90x。 下列判断是否正确? 劳动产值1000元时,工资为50元(第13页第9章1.
21. 82. 53. 23. 8 Page 14 第 9 章 分类变量:变量的不同“值”表明哪些个体属于它们。 像这样的变量称为分类变量。 (2) 列联表:列出的两个分类变量称为列联表。 假设有两个分类变量X和Y,它们的可能值分别为{x},它们的样本频率列联表(称为22列联表)为第15页第9章,其中n = 为样本量。 Page 16 第 9 章 (3) 独立性检验 利用随机变量 K 来确定其在多大程度上可以被视为“”的方法称为两个分类变量的独立性检验。 第9章第17页,那么表中a和b的值分别是。 (2)打鼾与心脏病调查,共调查1671人。 计算出K的观测值后,k=27.63。 根据这一数据分析,我们有理由相信打鼾与心脏病有关。 (填写“相关”或“不相关”)。 总计 46120 第 18 章 第九章 想想左下角、右上角、左上角、右下角有一条直线: 提示:散点图呈带状,面积较窄,说明两个变量相关,否则它们不是。 填写:D2。 填写距离的平方和: (3, 2. 5) 第 9 章第 19 页 = 2. 5。回归线必须经过点 (3, 2. 5)。 Page 20 第 9 章 不同类别频数表 如果两个类别变量相关,则填写: (1) 52, 74 (2) 相关提示:k = 27。
636. 635、“打鼾与心脏病有关”的把握超过99%。 在第21页第9章核心点研究第22页第9章并非全部相等)的散点图中,如果所有样本点都在(xx+1)上,那么这组样本数据的样本相关系数为(第23页第23页) 9 【问题复习观点】所有样本点都在同一条直线上,说明相关性很强,相关系数达到最大值。【分析】因为所有点都分布在一条直线上,所以说明相关性很强,且相关系数达到最大值,即1,故选D。 【答案】第24页第9章 (1) 在散点图中,如果所有样本点都落在某个函数的曲线,该函数用来描述变量之间的关系,即变量之间存在函数关系(2)如果所有样本点都落在某个函数的曲线附近,则变量之间存在相关性; (3) 如果所有样本点都落在某条直线附近,则变量之间存在线性相关。 第9章第25页【变异探索】【2013苏州模拟】观察下面的图形:第9章第26页答案:C 分析:相关性有两种情况:所有点 如果所有点看起来都在一条直线附近波动,是线性相关; 如果所有点似乎都在曲线(而不是直线)附近波动,则它是非线性相关。 它不相关,但相关。 因此,选择C。 第27章第9章【2012年福建省高考】某工厂为了给新开发的产品合理定价,按预定价格对该产品进行试销,得到如下数据:单价×(元) ) 8.
28. 48. 68. 8 销量 y(个) 9 Page 28 第 9 章 (2)预计未来销量,销量与单价仍遵循(1)关系,产品成本是4元/ 为了让工厂利润最大化,这个产品的单价应该是多少? (利润=销售收入-成本)。 【问题观点】应用最小二乘法求回归方程,并根据方程进行回归分析。 第 29 页第 9) = 80。因此 a=y=-20x+250。 Page 30 第 9 章 (2) 假设工厂获得的利润为 L 元。 根据问题,L=x(-20x+250)-4(-20x+250)=-20x+330x-1000=-20+361。 25. 当且仅当x=8.25时,L获得最大值。 因此,当单价定为8.25元时,工厂可以获得最大利润。 第 31 章 求线性回归方程的基本步骤 (1) 首先将数据制成表格,由表计算出 x 第 32 章 第九章 【变异探索】【2011 年广东高考】为了了解篮球爱好者与小李之间的关系投篮命中率和他打篮球的时间。 下表记录了小李某月1日至5日每日打篮球的时间x(单位:小时)与当日投篮命中率y的关系: 小李最近5天的平均投篮命中率; 使用线性回归分析来预测李在本月 6 日打篮球 6 小时时的投篮命中率。 命中率y0。 40. 50. 60. 60. 4 第 33 页 第 9 章 答案:0。
50.53分析:小李近5天平均投篮命中率=0.5。 可以得出小李近5天的平均打篮球时间为x=0.47。 因此,回归直线方程为y=0.47+0.01x。 代入x=6,则6号打篮球6小时的投篮命中率约为0.53。 Page 34 第九章【2012年辽宁高考】为了了解某地区观众对某类体育节目的收视状况,电视传媒公司随机抽取了100名观众进行调查,其中女性55人。 以下是根据调查结果绘制的平均每天观看体育节目时长的频率分布柱状图:第35页第9章将平均每天观看体育节目不少于40分钟的观众称为“体育节目”粉丝”。 我们知道,“体育迷”中有10名女性。 (1)根据已知条件,完成下面22个列联表,并根据这些信息,你认为“体育迷”与性别有关吗? 非体育迷总数 体育迷总数 Page 36 第 9 章 (2) 每天观看体育节目不少于 50 分钟的观众被称为“超级体育迷”。 已知“超级体育迷”中有2人是女性,如果从“超级体育迷”中随机抽取2人,求其中至少有1名女性观众的概率。 0. 050. 013. 8416. 635 Page 37 第 9 章 (1) 从频率分布直方图中可以看出,在抽样的 100 个人中,有 25 名“体育迷”,从而完成了 22 个列联表,如下: 非-体育 体育迷 总计 55 总计 75 25 100 第 38 页 第 9 章