(1)数据的收集
对于抽样调查来说,最重要的是保证所抽取的样本具有代表性。抽取样本常用的抽样方法有简单随机抽样(如抽签法、随机数表法等)和分层抽样。
(2)数据的数字特征和直观表示数据的数字特征包括百分位数、方差、标准差等,数据的直观表示有频率分布直方图、扇形图等。
(3)用样本估计总体
可以由样本的频率分布估计总体的概率分布,用样本的数字特征估计总体的数字特征。
2个统计案例:一元线性回归模型、独立性检验;
6个统计概念:相关关系、样本点的中心、随机误差、残差、2×2列联表、独立性检验;
3种统计图:散点图、残差图、等高堆积条形图;
4个统计数据:样本相关系数 r 、残差平方和、指标R方、独立性检验的随机变量 X方;
1个方程:经验回归方程。
1,化归与转化的思想
化归与转化就是在研究和解决有关数学问题时,采用某种手段将问题变换使之转化,进而使问题得以解决的一种数学方法,我们通过回归分析建立数学模型,实现了实际问题与数学问题之间的转化。我们还可以通过函数变换将非线性回归分析转化为线性回归分析来解决。
2,数形结合的思想
数形结合就是把抽象的数学语言、数量关系与直观的几何图形、位置关系结合起来,使复杂的问题简单化,抽象问题具体化,从而实现优化解题途径的目的。回归分析中我们借助散点图定性推断两个变量是否相关,用残差图分析模型拟合的效果,用等高堆积条形图判断两个相关变量的相关性,在分析问题的过程中,我们还借助频率分布直方图等统计图形,确定统计问题的解决方向,这些都体现了数形结合的妙用!
1,(1)回归分析的基本思想
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,它的基本思想是:利用收集到的样本数据作出散点图,观察散点的变化趋势,根据经验和数学知识选择合适的回归曲线模型,再将收集到的样本数据中的解释变量代人回归曲线方程,得到预报变量的估计值,当残差平方和最小时,求出回归曲线方程中的待定系数,从而建立起回归曲线方程,然后用这个方程由解释变量得到预报变量的平均值。当散点图中的点大致分布在一条直线附近时,回归曲线可以选择直线,这种回归分析的方法叫做线性回归分析。它的基本思想是用最小二乘法求出经验回归方程中的待定系数,使得残差平方和最小。可以说回归分析的基本思想是用“最好”的曲线去拟合收集到的样本数据,其衡量标准是“残差平方和”最小。
(2)解决线性回归分析问题的基本步骤
①画散点图,判断两个变量是否线性相关。若散点图中的点大致分布在一条直线附近,则可设出经验回归方程为y=bx+a;
②利用公式求出回归系数和回归常数a,写出经验回归方程;
③用我们所建立的经验回归方程,由解释变量去求预报变量的平均值,用数学知识为我们的现实生活服务。
(3)求线性回归方程的步骤
第一,判断:作散点图,判断是否线性相关;
第二,计算:计算b,a的值,写出经验回归方程y=bx+a;
第三,画直线:根据经验回归方程画出经验回归直线。
在进行回归分析时,要注意以下几点:
①确定线性相关关系
线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系;二是具有线性相关关系。判断是否线性相关的直观依据是观察样本点的散点图。
2引起预报误差的因素
对于线性回归模型y=bx+a+e,引起预报变量y的误差因素有两个:一个是解释变量x,另一个是随机误差e .
3回归方程的预报精度
判断回归方程的预报精度是通过计算残差平方和来进行的,残差平方和越小,方程的预报精度越高。
简单来说,线性回归分析就是通过建立经验回归方程对变量进行预报,用回归方程预报时,需对函数值明确理解,它表示当 x 取值时,真实值在函数值附近或平均值在函数值附近,不能认为就是真实值。
4回归模型的拟合效果
判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算相关指数R方的大小判断。
2,独立性检验的基本思想与方法
独立性检验的基本思想是:先作出零假设H0,即假设两个分类变量没有关系,再根据这个假设应用统计的方法进行分析,得到一个统计量x方的值,再由统计学得到的各临界值,确定我们的假设是否成立,以及假设的不合理程度。
进行独立性检验要注意理解以下三个问题:
(1)独立性检验适用于两个分类变量。
(2)两个分类变量是否有关系的直观判断。
一是根据2×2列联表计算|ad-bc|,值越大两变量的相关性越强。
二是观察等高堆积条形图,两个深色条的高度相差越大,两变量的相关性越强。
(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断。独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系。