【变量间的相关关系】
一、变量间的相关关系
1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
二、两个变量的线性相关
1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.
当r0时,表明两个变量正相关;
当r0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
三、解题方法
1.相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断.
2.对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性.
3.由相关系数r判断时|r|越趋近于1相关性越强.
【用样本估计总体】
1.数据的两个特征:集中趋势和波动性。集中趋势指的是数据的“一般水平”或曰“平均水平”,波动性指的是数据围绕“平均值”的变化情况。
2.反映数据“大多数水平”(集中趋势)的量——众数
众数:即样本数据中频数(或频率)的数据。
特点:①可以不存在或不止一个;
②不受极端数据的影响,求法简单;
③可靠性差,如0,0,2,3,5这组数据中,众数是0,它很难真实反映这组数据的“平均水平”(集中趋势);
④众数在难以定义“平均数”或“中位数”时常用,故一般可用于统计非数字型数据,如“牛,羊,马,鱼,牛”这组数据中,众数是“牛”;
⑤众数在销售统计中常用
3.反映数据“中间水平”(集中趋势)的量——中位数
中位数:把一组数据按从小到大的数序排列,在中间的一个数字(或两个数字的平均值)叫做这组数据的中位数。
特点:①中位数把样本数据分为两部分,一部分大于中位数,另一部分小于中位数;
②中位数不受少数几个极端值的影响;
③由于当样本数据为偶数个时,中位数等于中间两个数据的平均值,因此有时中位数未必在样本数据中.
【随机抽样】
一、简单随机抽样
1.简单随机抽样的概念:
设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.最常用的简单随机抽样方法有两种——抽签法和随机数法.
二、系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本:
(1)先将总体的N个个体编号;
(2)确定分段间隔k,对编号进行分段,当是整数时,取k=;
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.
三、分层抽样
1.分层抽样的概念:
在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
2.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
3.分层抽样时,每个个体被抽到的机会是均等的.