2024考研一对一
圣才VIP会员,电子书题库视频免费看
您现在的位置: 圣才考研网 > 【课件下载】

统计学笔记

扫码手机阅读
用圣才电子书APP或微信扫一扫,在手机上阅读本文,也可分享给你的朋友。
评论(0
第一章
绪论
什么是统计呢?
–报表?数字?
什么是统计:
用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法.
1. 统计工作
–收集数据的活动
2.  统计数据
–对现象计量的结果
3. 统计学
–分析数据的方法与技术
 
二、我们身边的统计
出生婴儿出生率、性别比
比较不同班级成绩
某种药物有显著疗效
基尼系数(0.3-0.4表示相对合理)
恩格尔系数
夸大的统计图
统计作为一种工具,往往为受到使用者本人主观意愿的制约。有人曾感叹统计学家会说话。确实,人们在统计指标的选择、统计图表的制作、统计方法的选用上都可能会带有自己的个人目的,具有一定的功利性。
缩小的统计图
学校当局则往往不愿意这样来宣传自己的学校,于是根据同样的数据可以绘制了另外一张统计图,他们通过把Y轴的标尺拉得很长,给人以学校因心理问题而中断学业的人数相当稳定的感觉。
 
一、统计学与教育统计学
1、统计学
最初应用于对一个国家情况的描述。
现代意义上的统计指的是对与随机现象有关的数据资料进行收集、整理、计算和分析的过程。
统计学大致分为数理统计学和应用统计学两部分。
数理统计学研究如何从局部的样本观测数据资料来推断总体的特征,并得出合乎规律的科学结论的原理和方法(偏向数学证明)。
应用统计学研究如何运用经过数理统计学证明的各种原理和方法解决实际问题。
2、教育统计学
教育统计学属于应用统计学。
教育统计学就是用统计学的原理和方法来研究教育现象,对有关的数字资料进行收集、整理、计算、分析的一门基础学科。
统计原理和方法的数学证明不是教育统计学的任务。
 
二、教育统计学的研究内容
1、描述统计
对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。
描述统计的目的是将大量零散的、杂乱无序的数字资料进行整理、归纳、简缩、概括,使事物的全貌及其分布特征清晰、明确地显现出来。
包括统计图/表、集中量、差异量、相关量
2、推论统计
根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推论统计。
推论统计的内容包括总体参数估计和假设检验两部分。推论统计的目的在于根据已知的情况,在一定概率的意义上估计、推测未知的情况。
?对总体特征作出推断
3、实验设计
实验者为了揭示实验中自变量与因变量之间的关系,在实验之前所制订的实验计划,称为实验设计。
包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。
 
三、教育统计学基础知识
1、数据类型
1)分类数据
?只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序前后及质的优劣。
?如性别、民族等。
?可用统计方法:百分比、百分数检验方法和χ2检验。
2)等级数据
?是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。
?如受教育程度。
?统计分析可用中数、百分数、等级相关等统计方法。
3)等距变量
?是指能反映事物的类别和相对地位,但不能说明两者之间倍数关系的变量。变量之间能作加减运算,但不能作乘除运算。
?定距变量没有一个真正的零点。
?如温度,0度并不是没有温度。
?大多数统计方法都可用于处理等距变量。
4)比率数据
?它既有量的大小,相等单位又有绝对零点,能进行加减乘除运算。
?一般的统计方法都可用来处理等比变量的内容。
?四种变量在测量水平上具有递进关系,适合前一种变量的统计方法也能用于后一种变量;反之,则不然。
2、随机变量
在相同条件下进行实验或观察,可能的结果不止一个 ,但我们事先无法确定最后的结果,这样的现象称为随机现象。
用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。
3、总体、个体和样本
需要研究的同质对象的全体,称为总体。
每一个具体研究对象,称为一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
一般把容量n ≥30的样本称为大样本;
n <30的样本称为小样本。
4、统计量和参数
5、统计误差
误差是测得值与真值之间的差值。
测得值=真值+误差
统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差。
心理与教育的研究不可能避免误差,只可能减少误差。
抽样设计的目的,就是保证研究达到所需要的精确度,同时在兼顾投入的人力、物力和财力条件下尽量减小抽样误差。
四、学习教育统计学的意义
数学化是自然科学成熟的标志。教育科学也必然会向数学化的方向发展,而教育统计就是用数学方法研究心理与教育现象的重要工具。
教育统计学对于教育研究的重要意义。
教育管理者需要掌握相关的教育统计学知识。
学习教育专业的学生需要教育统计学知识。
 
五、学习教育统计
应注意的事项
注重掌握各种方法的使用条件,多做练习。
正确选择和使用统计方法,防止误用和乱用。
注意教育统计学注重应用,不要追究公式的数学证明,了解原理、做到操作化是主要任务。
再见!
 
第二章
数据整理与图表呈现
一、数据的整理
心理和教育研究中收集的各种原始资料杂乱无章,只有经过整理分析才能从中提取出有用的信息。
在对资料进一步分析之前,需要进行认真的整理。
审核资料
审核资料的目的,是为了剔除不合格的资料,以确保资料的可靠性和可信性。
审核是对原始资料进行初步的审查和核实。不符合要求的数据主要有三种:缺失、可疑、失误。
缺失 :指数据不全或缺项未填;例如一份资料中未回答的问题占10%以上,或者缺少关键性资料。
可疑 :指难以辨认或怀疑其真实性的数据;例如,有的被试填答的问卷全部选同一个选项(如全选A或全选B);有的被试填答的结果可以看到是一种规则的排列方式(如A B C D E D B C A B C D E……)。
失误 :指存在明确差错的数据或答案。
二、统计表
统计表是用来表达研究变量与被说明的事物之间数量关系的表格。它可以将大量数据的分类结果清晰、概括、一目了然地表达出来,便于分析、比较和计算。
1、统计表的构成
例: 表2-2 甘肃省农村地区中学生学习倦怠分布
2.统计表的种类
简单表:只按研究现象(或变量)的名称、地点、时序等列出数据的统计表。
分组表:只按一个标志分组的统计表称为分组表。
复合表:按两个或两个以上标志分组的统计表称为复合表。
简单表
2-3 各校学生数一览表
分组表
2-4  上海市区男幼儿20米跑步用时
复合表
2-5  某年级操行评定结果
例: 表2-6  中学生心理烦恼调查被试分布
统计分组
– 分组原则:
以事物的特性为基础, 如学科分为文理工
分组标志明确,包含所有数据, 如20 岁以下,20-30 ,30-40 ,40 岁以上
– 分组的标志
性质类别:对品质数据(分类)
数量类别:对连续数据(分组)
 
3.次数分布表
次数分布表是对杂乱无序的数据进行整理的重要手段,它能使我们对样本情况有个初步的了解,为今后进一步分析和研究问题提供很大方便。
简单次数分布表
概念:依据每一个分数值在一列数据中出现的次数(频数)或总计数资料编制而成的统计表。
调查:你认为主管是否尽职?
A非常不尽职  B不尽职  C不置可否
D尽职  E非常尽职
二、分组次数分布表
 将所有数据先划分为若干分组区间,然后将数据划归到相应的组别内,分别统计各个组别中包括的数据个数,再用列表形式呈现出来。
分组次数分布表
编制分组次数分布表的步骤
求全距  R=Xmax-Xmin
决定组距 i 和组数 k
列出分组区间
登记次数
抄录新表
练 习
某大学四年级80名学生的毕业成绩如下:
56 83 76 68 80 92 69 81 62 78
57 81 71 70 59 66 66 75 61 48
84 50 93 82 72 70 49 84 69 66
93 74 70 69 56 74 68 85 53 97
61 52 58 50 73 93 52 74 65 81
68 53 54 95 68 72 94 82 69 60
66 85 90 57 67 75 82 55 46 68
47 89 57 67 75 51 83 68 55 50
试编制一个完整的次数分布表。
累加次数分布表
3-3  某班学生数学成绩累加次数分布表
 
三、统计图
统计图是整理和呈现数据的另一种方法,它把研究变量与被说明事物之间的数量关系用图形表现,直观、形象 地表达出事物的全貌及其数据的分布特征,使人一目了然,便于理解和记忆,印象深刻。
1、统计图的构成
统计图一般由图号、标题、标目、图形、图注等几部分构成。
统计图中的标目由基线和尺度线构成。对于有纵、横轴的统计图,一般以基线表示被观察的现象,而尺度线则表示其数量。
2、统计图的分类
条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。
圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。
单式条形图
复式条形图
2-2 某年级操行评定结果条形图
例: 图2-3  三项影响较大的SARS信息对不同文化程度民众的影响
绘制圆形图的步骤
求出各组成部分所占的百分比
求出各部分的中心角度
以顺时针方向画出扇形
标出不同颜色及百分比
圆形图
2-4 某年级操行评定结果圆形图
线形图
线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。
基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。
例如:对有意义的词汇,小学一年级至初中三年级学生视觉、听觉记忆再现率的情况。
3.次数分布图
在编制次数分布表的基础上,可以绘制次数分布图,使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。
频数分布直方图
直方图 ( histogram )又称为等距直方图,是以矩形的面积表示连续性随机变量次数分布的图形。一般用纵轴表示数据的频数,用横轴表示数据的等距分组点,即各分组区间的上下限。
直方图是统计学中常用而且又有特殊意义的一种统计图,有着重要的应用价值。
例:52个学生的数学成绩所作直方图
2-6 52名学生数学成绩分布的频数直方图
还可以做成下面这种形式
次数分布多边图
次数分布多边形图(frequency polygon)是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。
绘制方法:以各分组区间的组中值为横坐标 ,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。
2-8 52名学生数学成绩分布图
利用次数分布多边图还可以把几组资料放在一起进行比较。
2-9 次数分布图
累积次数分布图
根据累积次数,可以绘制累积次数分布图。
右图是累积次数分布直方图。
累积次数分布曲线
当数据的总数较多时,将累积次数分布图中的横坐标以每一分组区间的精确上限或精确下限表示,纵坐标以累积次数表示,则可绘制累积次数分布曲线,即累积曲线。
再见!
 
第三章
集中量
集中量用来表现数据资料的典型水平或集中趋势。
常用的集中量包括算术平均数、中位数、众数、加权平均数等等。
一、算术平均数
算术平均数一般简称为平均数或均数、均值。
一般用M,或者用 (X杠)表示。
算术平均数是最常用的集中量。
1.算术平均数的计算公式
原始数据计算公式
由上述公式可得算术平均数的几个重要性质
练习题
10个观测数据,计算算术平均数,再计算离均差
25 27 28 27 25
29 30 34 32 33
次数分布表计算公式
3-1 52名学生数学成绩平均数计算表
2、算术平均数的意义
算术平均数是应用最普遍的一种集中量。它是“真值”(true score)的最佳估计值。
真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难得到。
在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。
3、算术平均数的优缺点
算术平均数具备一个良好的集中量所应具备的一些特点:反应灵敏、严密确定、简明易懂、适合代数运算等等,因此是一个最常用的集中量。
主要不足:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。
4、计算和应用算术平均数的原则
同质性原则:算术平均数只能用于表示同类数据的集中趋势。
平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。
平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。
 
二、中位数
中位数(median)又称为中数,是按顺序排列的一组数据中位于中间位置的数。
中位数是常用集中量的一种。
一般用Md表示。
1、中位数的计算方法
原始数据计算法
首先将一组数据按顺序排列
例  题
计算中位数:
1:7、8、9、4、6、5、10、12、11
2: 8、9、4、6、5、10、12、 11
次数分布表计算法
由次数分布表计算中位数需要用到累积次数分布表。
当表中数据的累积方向不同时,计算公式也不同。
由小到大累积频数计算公式
公式中:Lmd为中位数所在组的精确下限
n1为中位数所在组下限以下的累积频数
n为数据总和
fMd为中位数所在组的频数
i为组距
由大到小累积频数计算公式
公式中:Umd为中位数所在组的精确上限
n2为中位数所在组上限以上的累积频数
n为数据总和
fMd为中位数所在组的频数
i为组距
计算步骤(由小到大):
①求N/2
②确定中位数所在组。由小到大累计次数,直至略大于N/2为止,这组就是中位数所在组。
③确定中位数组有多少个频数,就能使由大到小的累计次数等于N/2。
④计算中位数所在组所取频数的距离。
⑤将结果与中位数所在组的下限求合,即中位数。
3-3 52名学生数学成绩中位数计算表
当由小到大计算中位数时,如果小于某一组下限的累计次数正好等于总次数的一半时,那么该组的下限就是中位数。
当由大到小计算时,大于某一组上限的累计次数正好等于总次数的一半时,那么该组的上限就是中位数。
2.百分位数
百分位数的概念
百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值,一般用  表示。
百分位数(频数分布表上)的计算方法
公式中:Lp为百分位数所在组的精确下限
n为百分位数所在组下限以下的累积频数
p为百分数
N为数据总和
fp为百分位数所在组的频数
i为组距
3.中位数的特点及应用
中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:
一组数据中有极端数据时;
一组数据中有个别数据不确切、不清楚时;
资料属于等级性质时。
 
.众数
众数(mode)用Mo表示,有两种定义:
理论众数是指与频数分布曲线最高点相对应的横坐标上的一点;
粗略众数是一组数据中出现次数最多的那个数。
众数也是一种集中量,也可用来表示一组数据的集中趋势。
1.众数的计算方法
1)观察法寻找粗略众数
未分组数据中出现次数最多的数即为众数。
次数分布表中,频数最多那一组数据的组中值,即为众数。
2)公式法计算理论众数的近似值
一般在心理与教育统计中常用的公式有皮尔逊的经验公式和金氏插补法公式。
皮尔逊经验公式
金氏插补法
2.众数的优缺点
众数的概念简单易懂,但比较粗略,不能灵敏地反映一组数据的变化,而且不适合进一步代数运算。
4.算术平均数、中位数、众数三者的关系
在正态分布中:
在正偏态分布中:
四、其它集中量
除了算术平均数、中位数和众数以外,在应用中还有一些其它集中量。这些统计指标可以从其它角度描述一组数据的集中趋势。
1.加权平均数
加权平均数是不同比重数据(或平均数)的平均数,一般用  表示。其计算公式有两种:
2.几何平均数
几何平均数(geometric mean)是n个数值连乘积的n次方根,用 或 表示。计算公式为
3.调和平均数
调和平均数是一组数据倒数的算术平均数的倒数,也就是倒数平均数。
在教育方面主要用来求学习速度。
 
再见!
 
 

小编工资已与此挂钩!一一分钱!求打赏↓ ↓ ↓

如果你喜欢本文章,请赐赏:

已赐赏的人
最新评论(共0条)评论一句