统计学的定义
1.统计学的涵义
一般来说,统计学是对研究对象的数据资料进行搜集、整理、分析和研究,以显示其总体的特征和规律性的学科。统计学的研究对象是客观事物的数量特征和数据资料。统计学是以搜集、整理、分析和研究等统计技术为手段,对所研究对象的总体数量关系和数据资料去伪存真、去粗取精,从而达到显示、描述和推断被研究对象的特征、趋势和规律性的目的。统计学,亦可简称为统计。例如,我们所学的课程——统计课,实际指的是统计学课程。
早期统计学的学派之一,“政治算术学派”的创始人威廉·配第和约翰·格朗特,首先在其著作中使用统计数字和图表等方法来分析研究社会、经济和人口现象,这不仅为人们进一步认识社会提供了一种新的方法和途径,也为统计学的发展奠定了基础。
目前,随着统计方法在各个领域的应用,统计学已发展成为具有多个分支学科的大家族。因此,要给统计学下一个普遍接受的定义是十分困难的。在本书中,我们对统计学做如下解释,统计学是—门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
统计数据的收集是取得统计数据的过程,它是进行统计分析的基础。离开了统计数据,统计方法就失去了用武之地。如何取得所需的统计数据是统计学研究的内容之一。
统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。数据整理是介于数据收集与数据分析之间的一个必要环节。
统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。
可见,统计学是一门有关统计数据的科学,统计学与统计数据有着密不可分的关系。在英文中,“statistics”一词有两个含义:当它以单数名词出现时,表示作为一门科学的统计学;当它以复数名词出现时,表示统计数据或统计资料。从中可以看出,统计学与统计数据之间有着密不可分的关系。统计学是由一套收集和处理统计数据的方法所组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。统计数据不用统计方法去分析也仅仅是一堆数据而已,无法得出任何有益的结论。
其次,统计数据不是指单个的数字,而是由多个数据构成的数据集。单个的数据显然用不着统计方法进行分析,仅凭一个数据点,我们也不可能得出事物的规律,只有经过对同一事物进行多次观察或计量得到大量数据,才能利用统计方法探索出内在的规律性。
2.统计学研究对象的特点
正确地确定统计学的研究对象,是一切统计研究的起点。对统计学的研究对象有了明确的认识,才能进一步认识统计的性质、统计的研究领域、统计所特有的规律以及研究这个规律的方法等。也只有解决了这一问题,才能理解统计学和其他学科的联系和区别。
统计学的研究对象是现象总体的数量方面,即社会经济现象总体的数量特征和数量关系。通过对这个对象的研究,以认识社会经济发展规律的具体表现。
统计学研究对象的特点有如下几点:
1.总体性。统计学的研究对象是自然、社会经济领域中现象总体的数量方面,即统计的数量研究是对总体普遍存在着的事实进行大量观察和综合分析,得出反映现象总体的数量特征和资料规律性。自然、社会经济现象的数据资料和数量对比关系等一般是在一系列复杂因素的影响下形成的。在这些因素当中,有起着决定和普遍作用的主要因素,也有起着偶然和局部作用的次要因素。由于种种原因,在不同的个体中,它们相互结合的方式和实际发生的作用都不可能完全相同。所以,对于每个个体来说,就具有一定的随机性质,而对于有足够多数个体的总体来说又具有相对稳定的共同趋势,显示出一定的规律性。例如,对工资的统计分析,我们并不是要分析和研究个别人的工资,而是要反映、分析和研究一个地区、一个部门、一个企业事业单位的总体的工资情况和显示出来的规律性。统计研究对象的总体性,是从个体的实际表现的研究过渡到对总体的数量表现的研究的。例如,工资统计分析,要反映、分析和研究一个地区的工资情况,先要从每个职工的工资开始统计,然后再综合汇总得到该地区的工资情况,只有从个体开始,才能对总体进行分析研究。研究总体的统计数据资料,不排除对个别事物的深入调查研究,但它是为了更好地分析研究现象总体的统计规律性。
2.数量性。统计学的研究对象是自然、社会经济领域中现象的数量方面,这一特点是统计学(定量分析学科)与其他定性分析学科的分界线。数量性是统计学研究对象的基本特点,因为,数字是统计的语言,数据资料是统计的原料。一切客观事物都有质和量两个方面,事物的质与量总是密切联系、共同规定着事物的性质。没有无量的质,也没有无质的量。一定的质规定着一定的量,一定的量也表现为一定的质。但在认识的角度上,质和量是可以区分的,可以在一定的质的情况下,单独地研究数量方面,通过认识事物的量进而认识事物的质。因此,事物的数量是我们认识客观现实的重要方面,通过分析研究统计数据资料,研究和掌握统计规律性,就可以达到我们统计分析研究的目的。例如,要分析和研究国民生产总值,就要对其数量、构成及数量变化趋势等进行认识,这样才能正确地分析和研究国民生产总值的规律性。
3.客观性
统计数量是客观事物的反映,表示客观现象在具体时间、空间,具体条件作用下,实际已经达到的水平和程度。它独立存在于外部世界,不是人的意志所能转移的。统计资料虽然是经过人们有意识的调查、整理、汇总、加工,但都不能改变它的客观性。统计资料的客观性是统计质量的基础,基于此,统计资料不但确凿而且雄辩。统计工作只唯“实”,不唯“上”,维护统计资料客观性和真实性,是统计的基本传统。
然而,在统计实践中,“渗水”统计由来已久。最突出的是五十年代后期“大跃进”那几年,为求“卫星上天”胡报产量,虚假的统计数字造成了严重恶果。改革开放十多年来,统计工作大有改进,但在新的历史条件下,由于利益格局变动等原因,有些地方或单位在统计数字里“渗水”的现象又有所无中露头。这种现象既违背了统计对象的客观性,也是一种不法行为,我们必须坚决抵制。
4.具体性。统计研究对象是自然、社会经济领域中具体现象的数量方面。即它不是纯数量的研究,是具有明确的现实涵义的,这一特点是统计学与数学的分水岭。数学是研究事物的抽象空间和抽象数量的科学,而统计学研究的数量是客观存在的、具体实在的数量表现。统计研究对象的这一特点,也正是统计工作必须遵循的基本原则。
统计数字不是抽象的数字,它是社会经济现象在具体时间、地点、条件下所表现的数量。例如,国家统计局1994年3月1日发表的<<1993年国民经济和社会发展的统计公报>>中公布:①1993年全国国内生产总值31380亿元,比上年增长13。4%②1993年农业增加值6650亿元,比上年增长4%③1993年工业增加值14140亿元,比上年增长21.1%;……
这些主要指标,说明了我国1993年国民经济和社会发展情况。正因为具体性,所以统计的数字必须准确,公布的资料要注明出处来源。
5.变异性。统计研究对象的变异性是指构成统计研究对象的总体各单位,除了在某一方面必须是同质的以外,在其他方面又要有差异,而且这些差异并不是由某种特定的原因事先给定的。就是说,总体各单位除了必须有某一共同标志表现作为它们形成统计总体的客观依据以外,还必须要在所要研究的标志上存在变异的表现。否则,就没有必要进行统计分析研究了。例如,高等院校这个统计对象,除了都是从事高等教育的教学活动这一共同性质之外,各高等院校在隶属主管部门、院校性质、招生规模、专业设置等各方面又有差异。工人作为统计数据资料对象,每个工人在性别、年龄、工龄、工作性质、工资等方面是会有不同表现的。这样,统计分析研究才能对其表现出来的差异探索统计规律性。
6.范围的广泛性。统计学几乎不同程度地渗透到所有人类活动的领域。统计学研究对象的范围,既包括社会经济现象,也包括自然科技现象;既包括生产力,又包括生产关系;即有经济基础,又有上层建筑。此外,还要从社会经济与自然技术条件的联系中,研究技术条件对社会经济现象总体的影响。
3.统计学的分科
统计方法已被应用到自然科学和社会科学的众多领域,统计学也发展成为由若干分支学科组成的学科体系。从统计方法的构成来看,统计学可以分为描述统计学和推断统计学;从统计方法研究和统计方法的应用角度来看,统计学可以分为理论统计学和应用统计学。
(1)描述统计学和推断统计学
描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。
推断统计学(1nferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
图1–1 统计学探索客观现象数量规律性的过程
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。从图1–1我们可以看出描述统计学和推断统计学在统计方法探索客观现象数量规律性中的地位。
从图1–1可以看到,统计研究过程的起点是统计数据,终点是探索出客观现象内在的数量规律性。在这一过程中,如果搜集到的是总体数据(如普查数据),则经过描述统计之后就可以达到认识总体数量规律性的目的了;如果所获得的只是研究总体的一部分数据(样本数据),要找到总体的数量规律性,则必须应用概率论的理论并根据样本信息对总体进行科学的
推断。
显然,描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。由于在对现实问题的研究中,所获得的数据主要是样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。当然,这并不等于说描述统计不重要,如果没有描述统计收集可靠的统计数据并提供有效的样本信息,即使再科学的统计推断方法也难以得出切合实际的结论。从描述统计学发展到推断统计学,既反映了统计学发展的巨大成就,也是统计学发展成熟的重要标志。
(2)理论统计学和应用统计学
理论统计学(Theoretical Statistics)是指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数学理论。由于现代统计学用到了几乎所有方面的数学知识,从事统计理论和方法研究的人员需要有坚实的数学基础。此外,由于概率论是统计推断的数学和理论基础,因而广义地讲统计学也是应该包括概率论在内的。理论统计学是统计方法的理论基础,没有理论统计学的发展,统计学也不可能发展成为像今天这样一个完善的科学知识体系。
在统计研究领域,从事理论统计学研究的人相对是很少的一部分,而大部分则是从事应用统计学(Applied Statistics)研究的。应用统计学是研究如何应用统计方法去解决实际问题的。统计学是一门收集和分析数据的科学。由于在自然科学及社会科学研究领域中,都需要通过数据分析来解决实际问题,因而,统计方法的应用几乎扩展到了所有的科学研究领域。例如,统计方法在生物学中的应用形成了生物统计学,在医学中的应用形成了医疗卫生统计学,在农业试验、育种等方面的应用形成了农业统计学。统计方法在经济和社会科学研究领域的应用也形成了若干分支学科。例如,统计方法在经济领域的应用形成了经济统计学及其若干分支,在管理领域的应用形成了管理统计学,在社会学研究和社会管理中的应用形成了社会统计学,在人口学中的应用形成了人口统计学,等等。以上这些应用统计学的不同分支所应用的基本统计方法都是一样的,即都是描述统计和推断统计的主要方法。但由于各应用领域都有其特殊性,统计方法在应用中又形成了一些不同的特点。
统计学的定义
1.统计学的涵义
一般来说,统计学是对研究对象的数据资料进行搜集、整理、分析和研究,以显示其总体的特征和规律性的学科。统计学的研究对象是客观事物的数量特征和数据资料。统计学是以搜集、整理、分析和研究等统计技术为手段,对所研究对象的总体数量关系和数据资料去伪存真、去粗取精,从而达到显示、描述和推断被研究对象的特征、趋势和规律性的目的。统计学,亦可简称为统计。例如,我们所学的课程——统计课,实际指的是统计学课程。
早期统计学的学派之一,“政治算术学派”的创始人威廉·配第和约翰·格朗特,首先在其著作中使用统计数字和图表等方法来分析研究社会、经济和人口现象,这不仅为人们进一步认识社会提供了一种新的方法和途径,也为统计学的发展奠定了基础。
目前,随着统计方法在各个领域的应用,统计学已发展成为具有多个分支学科的大家族。因此,要给统计学下一个普遍接受的定义是十分困难的。在本书中,我们对统计学做如下解释,统计学是—门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
统计数据的收集是取得统计数据的过程,它是进行统计分析的基础。离开了统计数据,统计方法就失去了用武之地。如何取得所需的统计数据是统计学研究的内容之一。
统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。数据整理是介于数据收集与数据分析之间的一个必要环节。
统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。
可见,统计学是一门有关统计数据的科学,统计学与统计数据有着密不可分的关系。在英文中,“statistics”一词有两个含义:当它以单数名词出现时,表示作为一门科学的统计学;当它以复数名词出现时,表示统计数据或统计资料。从中可以看出,统计学与统计数据之间有着密不可分的关系。统计学是由一套收集和处理统计数据的方法所组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。统计数据不用统计方法去分析也仅仅是一堆数据而已,无法得出任何有益的结论。
其次,统计数据不是指单个的数字,而是由多个数据构成的数据集。单个的数据显然用不着统计方法进行分析,仅凭一个数据点,我们也不可能得出事物的规律,只有经过对同一事物进行多次观察或计量得到大量数据,才能利用统计方法探索出内在的规律性。
2.统计学研究对象的特点
正确地确定统计学的研究对象,是一切统计研究的起点。对统计学的研究对象有了明确的认识,才能进一步认识统计的性质、统计的研究领域、统计所特有的规律以及研究这个规律的方法等。也只有解决了这一问题,才能理解统计学和其他学科的联系和区别。
统计学的研究对象是现象总体的数量方面,即社会经济现象总体的数量特征和数量关系。通过对这个对象的研究,以认识社会经济发展规律的具体表现。
统计学研究对象的特点有如下几点:
1.总体性。统计学的研究对象是自然、社会经济领域中现象总体的数量方面,即统计的数量研究是对总体普遍存在着的事实进行大量观察和综合分析,得出反映现象总体的数量特征和资料规律性。自然、社会经济现象的数据资料和数量对比关系等一般是在一系列复杂因素的影响下形成的。在这些因素当中,有起着决定和普遍作用的主要因素,也有起着偶然和局部作用的次要因素。由于种种原因,在不同的个体中,它们相互结合的方式和实际发生的作用都不可能完全相同。所以,对于每个个体来说,就具有一定的随机性质,而对于有足够多数个体的总体来说又具有相对稳定的共同趋势,显示出一定的规律性。例如,对工资的统计分析,我们并不是要分析和研究个别人的工资,而是要反映、分析和研究一个地区、一个部门、一个企业事业单位的总体的工资情况和显示出来的规律性。统计研究对象的总体性,是从个体的实际表现的研究过渡到对总体的数量表现的研究的。例如,工资统计分析,要反映、分析和研究一个地区的工资情况,先要从每个职工的工资开始统计,然后再综合汇总得到该地区的工资情况,只有从个体开始,才能对总体进行分析研究。研究总体的统计数据资料,不排除对个别事物的深入调查研究,但它是为了更好地分析研究现象总体的统计规律性。
2.数量性。统计学的研究对象是自然、社会经济领域中现象的数量方面,这一特点是统计学(定量分析学科)与其他定性分析学科的分界线。数量性是统计学研究对象的基本特点,因为,数字是统计的语言,数据资料是统计的原料。一切客观事物都有质和量两个方面,事物的质与量总是密切联系、共同规定着事物的性质。没有无量的质,也没有无质的量。一定的质规定着一定的量,一定的量也表现为一定的质。但在认识的角度上,质和量是可以区分的,可以在一定的质的情况下,单独地研究数量方面,通过认识事物的量进而认识事物的质。因此,事物的数量是我们认识客观现实的重要方面,通过分析研究统计数据资料,研究和掌握统计规律性,就可以达到我们统计分析研究的目的。例如,要分析和研究国民生产总值,就要对其数量、构成及数量变化趋势等进行认识,这样才能正确地分析和研究国民生产总值的规律性。
3.客观性
统计数量是客观事物的反映,表示客观现象在具体时间、空间,具体条件作用下,实际已经达到的水平和程度。它独立存在于外部世界,不是人的意志所能转移的。统计资料虽然是经过人们有意识的调查、整理、汇总、加工,但都不能改变它的客观性。统计资料的客观性是统计质量的基础,基于此,统计资料不但确凿而且雄辩。统计工作只唯“实”,不唯“上”,维护统计资料客观性和真实性,是统计的基本传统。
然而,在统计实践中,“渗水”统计由来已久。最突出的是五十年代后期“大跃进”那几年,为求“卫星上天”胡报产量,虚假的统计数字造成了严重恶果。改革开放十多年来,统计工作大有改进,但在新的历史条件下,由于利益格局变动等原因,有些地方或单位在统计数字里“渗水”的现象又有所无中露头。这种现象既违背了统计对象的客观性,也是一种不法行为,我们必须坚决抵制。
4.具体性。统计研究对象是自然、社会经济领域中具体现象的数量方面。即它不是纯数量的研究,是具有明确的现实涵义的,这一特点是统计学与数学的分水岭。数学是研究事物的抽象空间和抽象数量的科学,而统计学研究的数量是客观存在的、具体实在的数量表现。统计研究对象的这一特点,也正是统计工作必须遵循的基本原则。
统计数字不是抽象的数字,它是社会经济现象在具体时间、地点、条件下所表现的数量。例如,国家统计局1994年3月1日发表的<<1993年国民经济和社会发展的统计公报>>中公布:①1993年全国国内生产总值31380亿元,比上年增长13。4%②1993年农业增加值6650亿元,比上年增长4%③1993年工业增加值14140亿元,比上年增长21.1%;……
这些主要指标,说明了我国1993年国民经济和社会发展情况。正因为具体性,所以统计的数字必须准确,公布的资料要注明出处来源。
5.变异性。统计研究对象的变异性是指构成统计研究对象的总体各单位,除了在某一方面必须是同质的以外,在其他方面又要有差异,而且这些差异并不是由某种特定的原因事先给定的。就是说,总体各单位除了必须有某一共同标志表现作为它们形成统计总体的客观依据以外,还必须要在所要研究的标志上存在变异的表现。否则,就没有必要进行统计分析研究了。例如,高等院校这个统计对象,除了都是从事高等教育的教学活动这一共同性质之外,各高等院校在隶属主管部门、院校性质、招生规模、专业设置等各方面又有差异。工人作为统计数据资料对象,每个工人在性别、年龄、工龄、工作性质、工资等方面是会有不同表现的。这样,统计分析研究才能对其表现出来的差异探索统计规律性。
6.范围的广泛性。统计学几乎不同程度地渗透到所有人类活动的领域。统计学研究对象的范围,既包括社会经济现象,也包括自然科技现象;既包括生产力,又包括生产关系;即有经济基础,又有上层建筑。此外,还要从社会经济与自然技术条件的联系中,研究技术条件对社会经济现象总体的影响。
3.统计学的分科
统计方法已被应用到自然科学和社会科学的众多领域,统计学也发展成为由若干分支学科组成的学科体系。从统计方法的构成来看,统计学可以分为描述统计学和推断统计学;从统计方法研究和统计方法的应用角度来看,统计学可以分为理论统计学和应用统计学。
(1)描述统计学和推断统计学
描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。
推断统计学(1nferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
图1–1 统计学探索客观现象数量规律性的过程
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。从图1–1我们可以看出描述统计学和推断统计学在统计方法探索客观现象数量规律性中的地位。
从图1–1可以看到,统计研究过程的起点是统计数据,终点是探索出客观现象内在的数量规律性。在这一过程中,如果搜集到的是总体数据(如普查数据),则经过描述统计之后就可以达到认识总体数量规律性的目的了;如果所获得的只是研究总体的一部分数据(样本数据),要找到总体的数量规律性,则必须应用概率论的理论并根据样本信息对总体进行科学的
推断。
显然,描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。由于在对现实问题的研究中,所获得的数据主要是样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。当然,这并不等于说描述统计不重要,如果没有描述统计收集可靠的统计数据并提供有效的样本信息,即使再科学的统计推断方法也难以得出切合实际的结论。从描述统计学发展到推断统计学,既反映了统计学发展的巨大成就,也是统计学发展成熟的重要标志。
(2)理论统计学和应用统计学
理论统计学(Theoretical Statistics)是指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数学理论。由于现代统计学用到了几乎所有方面的数学知识,从事统计理论和方法研究的人员需要有坚实的数学基础。此外,由于概率论是统计推断的数学和理论基础,因而广义地讲统计学也是应该包括概率论在内的。理论统计学是统计方法的理论基础,没有理论统计学的发展,统计学也不可能发展成为像今天这样一个完善的科学知识体系。
在统计研究领域,从事理论统计学研究的人相对是很少的一部分,而大部分则是从事应用统计学(Applied Statistics)研究的。应用统计学是研究如何应用统计方法去解决实际问题的。统计学是一门收集和分析数据的科学。由于在自然科学及社会科学研究领域中,都需要通过数据分析来解决实际问题,因而,统计方法的应用几乎扩展到了所有的科学研究领域。例如,统计方法在生物学中的应用形成了生物统计学,在医学中的应用形成了医疗卫生统计学,在农业试验、育种等方面的应用形成了农业统计学。统计方法在经济和社会科学研究领域的应用也形成了若干分支学科。例如,统计方法在经济领域的应用形成了经济统计学及其若干分支,在管理领域的应用形成了管理统计学,在社会学研究和社会管理中的应用形成了社会统计学,在人口学中的应用形成了人口统计学,等等。以上这些应用统计学的不同分支所应用的基本统计方法都是一样的,即都是描述统计和推断统计的主要方法。但由于各应用领域都有其特殊性,统计方法在应用中又形成了一些不同的特点。
统计学的定义
1.统计学的涵义
一般来说,统计学是对研究对象的数据资料进行搜集、整理、分析和研究,以显示其总体的特征和规律性的学科。统计学的研究对象是客观事物的数量特征和数据资料。统计学是以搜集、整理、分析和研究等统计技术为手段,对所研究对象的总体数量关系和数据资料去伪存真、去粗取精,从而达到显示、描述和推断被研究对象的特征、趋势和规律性的目的。统计学,亦可简称为统计。例如,我们所学的课程——统计课,实际指的是统计学课程。
早期统计学的学派之一,“政治算术学派”的创始人威廉·配第和约翰·格朗特,首先在其著作中使用统计数字和图表等方法来分析研究社会、经济和人口现象,这不仅为人们进一步认识社会提供了一种新的方法和途径,也为统计学的发展奠定了基础。
目前,随着统计方法在各个领域的应用,统计学已发展成为具有多个分支学科的大家族。因此,要给统计学下一个普遍接受的定义是十分困难的。在本书中,我们对统计学做如下解释,统计学是—门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
统计数据的收集是取得统计数据的过程,它是进行统计分析的基础。离开了统计数据,统计方法就失去了用武之地。如何取得所需的统计数据是统计学研究的内容之一。
统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。数据整理是介于数据收集与数据分析之间的一个必要环节。
统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。
可见,统计学是一门有关统计数据的科学,统计学与统计数据有着密不可分的关系。在英文中,“statistics”一词有两个含义:当它以单数名词出现时,表示作为一门科学的统计学;当它以复数名词出现时,表示统计数据或统计资料。从中可以看出,统计学与统计数据之间有着密不可分的关系。统计学是由一套收集和处理统计数据的方法所组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。统计数据不用统计方法去分析也仅仅是一堆数据而已,无法得出任何有益的结论。
其次,统计数据不是指单个的数字,而是由多个数据构成的数据集。单个的数据显然用不着统计方法进行分析,仅凭一个数据点,我们也不可能得出事物的规律,只有经过对同一事物进行多次观察或计量得到大量数据,才能利用统计方法探索出内在的规律性。
2.统计学研究对象的特点
正确地确定统计学的研究对象,是一切统计研究的起点。对统计学的研究对象有了明确的认识,才能进一步认识统计的性质、统计的研究领域、统计所特有的规律以及研究这个规律的方法等。也只有解决了这一问题,才能理解统计学和其他学科的联系和区别。
统计学的研究对象是现象总体的数量方面,即社会经济现象总体的数量特征和数量关系。通过对这个对象的研究,以认识社会经济发展规律的具体表现。
统计学研究对象的特点有如下几点:
1.总体性。统计学的研究对象是自然、社会经济领域中现象总体的数量方面,即统计的数量研究是对总体普遍存在着的事实进行大量观察和综合分析,得出反映现象总体的数量特征和资料规律性。自然、社会经济现象的数据资料和数量对比关系等一般是在一系列复杂因素的影响下形成的。在这些因素当中,有起着决定和普遍作用的主要因素,也有起着偶然和局部作用的次要因素。由于种种原因,在不同的个体中,它们相互结合的方式和实际发生的作用都不可能完全相同。所以,对于每个个体来说,就具有一定的随机性质,而对于有足够多数个体的总体来说又具有相对稳定的共同趋势,显示出一定的规律性。例如,对工资的统计分析,我们并不是要分析和研究个别人的工资,而是要反映、分析和研究一个地区、一个部门、一个企业事业单位的总体的工资情况和显示出来的规律性。统计研究对象的总体性,是从个体的实际表现的研究过渡到对总体的数量表现的研究的。例如,工资统计分析,要反映、分析和研究一个地区的工资情况,先要从每个职工的工资开始统计,然后再综合汇总得到该地区的工资情况,只有从个体开始,才能对总体进行分析研究。研究总体的统计数据资料,不排除对个别事物的深入调查研究,但它是为了更好地分析研究现象总体的统计规律性。
2.数量性。统计学的研究对象是自然、社会经济领域中现象的数量方面,这一特点是统计学(定量分析学科)与其他定性分析学科的分界线。数量性是统计学研究对象的基本特点,因为,数字是统计的语言,数据资料是统计的原料。一切客观事物都有质和量两个方面,事物的质与量总是密切联系、共同规定着事物的性质。没有无量的质,也没有无质的量。一定的质规定着一定的量,一定的量也表现为一定的质。但在认识的角度上,质和量是可以区分的,可以在一定的质的情况下,单独地研究数量方面,通过认识事物的量进而认识事物的质。因此,事物的数量是我们认识客观现实的重要方面,通过分析研究统计数据资料,研究和掌握统计规律性,就可以达到我们统计分析研究的目的。例如,要分析和研究国民生产总值,就要对其数量、构成及数量变化趋势等进行认识,这样才能正确地分析和研究国民生产总值的规律性。
3.客观性
统计数量是客观事物的反映,表示客观现象在具体时间、空间,具体条件作用下,实际已经达到的水平和程度。它独立存在于外部世界,不是人的意志所能转移的。统计资料虽然是经过人们有意识的调查、整理、汇总、加工,但都不能改变它的客观性。统计资料的客观性是统计质量的基础,基于此,统计资料不但确凿而且雄辩。统计工作只唯“实”,不唯“上”,维护统计资料客观性和真实性,是统计的基本传统。
然而,在统计实践中,“渗水”统计由来已久。最突出的是五十年代后期“大跃进”那几年,为求“卫星上天”胡报产量,虚假的统计数字造成了严重恶果。改革开放十多年来,统计工作大有改进,但在新的历史条件下,由于利益格局变动等原因,有些地方或单位在统计数字里“渗水”的现象又有所无中露头。这种现象既违背了统计对象的客观性,也是一种不法行为,我们必须坚决抵制。
4.具体性。统计研究对象是自然、社会经济领域中具体现象的数量方面。即它不是纯数量的研究,是具有明确的现实涵义的,这一特点是统计学与数学的分水岭。数学是研究事物的抽象空间和抽象数量的科学,而统计学研究的数量是客观存在的、具体实在的数量表现。统计研究对象的这一特点,也正是统计工作必须遵循的基本原则。
统计数字不是抽象的数字,它是社会经济现象在具体时间、地点、条件下所表现的数量。例如,国家统计局1994年3月1日发表的<<1993年国民经济和社会发展的统计公报>>中公布:①1993年全国国内生产总值31380亿元,比上年增长13。4%②1993年农业增加值6650亿元,比上年增长4%③1993年工业增加值14140亿元,比上年增长21.1%;……
这些主要指标,说明了我国1993年国民经济和社会发展情况。正因为具体性,所以统计的数字必须准确,公布的资料要注明出处来源。
5.变异性。统计研究对象的变异性是指构成统计研究对象的总体各单位,除了在某一方面必须是同质的以外,在其他方面又要有差异,而且这些差异并不是由某种特定的原因事先给定的。就是说,总体各单位除了必须有某一共同标志表现作为它们形成统计总体的客观依据以外,还必须要在所要研究的标志上存在变异的表现。否则,就没有必要进行统计分析研究了。例如,高等院校这个统计对象,除了都是从事高等教育的教学活动这一共同性质之外,各高等院校在隶属主管部门、院校性质、招生规模、专业设置等各方面又有差异。工人作为统计数据资料对象,每个工人在性别、年龄、工龄、工作性质、工资等方面是会有不同表现的。这样,统计分析研究才能对其表现出来的差异探索统计规律性。
6.范围的广泛性。统计学几乎不同程度地渗透到所有人类活动的领域。统计学研究对象的范围,既包括社会经济现象,也包括自然科技现象;既包括生产力,又包括生产关系;即有经济基础,又有上层建筑。此外,还要从社会经济与自然技术条件的联系中,研究技术条件对社会经济现象总体的影响。
3.统计学的分科
统计方法已被应用到自然科学和社会科学的众多领域,统计学也发展成为由若干分支学科组成的学科体系。从统计方法的构成来看,统计学可以分为描述统计学和推断统计学;从统计方法研究和统计方法的应用角度来看,统计学可以分为理论统计学和应用统计学。
(1)描述统计学和推断统计学
描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。
推断统计学(1nferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
图1–1 统计学探索客观现象数量规律性的过程
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。从图1–1我们可以看出描述统计学和推断统计学在统计方法探索客观现象数量规律性中的地位。
从图1–1可以看到,统计研究过程的起点是统计数据,终点是探索出客观现象内在的数量规律性。在这一过程中,如果搜集到的是总体数据(如普查数据),则经过描述统计之后就可以达到认识总体数量规律性的目的了;如果所获得的只是研究总体的一部分数据(样本数据),要找到总体的数量规律性,则必须应用概率论的理论并根据样本信息对总体进行科学的
推断。
显然,描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。由于在对现实问题的研究中,所获得的数据主要是样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。当然,这并不等于说描述统计不重要,如果没有描述统计收集可靠的统计数据并提供有效的样本信息,即使再科学的统计推断方法也难以得出切合实际的结论。从描述统计学发展到推断统计学,既反映了统计学发展的巨大成就,也是统计学发展成熟的重要标志。
(2)理论统计学和应用统计学
理论统计学(Theoretical Statistics)是指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数学理论。由于现代统计学用到了几乎所有方面的数学知识,从事统计理论和方法研究的人员需要有坚实的数学基础。此外,由于概率论是统计推断的数学和理论基础,因而广义地讲统计学也是应该包括概率论在内的。理论统计学是统计方法的理论基础,没有理论统计学的发展,统计学也不可能发展成为像今天这样一个完善的科学知识体系。
在统计研究领域,从事理论统计学研究的人相对是很少的一部分,而大部分则是从事应用统计学(Applied Statistics)研究的。应用统计学是研究如何应用统计方法去解决实际问题的。统计学是一门收集和分析数据的科学。由于在自然科学及社会科学研究领域中,都需要通过数据分析来解决实际问题,因而,统计方法的应用几乎扩展到了所有的科学研究领域。例如,统计方法在生物学中的应用形成了生物统计学,在医学中的应用形成了医疗卫生统计学,在农业试验、育种等方面的应用形成了农业统计学。统计方法在经济和社会科学研究领域的应用也形成了若干分支学科。例如,统计方法在经济领域的应用形成了经济统计学及其若干分支,在管理领域的应用形成了管理统计学,在社会学研究和社会管理中的应用形成了社会统计学,在人口学中的应用形成了人口统计学,等等。以上这些应用统计学的不同分支所应用的基本统计方法都是一样的,即都是描述统计和推断统计的主要方法。但由于各应用领域都有其特殊性,统计方法在应用中又形成了一些不同的特点。