您的当前位置:首页生物统计学

生物统计学

来源:小侦探旅游网


生物统计学.txt30生命的美丽,永远展现在她的进取之中;就像大树的美丽,是展现在它负势向上高耸入云的蓬勃生机中;像雄鹰的美丽,是展现在它搏风击雨如苍天之魂的翱翔中;像江河的美丽,是展现在它波涛汹涌一泻千里的奔流中。生物统计学是数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的科学。

生物统计学的主要内容:

1.试验设计(调查设计),广义的试验设计是指试验研究课题设计,狭义的试验设计主要是指试验单位 (如动物试验的畜、禽 )的选取、重复数目的确定及试验单位的分组。广义的调查设计 是 指 整个调查计划的制定,狭义的调查设计 主要 包含抽样方法的选取,抽样单位、抽样数目的确定等内容。

2.统计分析,统计分析 最重要的内容是 差异显著性检验。另一个重要内容即进行相关分析与回归分析.

总体:根据研究目的确定的研究对象的全体称为总体(population);

个体:组成总体的基本单元称为个体(individual);

样本:总体的一部分称为样本(sample);

有限总体:含有有限个个体的总体称为有限总体;

无限总体:包含有无限多个个体的总体叫无限总体;

样本容量:样本中所包含的个体数目叫样本容量或大小(sample size),样本容量常记为n。通常把n≤30的样本叫小样本,n >30的样本叫大样本;

随机抽取(random sampling) 的样本:是指总体中的每一个个体都有同等的机会被抽取组成样本;

统计分析的特点:通过样本来推断总体是统计分析的基本特点;有很大的可靠性但有一定的错误率这是统计分析的又一特点。

变量:相同性质的事物间表现差异性或差异特征的数据;通常用xi表示。

连续变量:表示在变量范围内可抽出某一范围的所有值,这种变量之间是连续的、无限的。如小麦的株高。

非连续变量(离散变量):表示在变量数列中,仅能取得固定数值。如菌落数、动物产仔数等。

常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。如样本的平均数、标准差等。

参数:由总体计算的特征数叫参数(parameter),是对一个总体特征的度量;

统计数:由样本计算的特征数叫统计量(staistic),它是总体参数的估计值。

准确性(accuracy)也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。

精确性(precision)也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。

随机误差也叫抽样误差(sampling error) 这是由于许多无法控制的内在和外在的偶然因素所造成。随机误差影响试验的精确性。

系统误差 也叫 片面误差 (lopsided error), 这是 由于试验动物的初始条件相差较大,饲料种类、品质、数量、饲养条件未控制相同 ,测量的仪器不准 、 标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起。系统误差影响试验的准确性。

试验资料的类型:

1.数量性状资料

计数资料(非连续变量):由计数法得到的数据,小麦穗数、鱼的尾数

计量资料(连续变量):由测量或度量所得的数据,小麦株高、人的身高、体重等。

2.质量性状资料:统计计数法&评分法

实验资料的来源:调查和实验

调查分普查和抽样调查;

算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。

中位数(M d):将资料中所有观测值依大小顺序排列,居于中间位置的观测数.

众数(M o ):资料中次数最多的一组的中点值。

标准差的特性:

1、标准差的大小,受多个观测值的影响,如果观测数与观测数间差异较大,其离均差也大,因而标准差也大,反之则小。

2、在计算标准差时,对在各观测数上加上或减去一个常数,其标准差不变。如果给各观测数乘以或除以一个常数a,则所得的标准差扩大或 缩小了a倍。

3、在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(±S)范围内;约有95.43%的观测值在平均数左右两倍标准差(±2S)范围内;约有99.73%的观测值在平均数左右三倍标准差(±3S) 范 围内。

标准差的作用:

1、表示变量分布的离散程度。标准差小,说明变量的分布比较密集在平均数附近,标准差大,则表明变量的分布比较离散。因此,可以用标准差的大小判断平均数代表性的大小。

2、利用标准差的大小,可以概括的估计出变量的次数分布及各类观测数在总体中所占的比例。

3、估计平均数的标准误。在计算平均数的估计标准误时,可根据样本标准差代替总体标准差进行计算。

4、进行平均数的区间估计和变异系数的计算。

随机试验:通常我们把根据某一研究目的 ,在一定条件下对自然现象所进行的观察或试验统称为试验。 而一个试验如果满足下述三个特性,则称其为一个随机试验,简称试验:(1)试验可以在相同条件下多次重复进行;(2)每次试验的可能结果不止一个 ,并且事先知道会有哪些可能的结果;(3)每次 试验总是恰好出现这些可能结果中的一个 ,但在一次试验之前却不能肯定这次试验会出现哪一个结果。

随机试验的每一种可能结果,在一定条件下可 能 发 生 ,也 可 能 不 发生,称为随机事件,简称 事 件

频率:在相同条件下进行几次重复试验,如果随机事件A发生的次数为m,那么m\\n称为随机事件A的频率.

概率:当试验重复数n逐渐增大时,随机事件A的频率W(A)就越来越稳定地接近某一数值 p , 那么 就 把 p称为随机事件A的概率,记为: P(A)=p

方差分析的相关术语和符号

试验因素(处理因素,因素,因子):试验中所研究的影响试验指标的原因或原因组合。

固定因素(可控因素)& 随机因素(非控因素)

因素水平(水平):每个试验因素的不同状态(处理的某种特定状态或数量上的差别)。

试验处理(处理):指对受试对象给予的某种外部干预(或措施),是试验实施因子水平

的一个组合。(单因素处理&多因素处理)

试验单位:指在试验中能接受不同试验处理的独立的试验载体,就是根据研究目的而确定的观测总体。

重复:指在试验中,将一个处理实施在两个或两个以上的试验单位上。处理实施的试验单位数。

方差和方差分析:方差是描述变异的一种指标,方差分析也就是对变异的分析。对总变异进行分析,看总变异是由哪些部分组成的,这些部分间的关系如何。

方差分析的基本步骤

1、将样本数据的总平方和和总自由度分解为各变异因素的平方和和自由度;

2、列方差分析表进行F检验,以弄清各变异因素在总变异中的重要程度;

3、对各处理平均数进行多重比较。

回归分析的意义

1、预报,生物学中,研究两变量之间的关系,可以帮助我们揭示生物各性状之间的内在联系,同时,也可以由一个变量去预报另一个变量。

2、减小试验误差

试验设计

广义的试验设计是指试验研究课题设计,也就是指整个试验计划的拟定 。

狭义的试验设计主要是指试验单位 (如动物试验的畜、禽 )的选取、重复数目的确定及试验单位的分组。

试验设计的基本要素

1、处理因素:指对受试对象给予的某种外部干预(或措施),称为处理因素,简称处理。

与处理因素相对应的是非处理因素,是引起试验误差的主要来源,在试验设计时应引起高度重视,尽量加以有效控制。

2、受试对象:处理因素的客体,实际上就是根据研究目的而确定的观测总体。

3、处理效应:是处理因素作用于受试对象的反应,是研究结果的最终体现。

试验误差的来源

(1)试验材料固有的差异;

(2)试验条件不一致;

(3)操作技术不一致;

(4)偶然性因素的影响。

控制试验误差的途径

(1)选择纯合一致的试验材料;

(2)改进操作管理制度,使之标准化;

(3)精心选择试验单位;

(4)采用合理的试验设计。

试验设计的基本原则

(一)重复: 重复是指试验中同一处理实施在两个或两个以上的试验单位上。设置重复的主要作用在于估计试验误差和降低试验误差 。

(二)随机: 随机是指试验中每一处理及每个重复都有同等的机会设置在任何一个试验单位上,避免试验人员主观倾向的影响,以保证试验条件在空间和时间上的均匀性。随机化是在试验中排除非试验因素干扰的重要手段,目的是为了获得无偏的误差估计量,通常可以采用抽签、摸牌、查随机数字表等方法来实现。

(三)局部控制: 在试验中,当试验环境或试验单位差异较大时,仅根据重复和随机化两原则进行设计不能将试验环境或试验单位差异所引起的变异从试验误差中分离出来,因而试验误差大,试验的精确性与检验的灵敏度低。为解决这一问题,在试验环境或试验单位差异大的情况下,可将整个试验环境或试验单位分 成若干个小环境或小组,在小环境或小组

内使非处理因素尽量一致,这就是局部控制。

对比试验设计

排列特点:每一供试品种均直接排列在对照区旁边,使每一小区可与其相邻的对照区直接比较。

统计分析:一般采用百分比法,即设对照CK为100,然后将各处理和对照相比较,求出其百分数。

间比设计:隔几个品种设一个CK

成组比较法

这种方法在只有两个处理时采用;

方法是把实验材料随机分成两组,各接受一种处理;

数据统计方法为成组t检验;

配对比较实验

用于两个处理的实验;

尽可能减少材料本身差异对试验结果带来的影响;

统计方法为成对t检验。

完全随机化设计

用于多组或多个处理水平相互比较的实验;

这种方法适用于实验材料均一性很好的情况;

实验设计主要原则就是保证样本的随机性;

统计方法为单因素方差分析。

随机区组试验设计

随机区组设计是根据局部控制和随机原理进行的设计;

方法:将试验单位按性质不同分成与重复数一样多的区组,每个区组均包括各处理的一个小区,区组内各处理随机排列;

统计分析:(一)单因素随机区组试验结果的方差分析 把区组和试验因素一起看成是两因素试验。 设试验有k个处理、n个区组,把总变异分解为区组、处理和误差三个部分。(二)两因素随机区组试验结果的方差分析. 试验中有两个因素A和B,分别具有a、b个水平,两因素各水平组成ab个处理组合,每个处理组合在r个区组间的三项分组资料,全部试验共得rab个观测值。

正交表的特性

1、任一列中,不同数字出现的次数相等

2、任两列中,同一横行所组成的数字对出现的次数相等

正交设计一般有以下几个步骤:

(一) 确定因素和水平

(二) 选用合适的正交表 选用正交表的原则是:既要能安排下试验的全部因素,又要使部分水平组合数(处理数)尽可能地少。

(三) 进行表头设计,列出试验方案 所谓表头设计,就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。

(四) 列出试验方案 把正交表中安排各因素的每个列(不包含欲考察的交互作用列)中的每个数字依次换成该因素的实际水平,就得到一个正交试验方案。

因篇幅问题不能全部显示,请点此查看更多更全内容