生物统计学第四版知识点总结

发布时间:2024-11-08

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

一、 田间试验的特点

1、 田间试验具有严格的地区性和季节性,试验周期长。 2、 田间试验普遍存在试验误差

3、 研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研

究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求

结果重演性、结果可靠性、条件先进代表性、目的明确性 三、 单因素试验的处理数就是该因素的水平数。

四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组合数是?

3因素3水平的处理组合数是?

多因素试验的处理数是各因素不同水平数的所有组合。

五、 如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为

喷施等量清水 。

六、 简单效应的计算 N 的简单效应为40-30=10

在 N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算

P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、 互作的计算

N与P的互作为(16-10)/2=3或(14-8)/2=3

九、 田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试

验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误差,则精确度=准确度。)

十、 小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。

适当的时候可以考虑增加重复次数来降低误差。小区面积一般在6-60m2,而示范小区面积不小于330m2 。

十一、通常情况下,狭长小区误差比方形小区误差小。

小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1

十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复;小区面积较大的试验可设2-4次重复。

十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征

1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】 在1、2、3、… 、20这20个数字中随机抽取1个,求下列随机事件的概率。

(1)A=“抽得1个数字≤4”;

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

(2)B=“抽得1个数字是2的倍数”。(即n=20,而事件A所包含的基本事件有4个,既抽得编号为1,2,3,4中的任何1个,事件A便发生,即mA=4,所以 B

,16,18,20中的任何1

个,事件B

十七、推论1:完全事件系的概率为1;推论2:对立事件的概率为:

十八、二项分布是离散型变数的一种重要的理论分布,必须满足两个基本条件:(各事件是相互独立的;各随机事件必须发生非此即彼的对立事件。) 十九、正态分布曲线是一个曲线系统。有两个参数, 即平均数 μ 和标准差σ。 μ决定了曲线在x轴上的位置,σ决定了它的变异度

当σ恒定时,μ愈大,则曲线沿x轴愈向右移动;反之,μ愈小,曲线沿x轴愈向左移动。 当μ恒定时,σ越大,表示 x 的取值越分散, 曲线越“胖”;σ越小,x 的取值越集中在 μ 附近,曲线越“瘦”。 分布密度曲线与横轴所夹的面积为 1。X落入曲线下某一区间的概率,等于该区间的面积占总面积的成数。 记住 P(-1≤u<1)=0.6826 P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973 20、中心极限定理:

只要样本容量适当大,不论总体分布形状如何,分布都可看作为正态分布,n>30,就应用它

21、F (1)变数 x 遵循正态分布N(μ,σ2) (2)S12和S22彼此独立。

当资料不符合这些条件时,需作转换。

名词解释

准确性: 也叫准确度,指在试验中某一试验指标或性状的观测值与其真值接近的程度。

精确性:也叫精确度,指试验中同一试验指标或性状的重复观测值彼此接近的程度。

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

试验因素:试验中由人为控制的被变动的条件的总称,简称“因素”。 水平:试验因素的质的不同状态和量的不同等级。

例,品比试验中,品种是因素,每一个品种就是一个水平。(质量水平) 密度试验呢?(数量水平)

处理:几个因素不同水平的组合,即试验中具体研究比较的对象。 简单效应:同一因素内不同水平之间试验效应的差异。

平均效应:又叫主要效应,简称主效。一因素内各简单效应的平均数 互作(交互作用):因素内简单效应的平均差异。 试验误差:试验中观测值与理论真值之间的偏差

边际效应:小区两边或两端的植株因占有较大的空间而表现出的差异。

生长竞争:当相邻小区种植不同品种或施用不同肥料时,由于株高、分蘖能力或生长期的不同,通常将有一行或更多行受到影响的现象。 小区(plot):田间试验中安排一个处理的小块地段。 区组(block):将全部处理分配于相对同质的一块土地上,成为一个区组。 重复(Replication):同一处理所设置的试验单元数。即同一处理种植的小区数。

局部控制:将整个试验环境分成若干相对一致的小环境(区组),再在小环境内设置成套处理。

总体: 具有共同性质的个体所组成的集合。(总体内个体的数目用N表示。 分为有限总体和无限总体。)

样本:从总体中抽出的若干个个体组成样本。 随机样本:从总体中随机抽取的样本。

样本容量:样本中所包含的个体数目,用n表示。(样本容量越大,越能代表总体。注意:生物统计中规定,n<30为小样本,n>=30为大样本。) 全距:是资料中最大值与最小值之差,又称为极差(range),用R表示 自由度:在计算离均差平方和时,能够自由变动的离均差的个数。 二项总体:由非此即彼、二者必居其一的对立事件构成的总体。

抽样分布:指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样本计算的统计数组成的分布。

二项分布:二项总体的概率分布,称为二项分布。研究随机变数的取值以及取值对应的概率形成的分布。 正态分布:

统计推断:根据抽样分布律和概率理论由样本结果(统计数)来推断总体参数的过程。包括统计假设测验和参数估计两方面的内容。

参数估计:用样本的统计数对总体参数作出点估计和区间估计。

回归分析:对回归模型的资料进行的统计分析。其目的是建立由x预测y的回归方程,并确定给定的x某一值,y将什么范围内变化。 回归模型:变数之间存在因果关系

相关模型:变数间呈平行变化关系,即变量间相互影响。

相关分析:对相关模型的资料进行的统计分析。其目的是测定变数在数量关系上的密切程度和性质。

简答题

一、 田间试验误差的来源及控制途径

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

来源一:试验材料固有的差异。 其控制途径:选材一致、标准一致。 来源二:操作管理不一致引起的差异。

其控制途径:统一操作标准,一切操作管理、观察测量和数据收集都应以“区组”为单位进行,尽量减少可能发生的差异。

来源三:外界环境造成的差异。外界因素中,土壤差异是最主要、最有影响、最难以控制的差异。

其控制途径:1)选择肥力均一的试验地; 2)试验中采用适当的小区技术; 3)应用良好的试验设计和统计分析 二、各种实验设计的优缺点及其利用 1)完全随机设计

应用了试验设计的重复和随机两个原则,其优点是设计容易,处理数与重复次数都不受限制,统计分析也比较简单。

主要缺点是没有应用局部控制的原则,试验环境条件差异较大时试

验误差较大,试验的精确度较低。常用于土壤肥力均匀一致的田间试验和在实验室、温室、网室中进行的试验。 2) 随机区组设计

简单;适应性广;能提供无偏误差估计,降低误差;对试验地形要求不严格;试验的处理数目一般不要超过20

3) 拉丁方设计(区组数目等于重复次数,等于处理数。)优点:双向控制

土壤差异,具有较高的精确度;

缺点:缺乏随机区组的灵活性,不能将一直行或一横行分开设置,要求有整块平坦的土地;重复数等于处理数,两者相互制约,通常只限4-8个处理。

*裂区设计( 多因素试验的一种设计形式。)

1、先按一个因素的各处理设置主处理小区(主区),然后在主区内引进第二个因素的各个处理(副处理),即将主区按副处理再划分小区(副区或裂区)。副处理间的比较比主处理间的比较更为精确。

2、应将精确度要求更高的、主要研究的因素作为副区因素。

公式:

组中值=(组下限+组上限)/2

=组下限+1/ 2组距 =组上限-1/2组距 平均数是反映变数集中性的特征数

算术平均数:是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。 n

xi直接法 x1 x2 xn

x i 1

nn

加权法

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

xi —各组组中值; fi —各组次数;k —分组数。 (一)变异数的计算

1、极差 R=Xmax-Xmin 2、方差或均方(Variance)

方差是根据全部观察值来度量资料的变异度的,是能够正确反映资料的变异度的度量方法

平方和:

样本均方(

总体均方(σ2

3. 标准差(Standard Deviation)

方差的正根值,可以很好的表示资料的变异度,其单位与观察值的度量单位相同。

总体标准差(σ)

n-1是自由度(其统计意义是指在计算离均差平方和时,能够自由变动的离均差的个数。 如:有

5个观察值,其4个的离均差为3,2,-3,6,则第5个离均差必定为-

8,才能保证离均差之和等于0。

所以,在估计其他统计数时,如果该统计数受k个条件限制,则其自由度应该为n-k。

4、变异系数

(二)标准差的计算 1

2、矫正系数法

样本(n≤30)和未经分组的资料,直接利用下式计算标准差。

3

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

对于大样本(n﹥30)且已分组的资料,可在次数分布表的基础上采用加权法计算标准差,计算公式为:

f为第i组的次数;x为第i组的组中值;n为样本观测值的总个数。 理论分布 1、二项分布

kkn kkkn k

nnn

正态分布的定义

μx~N

(μ,σ2)。

标准化变换:

μ=0, σ2=1 的正态分布为标准正态分布。

标准正态分布的概率密度函数及概率分布累积函数分别记作f(u)和F(u):

随机变量u服从标准正态分布, 记作u~N(0,1)。

P(-1≤u<1)=0.6826

P(-2≤u<2)=0.9545

P(-3≤u<3)=0.9973 作变换u=(x -μ)/σ,故有

因此,计算一般正态分布的概率时, 只要将区间的上下限作适当标准化变换, 就可查标准正态分布的概率表求得概率。

样本标准误:在实际工作中,总体标准差σ往往是未知的,因而无法求得 。此时,可用样本标准差S 大题

统计假设测验的基本步骤和方法

1、对样本所属的总体提出统计假设,包括无效假设H0和备择假设HA 。 2、确定显著水平α值。

3、在无效假设为正确的条件下,根据统计数的分布律计算实际差数由误差造成

f(k) P(k) Cpq

P(k) Cpq

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

的概率。

4、依据“小概率事件实际不可能发生”原理接受或否定无效假设。

某地小麦品种的产量为每亩300kg, 。现有一新品种经过25个小区试验

75kg

后,得亩产量为 330kg,试问这个新品种与当地品种的产量有否显著差异? 1、提出假设 无效假设:

H0

:μ=μ0=300kg ,即实际差数是由试验误差造成的。说明这个新品种产量与当地一般品种比较差异不显著。 备择假设:

HA:备择假设μ≠

μ0,即实际差数是试验中处理的效应,不是误差造成的。说明这个新品种与当地品种差异显著。 2、确定显著水平:一般定为α=0.05 3、计算概率:

根据u 测验公式计算:

4、推断结论:

查表:u0.05=1.96,u >1.96

落入否定区,否定H0,接受HA。 说明这个新品种与当地品种差异显著

一尾测验

否定区在左尾:为了测验μ是否显著小于μ0 H0:μ≥μ0,HA:μ<μ0

☆否定区在右尾:为了测验μ是否显著大于μ0 H0:μ≤μ0,HA:μ>μ0。 例2:某地区10年前普查时,13岁男孩子的平均身高为1.51 m。现抽查200个12.5~13.5岁男孩,身高平均值为1.53,标准差为0.073m。问10年来该地区男孩子身高是否有明显增高?

分析:调查样本较原值是否有明显增长?没有降低的含义,所以是右尾测验。 1、提出假设 无效假设:

H0: μ≤μ1,该地区男孩子身高没有明显增高。 备择假设:

HA: μ> μ1 ,该地区男孩子身高有明显增高 2、确定显著水平:α=0.05 3、计算概率

注意:

★ 两尾测验当α=0.05时,查附表得uα=1.96。

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

★一尾测验时,需要将一尾概率乘以2,再查附表(两尾概率表)获得其临界u值。

一尾测验当α=0.05时,查附表2α =0.1,则u=1.64 。 所以,一尾测验容易否定无效假设。 4、推断结论:

因为 u >u0.1 =1.64 ,落入否定区,所以否定H0,接受HA,说明地区男孩子身高有明显增高。 方差分析

方差分析是将总变异分裂为各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度。除了可控制因素所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验的依据。 方差分析的基本步骤 1、自由度和平方和的分解 2、列方差分析表,做F测验 3、多重比较

总变异是nk个观察值的变异,故其自由度为nk-1,总平方和SST。总平方和SST=组内(误差)平方和SSe+处理平方和SSt

Tt

均方的计算

F测验

在作F则验时,应以取大值的均方(S12)作分子、取小值的均方(S22)作分母计算F值。

若F>F0.05或> F0.01,则F值在α=0.05或α=0.01水平上显著,否定H0,接受HA;

若F<F0.05,则接受H0,差异不显著。

SSe SS SS

SST x2 C

生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考

多重比较

卡方测验

n0 卡方测验步骤:

1)提出两种假设; 2)确定显著水平; 3)计算卡方值;

4)推断是否接受无效假设。

n n

nk 12i

i

2i

生物统计学第四版知识点总结.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219