生物统计学第四版知识点总结
发布时间:2024-11-08
发布时间:2024-11-08
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
一、 田间试验的特点
1、 田间试验具有严格的地区性和季节性,试验周期长。 2、 田间试验普遍存在试验误差
3、 研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研
究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求
结果重演性、结果可靠性、条件先进代表性、目的明确性 三、 单因素试验的处理数就是该因素的水平数。
四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组合数是?
3因素3水平的处理组合数是?
多因素试验的处理数是各因素不同水平数的所有组合。
五、 如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为
喷施等量清水 。
六、 简单效应的计算 N 的简单效应为40-30=10
在 N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算
P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、 互作的计算
N与P的互作为(16-10)/2=3或(14-8)/2=3
九、 田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试
验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误差,则精确度=准确度。)
十、 小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。
适当的时候可以考虑增加重复次数来降低误差。小区面积一般在6-60m2,而示范小区面积不小于330m2 。
十一、通常情况下,狭长小区误差比方形小区误差小。
小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1
十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复;小区面积较大的试验可设2-4次重复。
十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征
1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】 在1、2、3、… 、20这20个数字中随机抽取1个,求下列随机事件的概率。
(1)A=“抽得1个数字≤4”;
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
(2)B=“抽得1个数字是2的倍数”。(即n=20,而事件A所包含的基本事件有4个,既抽得编号为1,2,3,4中的任何1个,事件A便发生,即mA=4,所以 B
,16,18,20中的任何1
个,事件B
十七、推论1:完全事件系的概率为1;推论2:对立事件的概率为:
十八、二项分布是离散型变数的一种重要的理论分布,必须满足两个基本条件:(各事件是相互独立的;各随机事件必须发生非此即彼的对立事件。) 十九、正态分布曲线是一个曲线系统。有两个参数, 即平均数 μ 和标准差σ。 μ决定了曲线在x轴上的位置,σ决定了它的变异度
当σ恒定时,μ愈大,则曲线沿x轴愈向右移动;反之,μ愈小,曲线沿x轴愈向左移动。 当μ恒定时,σ越大,表示 x 的取值越分散, 曲线越“胖”;σ越小,x 的取值越集中在 μ 附近,曲线越“瘦”。 分布密度曲线与横轴所夹的面积为 1。X落入曲线下某一区间的概率,等于该区间的面积占总面积的成数。 记住 P(-1≤u<1)=0.6826 P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973 20、中心极限定理:
只要样本容量适当大,不论总体分布形状如何,分布都可看作为正态分布,n>30,就应用它
21、F (1)变数 x 遵循正态分布N(μ,σ2) (2)S12和S22彼此独立。
当资料不符合这些条件时,需作转换。
名词解释
准确性: 也叫准确度,指在试验中某一试验指标或性状的观测值与其真值接近的程度。
精确性:也叫精确度,指试验中同一试验指标或性状的重复观测值彼此接近的程度。
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
试验因素:试验中由人为控制的被变动的条件的总称,简称“因素”。 水平:试验因素的质的不同状态和量的不同等级。
例,品比试验中,品种是因素,每一个品种就是一个水平。(质量水平) 密度试验呢?(数量水平)
处理:几个因素不同水平的组合,即试验中具体研究比较的对象。 简单效应:同一因素内不同水平之间试验效应的差异。
平均效应:又叫主要效应,简称主效。一因素内各简单效应的平均数 互作(交互作用):因素内简单效应的平均差异。 试验误差:试验中观测值与理论真值之间的偏差
边际效应:小区两边或两端的植株因占有较大的空间而表现出的差异。
生长竞争:当相邻小区种植不同品种或施用不同肥料时,由于株高、分蘖能力或生长期的不同,通常将有一行或更多行受到影响的现象。 小区(plot):田间试验中安排一个处理的小块地段。 区组(block):将全部处理分配于相对同质的一块土地上,成为一个区组。 重复(Replication):同一处理所设置的试验单元数。即同一处理种植的小区数。
局部控制:将整个试验环境分成若干相对一致的小环境(区组),再在小环境内设置成套处理。
总体: 具有共同性质的个体所组成的集合。(总体内个体的数目用N表示。 分为有限总体和无限总体。)
样本:从总体中抽出的若干个个体组成样本。 随机样本:从总体中随机抽取的样本。
样本容量:样本中所包含的个体数目,用n表示。(样本容量越大,越能代表总体。注意:生物统计中规定,n<30为小样本,n>=30为大样本。) 全距:是资料中最大值与最小值之差,又称为极差(range),用R表示 自由度:在计算离均差平方和时,能够自由变动的离均差的个数。 二项总体:由非此即彼、二者必居其一的对立事件构成的总体。
抽样分布:指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样本计算的统计数组成的分布。
二项分布:二项总体的概率分布,称为二项分布。研究随机变数的取值以及取值对应的概率形成的分布。 正态分布:
统计推断:根据抽样分布律和概率理论由样本结果(统计数)来推断总体参数的过程。包括统计假设测验和参数估计两方面的内容。
参数估计:用样本的统计数对总体参数作出点估计和区间估计。
回归分析:对回归模型的资料进行的统计分析。其目的是建立由x预测y的回归方程,并确定给定的x某一值,y将什么范围内变化。 回归模型:变数之间存在因果关系
相关模型:变数间呈平行变化关系,即变量间相互影响。
相关分析:对相关模型的资料进行的统计分析。其目的是测定变数在数量关系上的密切程度和性质。
简答题
一、 田间试验误差的来源及控制途径
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
来源一:试验材料固有的差异。 其控制途径:选材一致、标准一致。 来源二:操作管理不一致引起的差异。
其控制途径:统一操作标准,一切操作管理、观察测量和数据收集都应以“区组”为单位进行,尽量减少可能发生的差异。
来源三:外界环境造成的差异。外界因素中,土壤差异是最主要、最有影响、最难以控制的差异。
其控制途径:1)选择肥力均一的试验地; 2)试验中采用适当的小区技术; 3)应用良好的试验设计和统计分析 二、各种实验设计的优缺点及其利用 1)完全随机设计
应用了试验设计的重复和随机两个原则,其优点是设计容易,处理数与重复次数都不受限制,统计分析也比较简单。
主要缺点是没有应用局部控制的原则,试验环境条件差异较大时试
验误差较大,试验的精确度较低。常用于土壤肥力均匀一致的田间试验和在实验室、温室、网室中进行的试验。 2) 随机区组设计
简单;适应性广;能提供无偏误差估计,降低误差;对试验地形要求不严格;试验的处理数目一般不要超过20
3) 拉丁方设计(区组数目等于重复次数,等于处理数。)优点:双向控制
土壤差异,具有较高的精确度;
缺点:缺乏随机区组的灵活性,不能将一直行或一横行分开设置,要求有整块平坦的土地;重复数等于处理数,两者相互制约,通常只限4-8个处理。
*裂区设计( 多因素试验的一种设计形式。)
1、先按一个因素的各处理设置主处理小区(主区),然后在主区内引进第二个因素的各个处理(副处理),即将主区按副处理再划分小区(副区或裂区)。副处理间的比较比主处理间的比较更为精确。
2、应将精确度要求更高的、主要研究的因素作为副区因素。
公式:
组中值=(组下限+组上限)/2
=组下限+1/ 2组距 =组上限-1/2组距 平均数是反映变数集中性的特征数
算术平均数:是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。 n
xi直接法 x1 x2 xn
x i 1
nn
加权法
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
xi —各组组中值; fi —各组次数;k —分组数。 (一)变异数的计算
1、极差 R=Xmax-Xmin 2、方差或均方(Variance)
方差是根据全部观察值来度量资料的变异度的,是能够正确反映资料的变异度的度量方法
平方和:
样本均方(
总体均方(σ2
3. 标准差(Standard Deviation)
方差的正根值,可以很好的表示资料的变异度,其单位与观察值的度量单位相同。
总体标准差(σ)
n-1是自由度(其统计意义是指在计算离均差平方和时,能够自由变动的离均差的个数。 如:有
5个观察值,其4个的离均差为3,2,-3,6,则第5个离均差必定为-
8,才能保证离均差之和等于0。
所以,在估计其他统计数时,如果该统计数受k个条件限制,则其自由度应该为n-k。
4、变异系数
(二)标准差的计算 1
2、矫正系数法
样本(n≤30)和未经分组的资料,直接利用下式计算标准差。
3
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
对于大样本(n﹥30)且已分组的资料,可在次数分布表的基础上采用加权法计算标准差,计算公式为:
f为第i组的次数;x为第i组的组中值;n为样本观测值的总个数。 理论分布 1、二项分布
kkn kkkn k
nnn
正态分布的定义
μx~N
(μ,σ2)。
标准化变换:
μ=0, σ2=1 的正态分布为标准正态分布。
标准正态分布的概率密度函数及概率分布累积函数分别记作f(u)和F(u):
随机变量u服从标准正态分布, 记作u~N(0,1)。
P(-1≤u<1)=0.6826
P(-2≤u<2)=0.9545
P(-3≤u<3)=0.9973 作变换u=(x -μ)/σ,故有
因此,计算一般正态分布的概率时, 只要将区间的上下限作适当标准化变换, 就可查标准正态分布的概率表求得概率。
样本标准误:在实际工作中,总体标准差σ往往是未知的,因而无法求得 。此时,可用样本标准差S 大题
统计假设测验的基本步骤和方法
1、对样本所属的总体提出统计假设,包括无效假设H0和备择假设HA 。 2、确定显著水平α值。
3、在无效假设为正确的条件下,根据统计数的分布律计算实际差数由误差造成
f(k) P(k) Cpq
P(k) Cpq
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
的概率。
4、依据“小概率事件实际不可能发生”原理接受或否定无效假设。
某地小麦品种的产量为每亩300kg, 。现有一新品种经过25个小区试验
75kg
后,得亩产量为 330kg,试问这个新品种与当地品种的产量有否显著差异? 1、提出假设 无效假设:
H0
:μ=μ0=300kg ,即实际差数是由试验误差造成的。说明这个新品种产量与当地一般品种比较差异不显著。 备择假设:
HA:备择假设μ≠
μ0,即实际差数是试验中处理的效应,不是误差造成的。说明这个新品种与当地品种差异显著。 2、确定显著水平:一般定为α=0.05 3、计算概率:
根据u 测验公式计算:
4、推断结论:
查表:u0.05=1.96,u >1.96
落入否定区,否定H0,接受HA。 说明这个新品种与当地品种差异显著
一尾测验
否定区在左尾:为了测验μ是否显著小于μ0 H0:μ≥μ0,HA:μ<μ0
☆否定区在右尾:为了测验μ是否显著大于μ0 H0:μ≤μ0,HA:μ>μ0。 例2:某地区10年前普查时,13岁男孩子的平均身高为1.51 m。现抽查200个12.5~13.5岁男孩,身高平均值为1.53,标准差为0.073m。问10年来该地区男孩子身高是否有明显增高?
分析:调查样本较原值是否有明显增长?没有降低的含义,所以是右尾测验。 1、提出假设 无效假设:
H0: μ≤μ1,该地区男孩子身高没有明显增高。 备择假设:
HA: μ> μ1 ,该地区男孩子身高有明显增高 2、确定显著水平:α=0.05 3、计算概率
注意:
★ 两尾测验当α=0.05时,查附表得uα=1.96。
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
★一尾测验时,需要将一尾概率乘以2,再查附表(两尾概率表)获得其临界u值。
一尾测验当α=0.05时,查附表2α =0.1,则u=1.64 。 所以,一尾测验容易否定无效假设。 4、推断结论:
因为 u >u0.1 =1.64 ,落入否定区,所以否定H0,接受HA,说明地区男孩子身高有明显增高。 方差分析
方差分析是将总变异分裂为各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度。除了可控制因素所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验的依据。 方差分析的基本步骤 1、自由度和平方和的分解 2、列方差分析表,做F测验 3、多重比较
总变异是nk个观察值的变异,故其自由度为nk-1,总平方和SST。总平方和SST=组内(误差)平方和SSe+处理平方和SSt
Tt
均方的计算
F测验
在作F则验时,应以取大值的均方(S12)作分子、取小值的均方(S22)作分母计算F值。
若F>F0.05或> F0.01,则F值在α=0.05或α=0.01水平上显著,否定H0,接受HA;
若F<F0.05,则接受H0,差异不显著。
SSe SS SS
SST x2 C
生物统计第四版。自己根据笔记和书本做的一些知识点的总结。仅供参考
多重比较
卡方测验
n0 卡方测验步骤:
1)提出两种假设; 2)确定显著水平; 3)计算卡方值;
4)推断是否接受无效假设。
n n
nk 12i
i
2i
上一篇:车间主任安全生产责任制
下一篇:新修水泥混凝土路面施工组织设计