摘要:本文通过在植物品种改良中应用统计学部分原理,以双因素方差分析计算区分出影响植物品种特征特性的遗传与非遗传因素,以累计贡献率、主成分分析、通径分析确定影响植物品种的主要性状指标,对育成的优势组合采取聚类分析,筛选优势组合群体,为加快育种进程降低育种成本提供借鉴参考。
关键词:统计学;植物育种;应用研究
统计学是数学的一个重要组成部分,统计学的英文名称为statistics,其重点在与对数据的收集、处理和分析,并最终从数据分析中发现科学的规律或结论。一般认为其源于对社会经济问题的研究,历经“城邦政情”、“政治算数”和“统计分析科学”三个阶段。发展至今已经成为社会政治、经济、金融等众多领域的重要工具。
而在农业科学研究方面,统计学的应用还主要存在于农业经济类社会学科的应用上,在农业自然科学应用方面还相对较少、应用相对简单,主要以差异性检验、相关性分析为主。
统计学能不能更深入一步的应用于植物新品种的培育与资源创新工作呢?通过与相关科研人员接触,参与科研活动,笔者认为统计学完全可以更深入、更广泛的应用于植物品种改良、资源创新科研工作中,为降低品种改良盲目性、提高品种改良效率、降低品种改良成本有重要意义。
1当前农业科研中植物品种改良的现状
当前的植物品种改良过程主要包括两个阶段:一是种质资源的创新与改造,二是杂交组合的配制。其中资源的创新与改造是品种改良的重点,存在的问题有以下两点:
1.1资源性状控制因素认知不清,资源创新盲目性较大
由于多年来我国高等教育中高度精细的专业设置,从事品种改良的育种工作者专业性极强,知识面相对狭窄,品种选育中对资源某一性状的掌握以纵向为主,缺乏横向比对,对控制某一性状的因素属于遗传或非遗传类型认识不清,存在很大的选育盲目性。例如,当前热炒的富硒抗癌植物品种选育,问题在于硒在该农作物中的高含量是品种因素还是栽培因素造成的,存在着认知不清的问题,如不加厘清,盲目上马选择富硒资源,工作就存在很大的不确定性。
1.2科研投入精力与物力过大
为确定植物品种性状为遗传性状,当前开展了大量的基因工程研究,重点通过分子标记的手段来确定遗传性状。而通过分子进行标记的前提是该性状必须为遗传性状,因此前期的性状遗传性认定工作量非常巨大,筛选的过程不仅周期长、而且设备昂贵、药品毒性高,导致科研上的投入不仅科研人员精力增多、而且财力物力的投入也十分大,在一定程度上影响了育种工作的进程。
2以统计学中几个计算方法对植物品种选育的促进作用
在上述1中存在的两点问题是当前在植物品种改良过程中存在的主要问题,其实通过精细的试验设计,对种质资源的相关指标进行检测并进行统计分析,就能很好的助力新品种的选育工作。具体包含以双因素方差分析:鉴别种质资源中性状的遗传与非遗传特性;以主成分分析、通径分析:确定影响品种特性的主要性状;以聚类分析:对配制的杂交组合进行规划分类,筛选优良品种。
2.1以双因素方差分析鉴定种质资源的遗传与非遗传性状
仍以富硒食品中硒的含量为例,能否开发富硒的植物品种首先要鉴定硒在植物中的含量是否受遗传控制,即品种间有显著差异,这就需要排除栽培管理因素、气候因素、人为误差等各种因素的影响,这可总称为非遗传因素,因此在设计试验时,以相同的品种群体在不同的地区间进行生产繁殖,统一检验检测标准,并获得检测结果进行分析。例如对10个品种分别在10个不同地区种植,取样后检验硒的含量,其中品种之间的差异代表遗传性影响,而不同地区间的差异代表非遗传性影响。
遗传与非遗传因素对品种的影响,包括在品质、抗性、产量等众多方面,均可以不同品种不同地区间相同指标的双因素方差分析来鉴别,因试验设计与检验检测手段均为成熟的技术手段,所以投入的精力与财力物力会很低。对于受遗传因素影响的性状指标,就可作为品种改良的重要指标,而受非遗传因素影响的性状指标,可避免徒劳的选育工作,通过栽培管理手段来实现。
2.2以主成分分析、累计贡献率、载荷和通径分析确定品种改良的主要性状
在植物品种改良过程中,某一方面性状会含有很多类详细指标,如品质方面含有蛋白质、脂肪、碳水化合物、纤维素、维生素、矿物质、水分等等;在抗性方面含有脯胺酸、丙二醛、POD、SOD等等;在产量方面含有株高、单株重、单果重、密度、结果数等等。在对影响特定性状的指标选择时,对一些影响较小、微乎其微的指标就可忽略不计,重点对主要指标进行选择。
因此,需要对所有指标进行一下主成分分析,每一项指标的特征值,计算各自在整体的贡献率、从贡献率最大指标开始依次累加各指标的贡献率,获得累计贡献率,超过85%为止,这几项指标就可作为影响该品种相关性状的主要指标。
需要注意的是,影响某品种的某方面性状的相关指标有正向相关的,同时也有负向相关的。如可溶性糖含量高品质就好,脯胺酸含量高耐寒性就好,这呈现的就是正相关;而苦味素含量增高品种口感品质变差,丙二醛含量高耐寒性变差,这呈现的就是负相关。
因此,获得影响性状的主要指标后,还要对各指标进行一个相关性分析,确定每一项指标间的正负性,在综合考量的基础上,做出最终的品种选育决定。
以谷子高品质品种选育为例,选择含量最高的五个指标粗蛋白、脂肪、总碳水化合物、粗纤维、水分为分析对象。通过主成分分析,确定粗蛋白、脂肪、总碳水化合物、粗纤维这4个指标为影响谷子品质的主要指标;相关性分析显示粗蛋白与粗纤维与品质呈负相关性,脂肪与总碳水化合物与品质呈正相关性,通径分析各指标对品质影响的直接或间接作用,因此高品质品种的选育需要在低世代时选择正相关的指标,在高世代时再选择负相关的指标。据此就能選出营养丰富、口感良好的谷子新杂交组合群体,通过最终选择确定一个最佳品种。
2.3聚类分析在杂交组合筛选中的应用
在完成种质资源创新的基础上,利用含优良目标性状种质资源配制一系列的杂交组合群体,在杂交组合群体中要优中选优,简单直接的直接感官测定,存在随意性大、误差明显的缺点。科学的研究应以数据来说话,因此需要对杂交组合群体进行一次聚类分析,将群体中组合分为优、良、一般、差等不同等级,再在优良的等级里选择最优的组合作为新品种。
聚类分析的另一个优点就是可以对聚类后的同类群体进行不用用途品种的开发。以不同季节黄瓜栽培品种选育为例,首先对配制的杂交组合进行耐寒性聚类分析,选择出其中耐寒性优良的一类,耐寒性一般、差的组合直接淘汰;耐寒性优良的一类中根据所耐低温度程度与耐性时间长短,可将组合分成冬季温室专用品种、早春大棚专用品种等不同的類型。
当然聚类分析的缺点也是所有统计学的短板,就是无法对植物品种的描述性指标进行分析,因此对性状指标检测时尽可能多的以数据形式进行。如刺、毛、瘤、粒、体积等指标,应以单位面积或个体内的具体数据体现,避免出现多、少、深、浅、大、小等模糊性描述性文字。
3结论与探讨
综上所述,以成熟简单的理化指标检测手段可以较低的成本与精力投入促进植物新品种改良研究的进程。统计分析不仅仅局限于某一个数据指标的显著性差异分析、相关性分析,综合利用起来,在合理试验设计的条件下,可建立一套完成的品种选育流程。其中以主成分分析、贡献率、累计贡献率、载荷来确定种质资源的主要性状指标,以相关性分析确定选择的正负方向;对未知的有特殊价值的性状指标,先进行遗传与非遗传因素的双因素方差分析,确定为遗传因素后再进行定向的选择,获取或高或低的优异种质资源;利用已选出的优异资源配制杂交组合,通过生产性试验采集数据后进行聚类分析,选出适宜不同生产方式使用的植物新品种。
本研究重点解决的是品种选育中的盲目性,并非指生物工程、基因工程等不应该进行,只是在开展生物工程、基因工程之前,对相关的性状进行一下初步筛选,避免盲目上马造成的精力、物力、财力的浪费,对确定的遗传性性状进行分子标记能让资源改良的目的性更强、精准性更高。
参考文献:
[1] 刘晓东.影响谷子Fe、Zn、Mg、Se元素含量的品种与地域因素差异性研究.河北农业科学,2011,15(10):7-10,108.
[2] 张爱霞.谷子主要营养品质性状遗传差异与选择研究.中国农学通报,2012,28(21):58-62.
作者简介: 刘畅(1999-),男,汉族,河北衡水第一中学学生。