梁广1,2邵长高1,2
(1.广州海洋地质调查局 广州 510760;2.国土资源部海底矿产资源重点实验室 广州 510760)
第一作者简介:梁广(1972—),男,工程师,主要从事网络管理和数据管理工作,E-mail:。
摘要 近年来资源勘探已经覆盖大部分陆地区域,越来越多的国家把目光投向海洋。海洋作为一个巨大的能源和资源宝库在国民经济、军事战略等的重要性也日益显现。各个国家竞相制定海洋科技开发规划、战略计划,优先发展海洋新技术[1]。如何有效的从海量海洋地质调查数据中获取有用信息是海洋新技术研究中的重要研究内容。论文针对海洋地质调查数据研究技术应用需求,引入了回归分析模型到海洋地质调查数据库中,详细介绍了回归分析的技术方法和在海洋地质调查数据库研究中的应用优势,为海洋科学研究提供了技术支持。
关键词 海洋地质 回归分析 数据库
1 前言
随着陆地资源的消耗和人类对能源越来越强烈的需求,海洋作为一个尚待大规模开发的能源和资源宝库引起各国越来越多的关注。我国作为世界上最大的发展中国家对能源的需求也在大幅增加,近年来我国石油进口数量急剧增长,据估计到2020年我国石油进口依存度将达到60%。党和国家领导人多次提出“资源、能源、特别是油气资源,已成为我国经济和社会发展的重要因素,解决后备能源问题是保证国家经济安全的大事”。随着我国国土资源大调查和海洋地质专项调查的开展,大量的海洋地质数据被收集和积累,并建立了多个满足各自业务需求的信息系统和数据源[2]。如何有效的从海量海洋地质调查数据中获取有用信息是海洋新技术研究中的重要研究内容。论文针对海洋地质调查数据研究技术应用手段的需求,引入了回归分析技术到海洋地质调查数据库中,详细介绍了回归分析的技术方法和在海洋地质调查数据库研究中的应用优势,为海洋科学研究提供了技术支持。
2 回归分析概述
2.1 概述
回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析[3]。回归分析预测法可以从各数据之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测方法,通过对与预测对象(y)有联系的多个因素X1,X2,……,Xk建立回归模型。求出的回归模型是否合理,是否符合变量之间的客观规律性,引入相关因素是否有效,变量之间是否存在线性相关关系,模型能否付诸应用,这要通过检验决定。本文给出了两方面的检验:一方面为实际意义检验。即利用理论所拟定的期望值与实际结果相比较是否相符。另一方面为统计检验:分别为拟合优度检验(R平方检验)、方程显著性检验(F检验)、变量显著性检验(t检验)[4]。论文主要介绍一元线性回归分析在海洋地质调查数据库中的应用。
2.2 一元线形回归分析模型
线性回归分析可以描述两个要素之间的回归关系。线性回归分析公式为:yi=a+bxi+εi.其中a和b为参数.εi是误差.我们定义Q(a,b)a为总误差。则:
南海地质研究(2014)
对公式两边的a和b求导得:
南海地质研究(2014)
南海地质研究(2014)
x表示x的平均值.y表示y的平均值.
关系系数R2求值方法为[5]:
南海地质研究(2014)
2.3 多元线形回归分析模型
研究对象y受多个因素x1,x2,x3,…xn的影响,假定各个影响因素与y的关系是线性的,则可建立多元线性回归模型:
y=β0+β1x1+β2x2+…+βkxk+ε
式中:x1,x2,……,xk代表影响因子;ε 为随机误差;y 代表所研究的对象,即预测目标[3]。
2.4 统计检验
统计检验是运用数理统计的方法,对方程进行检验、对模型参数估计值的可靠性进行检验。这主要包括拟合优度检验、方程显著性检验、变量显著性检验,即常用的R2检验、F检验和t检验。
2.4.1 拟合优度检验(检验):
拟合优度检验就是检验回归方程对样本观测值的拟合程度。又称为复相关系数检验法,它是通过对总变差(总离差)的分解得到。
南海地质研究(2014)
其中
南海地质研究(2014)
总变差平方和S总是各个观察值与样本均值之差的平方和,反映了全部数据之间的差异;残差平方和S残是总变差平方和中未被回归方程解释的部分,由解释变量x1,x2……,xk中未包含的一切因素对被解释变量y的影响而造成的;回归平方和S回是总变差平方和中由回归方程解释的部分。对于一个好的回归模型,它应该较好地拟合样本观测值,S总中S残越小越好。于是可以用:
南海地质研究(2014)
求得[4]。
2.4.2 方程显著性检验(F 检验):
对于多元线性回归方程,方程显著性检验就是对总体的线性关系是否显著成立作出推断,即检验被解释变量y与所有解释变量X1,X2,……,Xk之间的线性关系是否显著,
南海地质研究(2014)
即F统计量服从以(k,n-k-1)为自由度的F分布。首先根据样本观测值及回归值计算出统计量F,于是在给定的显著性水平a下,若F>Fa(k,n-k-1),则拒绝H0,判定被解释变量y与所有解释变量x1,x2,……,xk之间的回归效果显著,即确实存在线性关系;反之,则不显著[4]。
2.4.3 变量显著性检验(t检验):
对于多元回归模型,方程的显著性并不意味每个解释变量对被解释变量y的影响都是重要的。如果某个解释变量并不重要,则应该从方程中把它剔除,重新建立更为简单的方程。所以必须对每个解释变量进行显著性检验。
在给定的显著性水平a下,若|ti|>ta/2(n-k-1),则拒绝H0,说明解释变量xi对被解释变量y有显著影响,即xi是影响y的主要因素;反之,接受H0,说明解释变量xi对被解释变量y无显著影响,则应删除该因素[4]。
3 应用实例
论文利用线形回归分析模型对南海海域海洋沉积物温度进行了分析,其中散点图显示如图1所示,回归分析结果见表1。
图1 水深与沉积物温度散点图
Fig.1 Water depth vs.sediment temperature
表1 水深沉积物温度回归分析结果Tab.1 The regression analysis result for Water depth vs.sediment temperature
读取回归结果如下:
截距:a=17.56;斜率:b=-0.0014;相关系数:R=0.276;测定系数:R2=0.076;F值:F=89.54。
建立回归模型,并对结果进行检验
模型为: 。
F值的计算公式和结果为:
南海地质研究(2014)
其中P<0.0001。回归结果证明,沉积物温度与海水深度有着密切的关系,但是通过散点图显示,并不是温度越深沉积物温度越低。而是受到其他例如海底热流,海洋环流等因素的影响。
4 结语
本文介绍了回归分析在海洋地质调查研究中的应用,同时提供了回归分析的技术原理及实现方法,并通过对南海沉积物与海水深度关系模型进行了应用分析,回归结果显示了两者具有密切但是存在不确定性的关系。实验结果得到有效的应用。
参考文献
[1]单宝强,毛永强.2005.GIS中的坐标系定义与转换[J].黑龙江国土资源,11,38-39
[2]苏国辉,孙记红,等.2011.海洋地质数据集成中的关键问题和方案[J].海洋地质前沿,11(27):51
[3]百度百科.回归分析.http://baike.baidu.com/view/145440.htm
[4]沈聪.2009.基于EXCEL的回归分析在足迹分析上的应用[M].辽宁警官高等专科学校本科毕业论文
[5]Cottrell A.Regression Analysis:Basic Concepts.http://www.wfu.edu/~cottrell/ecn215/regress.pdf
The Marine Geological Survey Based on Regression Analysis
Liang Guang1,2,Shao Changgao1,2
(1.Guangzhou Marine Geological Survey,Guangzhou,510760;2.Key Laboratory of Marine Mineral Reasources,MLR,Guangzhou,510760)
Abstract:The new resources survey had covered most of the continental area at present.So,the ocean resources have attracted more and more attention now as it is a huge resource and energy reservoir that had a profound meaning to national economy and military strategy.The energy competition made manly countries developed new technology project and put the new ocean technology as the primary study area.However,how to abstract useful information from marine geological survey data is one of the most important study technologies.This paper focuses on the study of the deficit of marine database technology and introduces regression analysis model and the application advantage of it.The purpose of this paper is to provide the technology support for marine study.Key word:Marine geology;Regression analysis model;Database