拉格朗日插值的优缺点如下:
两者都是通过给定n+1个互异的插值节点,求一条n次代数曲线近似地表示待插值的函曲线,这就叫做代数插值;Lagrange插值代数和Newton法插值都属于代数插值的范畴。Lagrange插值和Newton法插值的结果和余项都是一致的,因为都是利用n次多项式插值,所以一致。
Lagrange插值法是通过构造n+1个n次基本多项式,线性组合而得到的。而Newton法插值是通过求各阶差商,递推得到的一个f(x)=f(x0)+(x-x0)f[x0,x1]+(x-x0)(x-x1)f[x0,x1,x2]+(x-x0)(x-x(n-1))f[x0,x1,xn]这样的公式,代进去就可以得到。
假设已知n+1n+1个点相对多项式函数ff的值为:(x0,f(x0)),(x1,f(x1)),(x2,f(x2)),(xn,f(xn)),求此多项式函数f。LAGRANGE适用于理论应用,HERMITE多用于计算,牛顿插值两者皆可。
拉格朗日插值法是以法国十八世纪数学家约瑟夫·拉格朗日命名的一种多项式插值方法。许多实际问题中都用函数来表示某种内在联系或规律,而不少函数都只能通过实验和观测来了解。如对实践中的某个物理量进行观测,在若干个不同的地方得到相应的观测值,拉格朗日插值法可以找到一个多项式,其恰好在各个观测的点取到观测到的值。这样的多项式称为拉格朗日(插值)多项式。数学上来说,拉格朗日插值法可以给出一个恰好穿过二维平面上若干个已知点的多项式函数。拉格朗日插值法最早被英国数学家爱德华·华林于1779年发现[1],不久后(1783年)由莱昂哈德·欧拉再次发现。1795年,拉格朗日在其著作《师范学校数学基础教程》中发表了这个插值方法,从此他的名字就和这个方法联系在一起拉格朗日插值是一种多项式插值方法。是利用最小次数的多项式来构建一条光滑的曲线,使曲线通过所有的已知点。例如,已知如下3点的坐标:(x1,y1),(x2,y2),(x3,y3).那么结果是:y=y1L1+y2L2+y3L3,L1=(x-x2)(x-x3)/((x1-x2)(x1-x3)),L2=(x-x1)(x-x3)/((x2-x1)(x2-x3)),L3=(x-x1)(x-x2)/((x3-x1)(x3-x2)). 分段线性Lagrange插值 % 命令格式:y=lagrange1(x0,y0,x) % x0为节点向量,y0为对应的函数值向量, % x为插值点向量,返回值y为x处的函数近似值向量。插值法是:利用函数f (x)在某区间中插入若干点的函数值,作出适当的特定函数,在这些点上取已知值,在区间的其他点上用这特定函数的值作函数f (x)的近似值,这种方法称为插值法。其目的便就是估算出其他点上的函数值。而拉格朗日插值法就是一种插值法。要说用来干什么……在金融里面要算内部收益率(IRR)就会用到插值法。
基函数就是一个函数的固定形式,也就是函数只会在这个函数的基础上变化而不会丢掉的函数。例给定n+1个控制顶点Pi(i=0~n) ,则Bezier曲线定义为: P(t)=∑Bi,n(t)Pi u∈[0,1] 其中:Bi,n(t)称为基函数。拉格朗日插值公式指的是在节点上给出节点基函数,然后做基函数的线性组合,组合系数为节点函数值的一种插值多项式。线性插值也叫两点插值,已知函数y = f (x)在给定互异点x0, x1上的值为y0= f (x0),y1=f (x1)线性插值就是构造一个一次多项式P1(x) = ax + b使它满足条件P1 (x0) = y0 P1 (x1) = y1其几何解释就是一条直线,通过已知点A (x0, y0),B(x1, y1)。线性插值计算方便、应用很广,但由于它是用直线去代替曲线,因而一般要求[x0, x1]比较小,且f(x)在[x0, x1]上变化比较平稳,否则线性插值的误差可能很大。为了克服这一缺点,有时用简单的曲线去近似地代替复杂的曲线,最简单的曲线是二次曲线,用二次曲线去逼近复杂曲线的情形。简单地说,就是用一些易于计算处理的函数替代原来的函数求取差值。目的当然是求得不能精确确定的中间值,但为了减少误差、工作量及复杂性,这些函数通常都用一次曲线(直线)或二次曲线替代、组合。这样,即可获得一定的准确性,亦能在精确与便利之间平衡,一句话:又好又省。
拉格朗日乘数法(以数学家约瑟夫路易斯拉格朗日命名)是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法。
这种方法将一个有n个变量与k个约束条件的最优化问题转换为一个有n + k个变量的方程组的极值问题,其变量不受任何约束。这种方法引入了一种新的标量未知数,即拉格朗日乘数:约束方程的梯度的线性组合里每个向量的系数。
约瑟夫路易斯拉格朗日简介
约瑟夫路易斯拉格朗日(Joseph-Louis Lagrange,1736年1月25日-1813年4月10日),别名:约瑟普洛德维科拉格朗日亚,出生于意大利都灵,毕业于巴黎综合理工大学,法国著名数学家、物理学家。
1755年,写了论文“极大和极小的方法研究”,发展了欧拉所开创的变分法,为变分法奠定了理论基础。1756年,被任命为普鲁士科学院通讯院士。1766年,任普鲁士科学院数学部任,居住20年之久,期间,完成了经典力学著作《分析力学》。
1772年,完成“论三体问题”,同年,把欧拉没有解决的费马另一猜想“一个正整数能表示为最多四个平方数的和”证明出来。1811年,导得弹性薄板的平衡方程。1783年,被任命为都灵科学院名誉院长。1791年,被选为英国皇家学会会员。
1795年,担任国家经度局委员,同年,被选为法兰西研究院科学院数理委员会主席。1813年,出版《解析函数论,含有微分学的主要定理,不用无穷小,或正在消失的量,或极限与流数等概念,而归结为代数分析艺术》,第一次得到拉格朗日微分中值定理。
消元法你应该能懂 就是用x来代替y 求导数等于0 就能求出极值拉格朗日数乘法就是依赖消元法求极值的一种方法在求解时为什么这么构造函数你不需要知道只需令L(x,y,λ) = f(x,y)+λφ(x,y)左边就相当于一个符号你不用管 将右边f(x,y) φ(x,y)带入具体的题中的函数对右边:分别求x,y,λ的偏导数 例:求x偏导数就是将y,λ都看成常数令偏导数=0 从而得出三个等式解方程组 为极值
一元函数极值的导数法是没有条件的一般极值拉格朗日乘数法是有条件的条件极值,要构造拉格朗日函数
函数f(x,y)=0,在φ(x,y)=0条件下的极值:1,构造拉格朗日函数F(x,y,λ) = f(x,y)+λφ(x,y);2,分别求F对x y λ 的偏导数。令这三个偏导数=0;3,解这个三元的方程组。
本题主要目的是建立相关模型解决在修建水渠过程中的诸多问题,从而实现工程量最优化。 针对问题一,为了求得开掘水渠的土石方量,本文通过对比分段三次Hermite 插值与三次样条插值,最终采用分段三次 Hermite 插值的方法对已知数 据点进行插值拟合,得到关于水渠的曲线方程 y f x ,对水渠曲线方程积分即得到水渠长度 14550 7650 21 dx yL ,利用 MATLAB 求解得到水渠长度为: m 。因此最终解得开掘水渠的总土石方量为: 3 m135405LSV 。 针对问题二,在问题一的基础上,本文建立积分上限函数模型:令 7650 a ,1x 满足 1 2 16xaVS y dt ,求出 i x 后, 1 ix 满足 1 2 16iixxVS y dt ,从而将总土石方量的六等分,得到 7 .8736x 1 , 2 .9862x 2 , 10956 x3 , 12116 x4 ,13353x 5 ,进而确定了六等分点的坐标 y,x 。 针对问题三,设在沿水渠的公路上有三个变量,分别为 k ji x ,x,x ,为使得运输工作量最小,本文建立了无约束规划模型,利用 MATLAB 求解得到最小运输量为 4 m 。并给出了修建两条公路时水渠上的位置坐标 和 , 。 关键词:Hermite 插值 MATLAB 积分上限函数 无约束规划 一、问题重述 在某地区开掘水渠,已知该水渠经过的若干点。 问题一,求解水渠施工的总石方量; 问题二,如果将水渠的分成 6 截,每截土石方量相同,分段点应该取在何位置; 问题三,设平行于水渠修一条路。河道中挖出的土石方要运往 A(9500,4000)处为了方便运输,计划在沿水渠的公路上选择两点修建通往 A 处的临时公路,使得总的土石方运输工作量最小。 二、问题的分析 针对问题一,本题要求开掘水渠的总土石方量,已知水渠截面积,则主要目的在于求得水渠长度。已知水渠经过的若干点的位置,要得到水渠的长度,本文想到用插值拟合可以得到水渠曲线,对曲线积分则得到水渠长度。插值与拟合的方法有多种,样条插值会较光滑,但不一定能保持原有形状,考虑到要更好的保持水渠的形状,于是,本文选用 Hermite 方法进行插值拟合。 针对问题二, 要将水渠六等分且每段的土石方量相同,此问题为函数的反解问题,因此,在已知水渠曲线函数的情况下,本文可以考虑到用积分上限函数求解,从而确定 x 点,进而得到 y 点。 针对问题三,要修建公路以运输土石方,从而使运输量工作量最小。此问题为规划问题,在问题二中,本文已知 x 与土石方量 V 存在关系,又因为运输工作量等于土石方量与距离的乘积,因此,本文使用无约束规划模型,求工作量最小值即可。 三、模型假设 1、修建的两条临时公路为直线。 2、沿水渠的公路函数曲线近似与水渠的曲线函数相同。 四、符号说明 xf 水渠曲线方程 V 土石方量 S 水渠截面积 L 水渠长度 ix 水渠上点的横坐标 iy 水渠上点的纵坐标 iW 土石方运输工作量 1L 临时公路 2L 临时公路 五、模型的建立与求解 问题一 插值与拟合 由已知水渠经过的点,做出散点图(图 1) 1 x 10 420002500300035004000450050005500600065007000X/mY/m水渠散点图 图 1.水渠散点图 方法 1、利用 Hermite 方法对已知数据点进行插值。 【3】 设 已 知 函 数 xfy 在 1 n 个互异节点 n 10 x ,L,x,x 上 的 函 数 值 ii xfy n,L,1,0i 和导数值 i ' i ' x fy ,要求一个至多 2 n +1 次的多项 式 xH ,使得 i i yxH i ' i ' y xH n,1,0i Hermite 插值多项式为: 2 ' i i i i i i H x h x x a y y y 其中,2nij 0j j ij i x x xx h , n ij 0j j i i x x 1 a 。 利用 MATLAB 进行插值,得到插值曲线(图 2)。 1 x 10 420002500300035004000450050005500600065007000Hermite插值曲线与原始数据点X/mY/m Hermite插值曲线 原始数据点 图 插值曲线与原始数据点 方法 2、利用样条差值对已知数据点进行插值。 【3】 定义样条函数: 数学上将具有一定光滑性的分段多项式称为样条函数。具体的说,给定区间 a,b 的一个划分 0 1 1nn :a x x x x b 如果函数 () sx满足: 1. 在每个小区间 1 , ( 0,1, , 1) ii x x i n 上 () sx是k 次多项式; 2. () sx在 a,b 上具有 1 k 阶连续导数。 则称 () sx为关于划分的k 次样条函数,其图形称为k 次样条曲线。 01 , , , n x x x 称为样条节点, 1 2 1 , , , n x x x 称为内节点, 0, n xx称为边界点,这样样条函数的全体记作 ( , ) p Sk ,称为k 次样条函数空间。 显然,折线是一次样条曲线。 若 ( ) ( , ) p s x S k ,则 () sx是关于分划的k 次多项式样条函数。k 次多项式样条函数的一般形式为 101 ( ) ( ) !! i kn j ki kj ij x s x x x ik 其中 ( 0,1, , ) i ik 和 ( 1,2, , 1) j jn 均为任意常数,而 ( ) , ( ) , ( 1,2, , 1) 0, k jjk j j x x x x x x j n xx 本文使用 3 k 的情况:即为三次样条函数。 三次样条函数:对于 a,b 上的划分 0 1 1nn :a x x x x b ,则 1 2 3 3 323 0 11 ( ) ( ) ( ,3) 2! 3! 3! n j jp j aa s x x x x x x S 其中3 3 ( ) , ( ) , ( 1,2, , 1) 0, jj j j x x x x x x j n xx 三次样条函数差值: 由于 3( ) ( ,3) ps x S中含有 3 n 个待定系数,故应需要 3 n 个插值条件,已知插值节点 i x 和相应的函数值 ( ) ( 0,1,2, , ) ii f x y i n ,这里提供了 1 n 个条件,还需要 2 个边界条件。 常用的三次样条函数的边界条件有 3 中类型: (1) 3 0 3 ( ) , ( ) n s a y s b y 。由这中边界条件建立的样条插值函数称为 () fx的 完备三次样条插值函数。 特别的, 0'0 n yy 时,样条曲线在端点处呈水平状态。 如果 () fx 不知道,可以要求 3() sx 与 () fx 在端点处近似相等。这时以0 1 2 3 , , , x x x x 为节点作一个三次 Newton 插值多项式 () a Nx,以 1 2 3 , , , n n n n x x x x 作一个三次 Newton 插值多项式 () b Nx,要求 ( ) ( ), ( ) ( ) ab s a N a s b N b 由这种边界条件建立的三次样条称为 () fx的 Lagrange 三次样条插值函数。 (2) 3 0 3 3 ( ) , ( ) s a y s b y 。特别的 0 nn yy 时,称为自然边界条件。 (3) 3 3 3 3 ( 0) ( 0), ( 0) ( 0) s a s b s a s b ,(这里要求 33 ( 0) ( 0) s a s b )此条件称为周期条件。 利用 MATLAB 进行三次样条插值,得到插值曲线(图 3)。 1 x 10 420002500300035004000450050005500600065007000X/mY/m三次样条插值曲线与原始数据点 三次样条插值曲线 原始数据点 图 3.三次样条插值曲线与原始数据点 Hermite 插值与三次样条插值的对比【5】: SPLINE 提供的函数 s(x)的构建方法和 PCHIP 里面的函数 p(x)完全相同,只 O x y 0 AM 1M2M1nM n BM 图 4 不过在 X(j)处的斜率的选择方法不一样, SPLINE 函数的 s(x)在 X(j)的二阶导数 D^2s(x)也是连续的,这导致了如下结果: (1) SPLINE 更加光滑,即,D^2s(x)是连续的。 (2) 如果数据是一个光滑函数的值,则 SPLINE 更加精确。 (3) 如果数据不是光滑的,则 PCHIP 没有 overshoots,也不太震荡。 (4) PCHIP 建立的难度较小。 (5) 这两种函数估计的难度是一样的。 三次样条比 Hermite 插值光滑,样条的两阶导数连续,而 Hermite 插值一阶导数连续。不连续的两阶导数隐含着不连续的曲率。人的眼睛可以检测出图形上曲率的不连续。另一方面,Hermite 插值是保形状的,而样条插值不一定保形状。 通过对比 Hermite 插值与三次样条插值,针对本题并无明显差异。为了更好的保证图形形状,减小误差,本文采用 Hermite 插值。 求解水渠长度 圆的周长可以利用圆的内接正多边形的周长当边数无限增多时的极限确定。类似的方法,可以用来建立平面连续曲线的弧长,应用定积分来计算弧长。 设 AB 、 是曲线弧的两个端点。在弧 AB 上以此取分点: 0 1 2 1 1 , , , , , , , , i i n n A M M M M M M M B ,并以此连接相邻分点得一折线(图4)。 当分点的数目无限增加且每小段 1ii MM 都缩向一点时,如果此折线的长11niiiMM 的极限存在,则称此极限为曲线弧 AB 的弧长,并称此曲线弧 AB 是 可求长的。 由于光滑曲线弧是可求长的,故可应用定积分来计算弧长。 设曲线弧由参数方程: () , () xt t yt 给出,其中 ( ), ( ) tt 在 , 上具有连续导数,且 ( ) ( ) tt 、 不同时为零,现计算该曲线弧的长度。 取参数t为积分变量,它的变化区间为 , 。相应于 , 上任一小区间 , t t dt 的小弧段的长度 s 近似等于对应的弦的长度 22 ( ) ( ) xy ,因为 ( ) ( ) ( ) x t dt t dx t dt ( ) ( ) ( ) y t dt t dy t dt 所以, s 的近似值(弧微分)即弧长元素为 2 2 2 2 2 2 2 2 ( ) ( ) ( )( ) ( )( ) ( ) ( ) ds dx dy t dt t dt t t dt 于是所求弧长为 22 ( ) ( ) s t t dt 当曲线弧由直角坐标方程 ( ) ( ) y f x a x b 给出,其中 () fx在 , ab上具有一阶连续导数,这时曲线弧由参数方程 ()() xxa x by f x 从而所求的弧长为 21b a s y dx 利用插值后得到的水渠的曲线函数,对其进行积分,则为水渠长度。 14550 7650 21 dx yL 用 MATLAB 求解得到 m L 求解土石方量 已知,水渠长度,水渠截面积。 则: 2 m1822810S 3m135405LSV 问题二 设函数 () fx在区间 , ab上连续,并且设x为 , ab上的一点。观察 () fx在部 分区间 , ax上的定积分 ()xa f x dx 首先,由于 () fx在 , ax上依旧连续,因此该定积分存在。这里,x即表示定积分的上限,又表示积分变量。因为定积分与积分变量的记号无关,所以,为了明确起见,可以吧积分变量改用其他符号,例如用t表示,则上面的定积分可以写成 ()xa f t dt 如果上限x在区间 , ab上任意变动,则对于每一个取定的x值,定积分有一 个对应值,所以它在 , ab上定义了一个函数,记作 () x : ( ) ( ) ( ) x a x f t dt a x b () x 便为积分上限函数。 本文针对问题二建立积分上限函数模型: 216xaVS y dt 通过起点a作为积分下限,求得第一个积分上限,即第一个等分点,第一个等分点为积分下限,求得第二个积分上限,即第二个等分点,以此类推。改变积分上下限,确定5个等分点,将水渠六等分,且每段土石方量相同。 利用 MATLAB 求解(见附录 ),得到等分点坐标为: , , , , , 3540,13353 且每段的土石方量为: 3 问题三 由问题二知土石方量 V 与水渠曲线函数存在关系。首先建立 xFV 模型。设在沿水渠的公路上有三个变量为 k ji x ,x,x ,修建的临时公路需要保证运输工作量最小,因此,在 D 点左边开掘水渠的土石方均运到 B 处,在 D 右边开掘水渠的土石方都运往 C 处。最终将土石方由 B、C 两处运往 A 处(示意图见图4) y = f(x)(xk)(xj)D(xi)L2L1ACB 图4.水渠临时公路修建示意图 运输工作量等于土石方量乘以距离,因此对于水渠曲线上的运输工作量本文建立的模型为: 以 i 0 x ~x 段为例,设:该段水渠长度为n L L,L i 0 i0 ,该段土石方量为n SLn V V,V i 0i0 i0 , 则: )LnL(V)L2L(V)LL(VW i0i0i0i0 )n21(LVVLn i0 n2 1nLV 当 i 0 i 0 x x2xx2 i0 dx y1dxy1S 2 1 LV 2 1 W,n 同理可得 1 kjkij W,W,W 则: iji01kjk1 WWWWW 14550 14550 2 2 2 2 11 1 1 1 1 22 kk j j k k xx x x x x S y dx y dx S y dx y dx j i j i ii x x 2x x 2x 7650 2x 7650 2 dx y1dxy1S 2 1 dxy1dxy1S 2 1 对于由 B、C 两点运往 A 处的运输工作量本文建立的模型为: 2 0k 2 0k 14550 x 22 0i 2 0ix76502 2 y yxxdxy1Syyxxdxy1SWjj 要使运输工作量最小,即 1 W 、 2 W 之和达到最小,因此,本文建立无约束规划模型: kji2kji1 x,x,xWx,x,xWMin 即: 2 0i 2 0i x 7650 2 2x x 2 2x 7650 2 y yxxdxy1dxy1 2 1 dxy1 2 1 Min j j i i 2 0k 2 0k 14550 x 2 214550 x 2 2 x x 2 y yxxdxy1dxy1 2 1 dxy1 2 1 jk k j运用 MATLAB 求解得:(程序代码见附录 ) 最小运输工作量为: 4 m B、C 两点的坐标为: 和 , 。 六、模型的优缺点 优点: 1、 通过对比 Hermite 插值与三次样条插值,发现求得的水渠长度分别为 和 ,对本题无明显差异。 2、 对于运输量的规划问题,准确的反应了最优解。 缺点: 1、 对于插值函数的曲线积分,近似了曲线的导数,存在一定误差。 2、 规划问题的运算量较大。利用 MATLAB 算法优势不明显。
nearest:执行速度最快,输出结果为直角转折; linear:默认值,在样本点上斜率变化很大; spline:最花时间,但输出结果也最平滑; cubic:最占内存,输出结果与spline差不多。
数学领域中的一些著名悖论及其产生背景
大部分油气藏的数据是散乱分布的,因此称为散乱数据。散乱数据指的是在二维平面上或三维空间中,无规则的、随机分布的数据。利用散乱数据建模就要对散乱数据进行插值或拟合。
设在二维平面上有n个点 (xi,yi) (i =1,…,n),并有Zi =f(xi,yi)。插值问题就是要构造一个连续的函数F (x,y),使其在 (xk,yk) (后=1,…,n) 点的函数值为Zk,即Zk =f(xk,yk) (k=1 ,…,n)。
早在20世纪60年代,散乱数据的插值问题就已引起人们的注意。近50年来,已经有多种算法被提了出来。但是,由于应用问题千差万别,数据量大小不同,对连续性的要求也不同等等,没有一种算法适用于所有的场合。而且大多数算法只能适用于具有中、小规模数据量的散乱点插值问题。大规模散乱数据 (例如,10000个点以上) 的插值问题还正在研究之中。
据散乱数据的复杂程度,其可分为单自变量、双自变量及多自变量3种类型。下面将主要讨论双自变量散乱数据的插值问题。
(一) 插值的一般概念
插值的概念最早可追溯到 “控制论之父” 诺伯特·维纳的不朽著作 《平稳时间序列的外推、插值和光滑及其工程应用》 (Wiener,1949)。随着计算机技术的发展,插值的概念已广泛地应用于数据处理、自动控制、数值分析、地球物理及数学地质等领域。
1. 插值方法
计算机插值方法一般可分为两大类:拟合函数方法和加权平均方法。它们的原理都是来自手工方法。Crain (1970) 把这两种方法得到的曲面分别称为数学曲面和数值曲面。Alfeld & Barnhill (1984) 分别称它们为分片方法和点方法,而Cuyt (1987) 则把这两种方法分别称为系数问题和数值问题。
利用拟合函数方法进行插值,就是利用二元多项式来表示一个插值曲面,插值问题化为确定这个二元多项式的系数的问题。一般来说,往往可通过求解一个线性代数方程组来获取这些系数。这个方程组的系数可由观测数据来确定,它们代表了观测数据的影响,而其方程的次数则表示了控制多项式拟合程度。方程次数越高,拟合的程度就越高。当这个多项式的系数确定以后,将空间某一点处的坐标代入该多项式,即可求得该点处的值。
这个方法的特点是可以制服畸变的原始数据或带有噪声的原始数据。所以,用一个函数进行拟合是一个光滑的过程,一些局部的细节可能消失。所得的插值曲面的复杂程度取决于多项式的次数,即所求解的线性方程的数目。
加权平均插值方法把求插值的问题化为求取观测数据的加权平均。每个观测数据点对应的加权系数恰恰反映了该数据点对插值点的影响大小。为了求取一个插值,必须要计算出一组加权系数。
加权平均方法的一个主要优点是,可以获取在观测数据点附近变量的小尺度趋势。而利用一个适当次数的多项式是无法获取曲面的这种局部细节的。
从原则上讲,这两种方法的差别就在于:加权平均方法强调了曲面的局部细节,而拟合函数方法则概括了曲面的整体性质。从计算时间上看,前者花费的时间比后者要多得多。
2. 插值效果评判
从理论上讲,一个插值方法的效果如何应通过插值结果和客观存在的原始曲面的比较,按以下3条标准来进行判断:
(1) 原始曲面和插值结果之间差异的最大值为最小。
(2) 原始曲面和插值结果之差的平方和为最小。
(3) 在每个观测数据点处,插值结果本身的数值及其1阶到k阶导数和原始曲面的相等。
由于原始曲面本身是未知的,所以在以上3个标准中,第一个和第二个标准是无法检验的,仅有第三个标准是在一定的模型假设之下可以进行检验。在一些实际应用中,当原始曲面可用解析函数来表达时,仅利用第三个标准来检验插值的效果也是可行的。然而,在地质建模中,观测数据点往往不够多,且还有一定的观测误差,不可能断定原始曲面是否可用解析函数表达。这时,插值技术的合理性必须从直观的几何和人们的经验等方面进行评价。
利用计算机进行插值所遇到的困难,主要来自观测数据点数目不足和观测误差。如果观测数据充分多且精确,那么几乎所有的插值方法都会给出良好的效果。另一方面,对于圆形或狭长的隆起,凹陷和鞍点等变量的空间变化几何特征,在数据点分布较稀的情况下,用任何插值方法都是难以推断出它们的存在的。所以,插值方法需要考虑曲面的局部斜率的影响。
下面主要介绍加权平均方法和拟合函数方法中最常用的插值算法。这些算法能解决大部分油气藏建模问题。
(二) 与距离成反比的加权法
距离成反比加权插值方法是基于如下的模型:每个数据点都有局部影响,这个影响随着数据点和插值点距离的增加而减弱,且在一定的范围以外,可以忽略不计;这个影响是以该数据点为中心;而在任一点处的插值恰是各数据点影响之和。
1. 与距离成反比加权插值公式
这一方法首先是由气象学及地质学工作者提出来的,后来由于D. Shepard的工作被称为Shepard方法。其基本思想是将插值函数F (x,y)定义为各数据点函数值f i的加权平均,即:
油气田开发地质学
在 (xk,yk) 点处函数值可写成:
油气田开发地质学
式中: 表示由第i个(xi,yi)点到插值点(xk,yk)的距离;Wi(xk,yk)——权函数;μ——功率因素,通过改变值来调整权函数与距离的关系,与距离成反比加权和与距离成平方反比加权分别是μ=1和μ=2时的特殊情形。
与距离成反比加权插值方法是最早使用的计算机插值方法,至今仍被广泛地应用着。在大多数商业性的等值线图绘制软件包中被用来形成网格化数据。这种方法较为直观:一个数据点对于插值点的影响模型化为与这两点之间的距离成反比。
2. 与距离成反比加权插值改进
距离成反比加权算法中的功率因素μ应该取为μ≥0,否则表明距离越远的点作用越突出,这违背了普通常识。考虑以下最极端的情况是:
油气田开发地质学
假设有n个数据点,一个插值点 (xk,yk) 位于第i个数据点附近,相应的权函数可写成:
油气田开发地质学
式中:dj (xk,yk),di (xk,yk)——插值点 (xk,yk)到各数据点的距离。
当插值点 (xk,yk) 和第i个数据点很靠近时,可以认为其他数据点对WD的影响是一个常数,即C为常数。当该插值点和第i个数据点的距离趋于零时,对于不同的μ,WD会有不同的性质。首先看WD对D的导数,有:
油气田开发地质学
然后再有:
油气田开发地质学
可见,当μ=1时,随着D趋于0,W′D近似为不随D变化的常数,这可用图6-8中左端的图形来表示。
当μ>1时,随着D趋于零,W′D趋于零。这说明在该数据点附近,加权系数的变化为零,即可用图6-8中间的图形来表示。
当μ<1时,随着D趋于零,W′D趋于无穷大。这说明加权系数在该数据点附近还有一个尖点,如图6-8右端的图形所示。
图6-8 与距离反比加权的权数随参数μ的变化
(1)功率因素μ越小时,近距离点和远距离点的作用越接近,生成的平面网格数据越平滑。随着μ增大,平面网格数据的光滑性越差。同时,μ直接影响网格数据的极值和均值,μ越小网格数据的均值越接近原始数据的均值,但极值相差越大。因此,当要求插值结果尽可能接近原始数据的均值时,功率因素不能选择过大。例如对于开发早期的油气藏,因为仅有少数探井控制,此时网格化得到的各类物性参数应该在总体上符合井点的统计结果,均值是比极值更有价值的参数,因而通常将功率因素取为1。相反,μ取值越大,网格数据越能恢复原始数据的极值,但也容易使均值误差增大。原因是当μ取较大的值时,近距离点的作用越突出,原始数据点分布的不均匀性使得部分点在网格节点上发挥了更大的作用,而另外一些点的作用则受到屏蔽。因此,当要求突出数据的局部特征,体现储层的非均质性特征时,功率因素应选择得大些,一般取为2。
(2) 利用与距离成反比加权法进行插值时,当增加、删除或改变一个点时,权函数Wi (xk,yk) 均需重新计算,因而该方法是一个全局插值算法。
为了克服Shepard方法的上述缺陷,Franke及Nielson提出了MQS (Modified QuadraticShepard) 方法,它仍然是一个与距离成反比的加权方法。对它的改进如下:
插值点 (xk,yk) 到已知数据点的距离di作适当修改,使其只能在局部范围内起作用,以改变Shepard方法的全局插值性质。这时重新定义距离函数:
油气田开发地质学
式中:rw为一个常数。而
油气田开发地质学
因此,当 (xk,yk) 点与某一点的距离大于rw时,权值就为零。
(3) 与距离成反比加权法的权函数Wi(xk,yk)始终满足Wi(xk,yk)≤1/n,因此插值结果不会大于或小于原始数据的最大值、最小值。当已知数据点过少时 (这种情况在早期地质研究中是最为常见),使用具有外推能力的曲面样条或趋势面分析,得到的结果往往背离实际。其原因是这两种方法在远点不具有控制能力,它将沿趋势无限发展下去。特别是在仅有少数井资料可用的情况下,与距离成反比加权法应是优先选择的方法。
但是,隐含在原始数据中的尖峰会被淹没而无法显示出来。因为距离成反比加权进行插值时,每个数据点所发挥的作用基本上是中心对称的,因此对山脊和山谷等非各向同性的几何形状的显示不利。为了克服这种状况,需要考虑变量的局部变化趋势,为此需要对梯度进行估计。
当已知数据点用与距离成反比加权方法形成数据插值曲面时,该曲面被称数据曲面。与距离成反比加权方法也可用于各个数据点处的切平面,把任一点处的插值值取成各切平面在该点处取值的一个加权平均,所形成的曲面称为与距离成反比加权梯度插值曲面,简称梯度曲面。如果在数据点以外的一个点是变量的局部高点,那么梯度曲面在该点的值容易大于变量的真实值,即呈现 “过估计” 的状态。如果数据曲面在该点的值小于变量的真实值,则呈现 “欠估计” 的状态。因此,数据曲面可以通过和梯度曲面的相互结合来克服本身的缺陷。
可以用数据曲面和梯度曲面之差乘以一个系数作为一个修正量,对数据曲面进行修正,这样,可以用下述的曲面来代替单纯的数据曲面:
油气田开发地质学
式中:L (x,y) ——距离反比加权插值;Wi——和第i个数据点的距离反比加权系数;τi——曲面在该点处的粗糙度指数;Si(x,y)——第i个数据点 (xi,yi) 处的切平面在点(x,y) 处的值;H(Wi,τi)——混合函数。
如此得到的曲面称为混合曲面。它通过所有的数据点,具有连续的坡度,其变化在空间的分布更均匀。数据曲面和梯度曲面是混合曲面的两种极端情况。由于数据曲面和梯度曲面之差在各数据点处为零,还因为混合函数的变化范围为0~1,且当混合函数等于0或1时,其一阶导数为零,故混合曲面和梯度曲面相切于各数据点处,且其高阶导数在各数据点处亦为零。
(4) 与距离成反比加权法仅考虑了插值点与数据点之间距离的影响,没有考虑到各数据点之间的关系,物性参数分布的趋势性没有得到充分的体现。为此,Franke及Nielson进行了改进。
用节点函数Qi (x,y) 代替fi,Qi (x,y) 是一个插值于 (xi,yi) 点的二次多项式,即有Qi (xi,yi) =f,i=1,…,n。Qi可由下式表示:
Qi(x,y)=fi+a1(x-xi)+a2(y-yi)+a3(x-xi)2+a4(x-xi)(y-yi)+a5(y-yi)2
式中:a1,a2,…,a5是按下式最小二乘法得出的优化解:
油气田开发地质学
式中:fi,fj分别为 (xi,yi)和 (xj,yj)点的函数值,而ρj可按下式选取:
油气田开发地质学
其中rq为一常数,而
油气田开发地质学
求出Qi (x,y) 后,插值函数可表示为:
油气田开发地质学
上述方法消除了Shepard方法中的一些缺陷,因而在散乱点插值中得到广泛的应用。但是,为了求得Qi (x,y) (i=1,…,n),需要多次求解线性方程组,计算量大,因此,一般只用于中、小规模散乱点的插值运算。
(三) 多项式趋势面法
由计算机产生的曲面一般不会总是和原始的观测数据一致。如果两者的差别在给定的尺度之下不是很明显,那么产生的曲面可被认为是插值曲面,否则就被认为是近似曲面。如果观测数据含有明显的观测误差,近似曲面就显得更合理。这时,和插值曲面相比,近似曲面由于数据的各种误差所产生的扰动不太容易看得清,但是近似曲面空间变化的一些主要性质还是能清晰地被体现出来的。
近似曲面和每个数据点之间的差称为残差,可视为每一个数据点上的一种误差表示。然而,计算出来的这种残差是意味着对未知的观测误差的一种度量,还是意味着一种允许的插值误差,或者意味两者都是,这要依变量的空间性质和观测数据的获取方法而定。
确定近似曲面的方法可分为3种。第一种方法是以残余的平方和最小为条件,确定多项式的系数,以获取曲面。第二种方法是利用观测数据误差的附加信息,并满足最小曲率的原则以确定曲面。最后一种方法是利用观测误差和插值误差的附加信息,以满足最小平方差或最小曲率为条件确定曲面。以下主要讨论多项式构造趋势面法。
多项式构造趋势面是目前最常用的方法,一次多项式表示的趋势面是空间的一个平面,二次趋势面是抛物面,椭球面或双曲面,三次及三次以上的趋势面是形态复杂的空间曲面,随着趋势面的次数增高,曲面的形态就越复杂。
如果有一组总共n个观测数据,其观测点的平面坐标为 (xi,yi),地质变量的观测值为fi(xi,yi)。对于这组观测数据的多项式趋势面方程表示成如下形式:
油气田开发地质学
式中: ——第i个观测点的趋势值;a1,a2,…,a5——待定系数,它们的个数m与所选用趋势面方程的多项式次数n存在下列关系式:
m=[n(n+3)+2]/2
为使趋势面最大限度地逼近原始观测数据,可采用最小二乘法使每个观测点的观测值与趋势值之差 (残差) 的平方和最小,即:
油气田开发地质学
得到需求解的m阶正规方程组。当系数矩阵满秩时,趋势面方程也就被唯一确定了。
由于趋势面分析不具有过点性,使得局部井点上误差可能很大。同时参数场在三维空间中的分布过于复杂,无论从理论上还是实验中都无法确证某类参数场能较好地符合某确定次数的曲面,多项式次数过高,会导致趋势面发生频繁振动,多项式次数过低,得到的趋势面又过于光滑,丧失许多细节。再者,趋势面方程在外推过程中容易使参数场发生畸变,产生无意义的结果。因而现代地质建模研究中已经很少将趋势面分析单独作为插值方法使用。但对于下列两种情况趋势面分析仍然能达到较为理想的效果,一是对小范围内具有显著趋势性分布的数据点;二是数据点分布过于密集,而且可能存在若干异常数据点时,趋势面分析会自动削弱异常数据点的影响。为提高趋势面分析的精度,可采用残差来校正趋势面分析的结果。具体过程如下:
(1) 由趋势面分析得到任一网格节点 (xk,yk)处的趋势值
油气田开发地质学
(2)计算n个已知点 (xi,yi)处的残差△fi(xi,yi)=fi(xi,yi)
油气田开发地质学
(3) 调用某种插值方法将残差分配到每个网格节点上,对网格节点 (xk,yk) 有△fk(xk,yk);
(4) 网格节点 (xk,yk)经校正后的最终结果为
油气田开发地质学
特别地,如果残差分配的插值算法也是趋势面分析,就形成所谓的多级趋势面分析。此时,网格节点上的值是多次趋势面分析的结果,多级趋势面分析在不断减少观测点插值误差的同时,整张参数场曲面仍然保持其连续性和光滑性,原因是该算法同样符合线性迭加原理。
(四) 径向基函数插值法
径向基函数的名字来源于这样一种情况,即基函数是由单个变量的函数构成的。一个点 (x,y) 的这种基函数的形式往往是hk(x,y)=h(dk),这里的dk表示由点 (x,y) 至第k个数据点的距离。一般说来,这种方法不具有多项式精度,但只要稍加改进,即可获得具有多项式精度的插值公式:
油气田开发地质学
式中:qk(x,y)是一个多项式基,其阶次小于m。
上式中的系数ak和bk应满足下面的联立方程组:
油气田开发地质学
油气田开发地质学
第一式中的n个方程式满足了插值要求,而第二式中的m个方程式则保证了多项式精度。两式中共有m+n个未知数,同时存在m+n个方程式,联立求解,即可得出待定系数。
下面,介绍两种主要的径向基函数插值法。
1. Multiquadric方法
Multiquadric方法是由R. L. Hardy在1971年提出来的。它是最早被提出并且应用得最为成功的一种径向基函数插值法。它采用的插值函数,即 (x,y)处的值F (x,y):
油气田开发地质学
式中: 为基函数;ei——非负常数;ai——加权系数,满足如下方程组:
MVa=Vz
式中:Va=(a1,a2,…,an)T,Vz=[f(x1,y1),f(x2,y2),…,f(xn,yn)]T,f(xi,yi)是(xi,yi)处的数据点的值。
油气田开发地质学
由于M和Vz都不依赖于插值点的坐标 (x,y),所以ai也不依赖于 (x,y)。然而,基函数C(X-Xi)则是以Xi为参数的 (x,y)的函数。所以说,插值曲面F(x,y)是n个基函数C(X-Xi)所构成的n个空间曲面配置而成的。
Arther提出了如下形式的基函数:C(d)=1-d2/e2,其中d是数据点到插值点之间距离,而e则是一个常数。显然,基函数C(d)是d的一个衰减函数。当d=0时,C(d)取得最大值1,而当d≤e时,有0≤C(d)≤1。这时,基函数呈现为椭圆抛物面,而加权系数ai(i=1,2,…,n)所满足的线性代数方程组的矩阵M应作相应的改动,其对角线元素应改成1。Hardy(1971)引入如下的基函数:C(d)=(d2+e2)1/2,该基函数呈现为椭圆双曲面。Hardy还建议将e2取成乘以数据点间距离的平均值。
2. 薄板样条法
样条 (Spline)本来是绘图员用来绘制光滑曲线的工具,是一种用木材或金属等弹性材料做成的细条。在绘图时,沿着通过图纸各已知点的样条,便可绘出一条光滑曲线。数学上所说的样条 (多项式样条) 实质上是分段多项式曲线的光滑连接。当函数为分段的m次多项式,在分段点上有直至m-1阶连续导数,那么该函数则称为m次样条函数,简称为样条。一般来说,研究和应用得比较多的是三次样条。零次和一次样条函数分别是台阶状函数和折线状函数。以上所述的是关于一维样条函数,对于二维样条函数也可作为类似的考虑。
样条函数的主要功能是进行插值,其主要优点在于,能在插值多项式的次数尽可能低的条件下,使插值曲线或插值曲面取得较高的光滑度,且只需要利用函数本身的值,而不需要提供函数的各阶导数的值。
三次样条曲面包含有三种不同的类型:双三次样条、伪三次样条及薄片样条。这些样条曲面以m和s为其两个参数,使得希氏空间Hs中元素的m阶导数的范数所构成的一个泛函达到最小。此外,这个泛函具有旋转不变性。
对于薄片样条曲面,m=2,s=0。这一方法是由. Harder及R. N. Desmarais在1972年提出来的,后来由J. Duchon及J. Meinguet等人予以发展。薄板样条法得名于如下事实,即用此方法求出的散乱点的插值函数使下面这一泛函表达式具有最小值:
油气田开发地质学
在这里,I(F)表示受限于插值点的无限弹性薄板的弯曲能量。因此,这一方法的实质从力学观点看是使插值函数所代表的弹性薄板受限于插值点,并且具有最小的弯曲能量。这是一个泛函求极值的问题。这一变分问题的解即为我们所需要的插值函数,具有径向基函数插值法的一般形式。
. Harder及R. N. Desmarais提出解析形式如下:
油气田开发地质学
且有 其中t(x,y)和ti(xi,yi)是二维空间中的点,而fi是ti处的观测值。还有,K(ti,t) 这里,ri代表点t和ti之间的距离,
由解析表达式及其约束条件,可给出用以确定系数的线性代数方程组:
油气田开发地质学
其中,K=[kij]n×n,kij=K(ti,tj),kii=0,FT[f1,f2,…,fn],αT=[b,a1,a2],AT[λ1,λ2,…,λn],且有:
油气田开发地质学
求解上述n+3阶方程组则得到待定系数b,a1,a2,λi,然后可插值出平面任一位置的函数值F(x,y)。
上述方程与Enriguez等人给出的方程相类似,其微小的差异就是基函数中的自然对数(In) 变成了常用对数 (lg)。
在构造薄片样条曲面的过程中,Franke (1982)提出了以r2lgr作为基函数,Sandwell(1987)则提出了以双调和格林函数r2(lgr-1)作为基函数。另外,Ayeni (1979)也对不同的基函数进行了讨论。
使用平面上n个已知点进行曲面样条插值时,实质上是求解一个n+3阶线性方程组以确定n+3个系数。为了保证解的存在性和唯一性,系数矩阵应该是满秩的。对下列3种情况必须避免:
(1) 在给定的n个已知点中存在着距离过近的两点 (xi,yi) 与 (xj,yj) 极端的情形是同一个数据点的重复输入,此时系数矩阵的第i行与第j行对应各元素非常接近,导致线性方程组的系数矩阵是奇异的。因此在数据预处理过程中必须消除沉余数据。
(2) 给定的已知数据点过少,此时系数矩阵的后3行线性相关,矩阵是不满秩的。
(3) n个已知点数据分布在一条直线上,显然由这样的n个点不能唯一决定一张曲面,系数矩阵表现为不满秩。
针对情况 (1),通常在做曲面样条插值时,首先对数据进行预处理,通过给定一个适当的距离下限rmin来滤掉那些相距过近的点,研究发现rmin=(△x+△y)/8是一个较合理选择 (△x和△y分别表示x和y方向的步长)。情况 (2) 和 (3) 实际上意味着不能进行曲面样条插值,除非通过数据均整来改变数据分布状态。
曲面样条插值方法是一种严格的过点插值法,即由生成的样条曲面必定通过给定的n个已知数据点,这样井点数据的控制作用自然得到体现。同时,曲面样条方法充分考虑了数据间的相对位置,其插值精度很高,在外推过程中,总是沿数据点的分布趋势外推,因此曲面样条法是具有一定外推能力的插值方法。同时曲面样条方程得到的是一张连续光滑的曲面。
曲面样条插值方法特别适合于地层层面的生成和地层厚度的插值。如果从曲面样条法严格的过点性、良好的光滑性及外推性看,适用于那些光滑、趋势性明显、变化连续的储层物性参数诸如油气饱和度的插值。
曲面样条法插值的精度很大程度上取决于数据点分布的均匀程度,稀疏区域主要由邻近区域的外推得到,其插值结果可能偏差较大。同时,曲面样条法的严格过点性使得它不能分别对待不同精度点的数据,因此它不具备数据的校正能力。
举个例子,已知x=1时y=3,x=3时y=9,那么x=2时用线性插值得到y就是3和9的算术平均数6。写成公式就是:Y=Y1+(Y2-Y1)×(X-X1)/(X2-X1)。
线性插值法:
线性插值是数学、计算机图形学等领域广泛使用的一种简单插值方法。
内插法又称插值法。根据未知函数f(x)在某区间内若干点的函数值,作出在该若干点的函数值与f(x)值相等的特定函数来近似原函数f(x),进而可用此特定函数算出该区间内其他各点的原函数f(x)的近似值,这种方法,称为内插法。按特定函数的性质分,有线性内插、非线性内插等;按引数(自变量)个数分,有单内插、双内插和三内插等。
线性插值法的应用:
线性插值经常用于补充表格中的间隔部分。假设一个表格列出了一个国家 1970年、1980年、1990年以及 2000年的人口,那么如果需要估计 1994年的人口的话,线性插值就是一种简便的方法。
两值之间的线性插值基本运算在计算机图形学中的应用非常普遍,以至于在计算机图形学领域的行话中人们将它称为 lerp。所有当今计算机图形处理器的硬件中都集成了线性插值运算,并且经常用来组成更为复杂的运算:例如,可以通过三步线性插值完成一次双线性插值运算。由于这种运算成本较低,所以对于没有足够数量条目的光滑函数来说,它是实现精确快速查找表的一种非常好的方法。
论文查重对比截止日期就是某个人的论文必须得在这个截止日期之前进行查重。
知网查重比对截止日期填法:
1、一般的格式是:某某某,某年某月生,某某公司某某部门某某岗位(如果是学校,就写某某学校某某教研室或系或学院),某某学位,主要研究方向:某某某。收稿日期由编辑部的人来确定,如果稿件被录用了,收稿日期就是正式被录用的那天。
2、已发表的论文且该论文已被知网收录,后续查重时姓名一栏填写真实的作者名字,这样知网查重时可以将填入姓名栏的作者已发表论文去除掉,得到“去除本人已发表文献这个复制比”。
论文查重操作方法:
1、论文稿件在完成之后需要先选择合适的查重系统,现在市场中知名度较高的就是Paperfree查重系统,在核算方式上很准确,出现连续13个字一样的,都会直接计算为重复率较高,所以,在写作的时候需要了解哪款论文查重系统更合适。
2、进入到查重系统之后需要将文件上传,先了解论文检测需包括什么,在上传需要检测的部分,基本上在上传之后就可以付费检测。专业查重系统的检测速度很快,在半个小时或者一个小时的时候都可以看到检测结果,针对查重率较高的情况也可以及时来进行修改,保证论文在查重范围之内。
可以补办。格子达论文选题时间截止了可以补办。格子达毕业论文题目申报时间过了,是可以和导师说一下,可以补报的。毕业论文在答辩之前题目都可以修改的,补报题目不会影响学生毕业。
1、首先论文在填写截止日期之前需要进行对比查重,也就是看论文的原创性。2、其次在论文查重完成后还要交予导师进行审阅。3、最后在论文对比查重、导师审阅完成后书写当天为截止日期即可。