非线性回归
非线性回归是回归函数关于未知回归系数具有非线性结构的回归。常用的处理方法有回归函数的线性迭代法、分段回归法、迭代最小二乘法等。非线性回归分析的主要内容与线性回归分析相似。
回归分析法所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。通常线性回归分析法是最基本的分析方法,遇到非线性回归问题可以借助数学手段化为线性回归问题处理。
简介如果回归模型的因变量是自变量的一次以上函数形式,回归规律在图形上表现为形态各异的各种曲线,称为非线性回归。
处理方法可线性化问题
处理可线性化处理的非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系数是未知的,要根据输入输出的n次观察结果来确定系数的值。按最小二乘法原理来求出系数值,所得到的模型为非线性回归模型(nonlinear regression model)。
例题例1:1790-1960某国人口变化数据:注意:即便线性方程对对观测数据拟合相当好,但有关误差项的独立性和方差假设有可能被破坏。原因是时间序列的数据误差项往往不独立,误差项大小有可能根据数据总体的大小而变化,意思就是,即便适合这个样本的观测量的方程,但是,不适合总体。根据经验,人口增长模型不能被转化为线性模型,所以,可以利用曲线回归或者非线性回归。进一步比较究竟是曲线回归好还是非线性回归好,需要建立新的残差变量,这一步并不难,就是在spss中,相应分析的保存子对话框中建立新的对应模型的变量。其实,有一个万能公式:spss中,所有的“保存”对话框的功能都是,在二维表窗口也就是spss的盛放数据窗口中建立新变量,这个新变量有默认名,是相应分析的重要结果。保存新变量以后,需要根据残差的序列图进行判断:最平稳的就是最合适的。
例2:血中药物浓度和时间曲线呈非线性关系。
这个是根据专业背景知识而判断。药物不可能马上见效,也许在血液中逐步或者突然见效。
例3:身高和体重,在青少年中,是呈直线关系,因为,青少年在不断成长,但是,对于整个人的生命周期,却是曲线关系,因为成年人的身高一般是确定的。
像这样的例子根本用直线回归拟合不了,也称为非本质线性模型。对于这种实际情况,可以使用非线性回归的分段模型。最终目的是使残差平方和最小。也就是在图形中跟大多数散点接近。
利用SPSS注意事项
1、初始值确定:
①利用简单假设确定,例如,如果在所有变量中最大的一个个案值为178万,就需要选择200为初始值,再根据方程估计参数值。
②利用图形或者图形辅助,数据转换
如果参数没有初始值,也不能简单的设置为0,要将它们设置为预计要改变的值大小。总之,就是想办法找到一个比较合适的值,多设几个,然后比较。也可以根据专业背景和重点,来设置。这个还可以根据数学计算,例如,方程二边同时取对数。需要具体问题具体分析。
2、迭代和收敛:迭代是计算机自动计算的,例如将迭代设置为1000,意思就是计算机算了1000次,每一次都是根据上一次的结果的基础进行再运算。当然,人工笔算需要算1000年。迭代不会永无止境地计算下去,而是收敛标准或者称作最大迭代的设置后,不论得没有得到结果,是否达到目标,都会停止。在结果输出表格中有迭代的历史记录。这个表格就是过程表,每一步怎样算的,都可以找到。因为迭代是计算机自动计算,例如,烧水,如果开了不断电,水烧干了就会起火,所以,机器需要人控制,它本身没有情感。
3、spss操作:不论“计算变量”对话框或者“非线性回归”,和非线性回归的“损失函数”对话框都是很像的,有一个计算器算盘,函数组,函数和特殊变量。各种元素组合在一起,构成一个表达式,这个表达式构成一个新变量。只要用鼠标将对应的元素加入到表达式中,然后检查,或者事先在本上写有表达式,对应好,基本就没有问题。其实,spss许多操作根据文字可以猜出个大概。
4、损失函数:“非线性回归”对话框是对整个因变量的运算法则,但是,损失函数是对某一个统计量的运算法则,SPSS Clementine默认是使用最小残差平方和找出非线性模型,也可以自己设置。在相应对话框中都有设置。可以这样以为:损失函数就是估计误差的函数,它是一个负面指标,越小越好。
5、参数约束:多数非线性模型中,参数必须限制在有意义的区间内。指的是在迭代过程中对参数的限制。分为线性约束和非线性约束。线性约束中将参数乘以常数 但这个常数不能为其他参数或者自身。非线性约束中至少有一个参数和其他参数相乘或者相除或者进行幂运算。
概述有一类模型,其回归参数不是线性的,也不能通过转换的方法将其变为线性的参数。这类模型称为非线性回归模型。在许多实际问题中,回归函数往往是较复杂的非线性函数。非线性函数的求解一般可分为将非线性变换成线性和不能变换成线性两大类。这里主要讨论可以变换为线性方程的非线性问题。
应用对实际科学研究中常遇到不可线性处理的非线性回归问题,提出了一种新的解决方法。该方法是基于回归问题的最小二乘法,在求误差平方和最小的极值问题上,应用了最优化中对无约束极值问题的一种数学解法——单纯形法。应用结果证明,这种非线性回归的方法算法比较简单,收敛效果和收敛速度都比较理想。
参考资料 >
推荐阅读
-
格科微电子(上海)有限公司
格科微电子(上海)有限公司格科微电子(上海)有限公司(简称“格科微”,股票代码:688728)成立于2003年12月26日,在自...
-
钟嘉琪
钟嘉琪钟嘉琪,1999年9月23日出生于广东省广州市从化区,中国曲棍球运动员,司职前锋,现效力于中国女子曲棍球队。2014年,钟...
-
第30届中国电影金鸡奖
第30届中国电影金鸡奖第30届中国电影金鸡奖(第24届中国金鸡百花电影节闭幕式)是由中国文学艺术界联合会、中国电影家协会、吉林市...
-
调味酒
调味酒调味酒是指采用特殊工艺生产的、有特定的香味物质含量和独特的风味、能弥补基础酒中存在的缺陷的功能性白酒。常具有特香、特甜、特...
-
格列高利十一世
格列高利十一世教宗格列高利十一世(拉丁语:GregoriusPP.XI;1336年—1378年)原名博福尔的伯多禄·罗热尔(...
-
四大名镇
四大名镇四大名镇指的是朱仙镇(版画、年画)、湖北汉口镇(商业中心)、广东佛山镇(手工业)、江西景德镇(瓷器)并称全国四大名镇,明...
-
关键词
关键词《关键词》是由林怡凤填词,吴庆隆编曲,林俊杰作曲并演唱的一首流行歌曲。收录在2015年12月25日发行的实验专辑《和自己对...
-
中天门
中天门中天门,位于泰山内,是登泰山东西两路的交汇要地,恰好位于登顶半程的位置,无论是上山还是下山,这里都是必经之路。中溪山北侧为...
-
中国特色社会主义理论体系
中国特色社会主义理论体系中国共产党第十七次全国代表大会提出了中国特色社会主义理论体系的科学命题,明确指出:“中国特色社会主义理论...
-
托和络·穆荫
托和络·穆荫托和络·穆荫(?-1864年),字清轩,隶正白旗,晚清大臣,咸丰顾命八大臣之一。由官学生考授内阁中书,充军机章京,迁...

