2008年12月 北京联合大学学报(自然科学版) Dec.2o08 第22卷第4期总74期 Journal of Beijing Union University(Natural Sciences) Vo1.22 No.4 Sum No.74 利用 C auchy—Schwarz不 等式估计回归系数 常广平,李林杉,刘大莲 (北京联合大学基础部,北京 100101) [摘 要] 根据随机变量情形下的Cauchy—Sehwarz不等式,推广得到关于二阶矩的推论:随机变 量X、Y的方差均存在且不为零,如果随机变量X、Y依概率1具有线性关系P{Y=aX+b}=1, 则Ⅱ=旦 若 ,6:El,一。EX,同时给出线性回归问题中回归系数的一种矩估计法。 [关键词] Cauchy.Schwarz不等式;协方差不等式;回归系数 [中图分类号] O 212.1 [文献标识码] A [文章编号] 1005—0310(2008)04—0077—03 Use Cauchy—Schwarz Inequality Estimated Regression Coefifcient CHANG Guang—ping,LI Lin・shah,Liu Da・lian (Basic courses Department of Beijing Union Universiyt,Beijing 100101,China) Abstract:From the Cauchy.Sehwarz inequ ̄ity in form of random variable,two results of Second’order moment are 0btained:variances 0f rand0m vadable X、Y exists and not 0,if the probability of X、Y has linear relationship P{Y= +6} s1, 。= ,6- nEX. he—a met ti…g re ion coefficient iS also obtained. Key words:Cauchy—Sehwarz inequality,covariance inequality,regression coefficient Cauchy.Sehwarz不等式的离散形式为 (EXY) ≤EX Ey2 n n n 一∑aib。) 定成立。且等号成立的充要条件为存在常数a, ≤(∑。:)(∑6 ),连续形式为 i=1 i=1 使得P{Y=aX}.1。 6 I ( )g )dx I ≤ j’ 厂 ( )d 』 g2( )d ,在概 证明设g(t)=E(Y+tX) =E(X )t + 2E(XY)t+E(y2) 率论中的Cauchy—Sehwarz不等式形式为(EXY) ≤ Ey2。即 对一切t都有g(t)≥0,又因为EX >0,所以 (t)无实根或只有一个实根,所以它的判别式A≤ y)dxdy] ≤ 0,由二次函数性质知判别式 l ,( )dxl y2f(y)dy △:4(EXY) 一4E(X )E( )≤0 即 可用判别式法证明这个不等式。 ( y) ≤EX Ey2 定理设随机变量 、y的二阶矩均存在且不 等号成立的充要条件是存在t。,使g(t。)=0,即 为零,则不等式 E(y+t。X) =0 [收稿Et期]2008—08—10 [作者简介]常广平(1974~),女,山西榆次人,理学硕士,北京联合大学基础部副教授,从事高等数学与数学教育研 究。 78 北京联合大学学报(自然科学版) 2008年12月 又由 E(y+t。 ) =D(1,+t0 X)+[E(y+to X)] 从而有 D(y+t0 X)=0,E(y+to X)=0 由方差性质知 P(Y+t0 X=0)=1 令。=一t。,则有等号成立的充要条件是 P{Y=aX}=1 在EX 或EY 等于零时,Cauchy—Schwarz不等 式也成立,不过此时两端都为零。 应用Cauchy—Schwarz不等式可推出协方差不等 式。 (1)若随机变量 、y的方差均存在,则不等式 I coy(X,Y)I≤ ・ 一定成立,等号成立的 充要条件是P{Y=aX+6 1。 证明设X =X—EX,Y。=Y—EY,则X 、Y 的二阶矩均存在,由Cauchy.Schwarz不等式有 (EX Y ) ≤EX 即 [E(X—EX)(Y—EY)] ≤ E(X—EX) E(Y—EY) 即 eov(X,y) ≤DX・DY I cov( ,l,)I≤v厂 ・ ̄/I 等号成立的充要条件是 P{Yl=aX }=l 而 P{Y—EY=0(X—EX)}=1 P{Y=aX—aEX+EY}:1 令 b=一nEX+EY 则等号成立的充要条件是 P{Y=aX+b}:1 (2)若随机变量 、y的方差均存在,则不等式 I coy(X,Y)I≤E I(X—EX)(Y—EY)l≤ 一定成立,等号成立的充要条件是P{Y=aX+b} =1 o 证明 设 I X—EX I=X1,l Y—EY I=Y1 则不等式右边如(1)可证, 左边因为 eov(X,Y)=E(X—EX)(Y—EY) 所以 c。v(x,y)1:j f f ( —Ex)(),一Ey). ,( ,y)dxdy l≤ r r ( —EX)(),一EY)f( ,y)I dxdy: J一*J一 E I(X—EX)(Y—EY)I 所以 Ieov(X,Y)}≤E I(X—EX)(Y—EY)l 由Cauchy—Sehwarz不等式的证明过程可得出下面的 推论,从而得到一种回归系数的矩估计方法。 推论1 设随机变量X、Y的二阶矩均存在且 不为零,如果随机变量 、y依概率1具有线性关 系尸{Y=nxf_1, = 。 证明 由上述定理的证明过程可知,如果随机 变量X、Y依概率1具有线性关系P{Y=aX}-1, 其充分必要条件为二次函数 g(t)=E(Y+tX) :E(X )t + 2E(XY)t+E( ) 的判别式A:0,即g(t)只有一个实根。所以存在 唯一一点t g(t0)=E(y+t0 X) =0 而 g(一0)=E(Y—aX) =0 所以t。=一ft,此时g(t)取得最小值 g(t0)=E(Y—aX) =0 又由二次函数盼性质知最/J、值点to=一 , 所以。= 。 推论2设随机变量 、y的方差均存在且不 为零,如果随机变量 、y依概率1具有线性关系 P{Y=aX+6}=1 则 E(X—EX)(Y—EY) 。 —— 面 _一 6=EY—aEX 证明设X1=X—EX,Y =Y~EY,贝0 X。、Y1 的二阶矩均存在,因为 、y依概率1具有线性关 系P{Y=aX+6}_1,所以有 P{(y +EY)=n( 。+EX)+6}=1 整理得 P{Yl=aX1+0E +6一EY}:1 第22卷第4期 常广平等:利用Cauchy-Schwarz不等式估计回归系数 79 由于 则系数o、b的矩估计量为 EY=GEX+b (置一 )( 一_y) 所以 P{Y。=aX。}=1 l"t ∑(X 一 ) 由推论(1)可知n= EX l Y1,即 ∑( 一 )( 一_y) E(X—EX)(Y—EY) E(X—EX) ∑(置 ) zb=EY—aEX l 根据上述推论1、2可知,在实际应用当中若 6:_y一三 、y几乎具有线性关系时,用 的线性函数aX+ 同时,推论1、2的结论与一元线性回归模型Y:ax, b来近似替代或预测y,系数n、b应为 +b+e,£~N(O,口 )中,根据最小二乘法求得的系 E(X—EX)(Y—EY) COY(X,Y) 数o、b的估计量三=≥、占=y—O一,Jg一致。 “一 E( —E ) 一 D(X) p b=EY一,zEX [参考文献] [1]胡细宝,孙洪祥,王丽霞.概率论数理统计随机过程[M].北京:北京邮电大学出版社,2004. [2]廖昭懋,杨文礼.概率论与数理统计[M].北京:北京师范大学出版社,1989. [3]龙永红.概率论与数理统计[M].第2版.北京:高等教育出版社,2004. [4] 周誉达.概率论与数理统计[M].北京:中国人民大学出版社,2002. [5]林琦煜.Cauchy.Sehwarz不等式之本质与意义[J].数学传播,2000,26(1):26—42. [6]李娟,崔文泉.Cauchy.Schwarz不等式的推广[J].大学数学,2006,22(6):144—147. [7] 叶嘉眉,杨露.Cauchy—Sehwarz不等式的推广及应用[J].成都大学学报:自然科学版,2003,22(4),24—28 (责任编辑李亚青) (上接第72页) [参考文献] [1]谢金星.2000“网易杯”全国大学生数学建模竞赛试题[EB/OL].2000.09.01[2008—01—05].http://www.mem.edu.cn/ DEFAULTc.HTM. [2]韩轶平,余杭,刘威,等.DNA序列的分类[J].数学的实践与认识,2001(1):38—45. [3]周玉元,周铁军.DNA序列分类的Fisher判别法[J].湖南农业大学学报:自然科学版,20o3(5):437—440. [4] 顾俊华,盛春楠.模糊聚类分析方法在DNA序列分类中的应用[J].计算机仿真,2005(10):108—111. [5]冯涛,康黼雯,韩小军,等.关于DNA序列分类问题的模型[J].数学的实践与认识,2001(1):26—30. [6]李银山,杨春燕,张伟.DNA序列分类的神经网络方法[J].计算机仿真,2003(2):64—68. [7] 吕金翅,马小龙,曹芳,等.DNA序列分类的数学模型[J].数学的实践与认识,2001(1):46—53. [8]汤诗杰,周亮,王晓玲,等.DNA序列的分类模型[J].数学的实践与认识,2001(1):19—25. [9] Vapnik V.1’he nature of statistical learning theory[M].张学工,译.统计学习理论的本质[M].北京:清华大学出版社,2000. [10]邓乃扬,田英杰.数据挖掘中的新方法一支持向量机[M].北京:科学出版社,2004. (责任编辑李亚青)