分位数回归技术综述

第23卷第3期

统计与信息论坛

2008年3月

Vd.23

No.3

Statistics&InformationForum

Mar..2008

【观点综述】

分位数回归技术综述

陈建宝,丁军军

(厦门大学宏观经济研究中心,福建厦门361005)

摘要:普通最小二乘回归建立了在自变量X=z下因变量y的条件均值与X的关系的线性模型。而分位数回归(QuantileRegression)则利用自变量x和因变量y的条件分位数进行建模。与普通的均值回归相比,它能充分反映自变量X对于因变量y的分布的位置、刻度和形状的影响,有着十分广泛的应用,尤其是对于一些非常关注尾部特征的情况。文章介绍了分位数回归的概念以及分位数回归的估计、检验和拟合优度,回顾了分位数回归的发展过程以及其在一些经济研究领域中的应用,最后做了总结。

关键词:0LS回归;分位数回归;估计;检验;应用中图分类号:0212;F222.3

文献标识码:A

文章编号:1007—3116(2008)03—0089—08

一、引

量的条件分位数对自变量X进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普传统的线性回归模型描述了因变量的条件分布通最小二乘回归只能描述自变量X对于因变量y受到自变量X的影响过程。普通最dx--乘法是估计局部变化的影响而言,更能精确地描述自变量X对回归系数的最基本的方法,它描述了自变量X对于于因变量y的变化范围以及条件分布形状的影响。因变量y的均值影响。如果模型中的随机扰动项来分位数回归能够捕捉分布的尾部特征,当自变量对自均值为零而且同方差的分布,那么回归系数的最不同部分的因变量的分布产生不同的影响时.例如dx--乘估计为最佳线性无偏估计(BLUE);如果近出现左偏或右偏的情况时。它能更加全面的刻画分一步随机扰动项服从正态分布,那么回归系数的最布的特征,从而得到全面的分析,而且其分位数回归dx--乘法或极大似然估计为最小方差无偏估计系数估计比OLS回归系数估计更稳健。

(MⅥ甩)。但是在实际的经济生活中,这种假设常近10多年来,分位数回归在国外得到了迅猛的常不被满足,饲如数据出现尖峰或厚尾的分布、存在发展及应用,其研究领域包括经济、医学、环境科学、显著的异方差等情况,这时的最小二乘法估计将不生存分析以及动植物学等方面(见本文第四部分)。再具有上述优良性且稳健性非常差。最小二乘回归为了说明分位数回归的有用性,我们特介绍两个分假定自变量X只能影响因变量的条件分布的位置,位数回归实证分析的例子。Koenker和Machado分但不能影响其分布的刻度或形状的任何其他方面。

析了1965~1975以及1975~1985这两段时间内世为了弥补普通最dx--乘法(0Ls)在回归分析中界主要国家的经济增长情况。模型选取了13个影响的缺陷,Koenkel"和Pxassett于1978年提出了分位数经济增长的自变量,通过分位数回归得出结论:对于回归(QuantileRegression)的思想…。它依据因变

起初的单位资本产出这一自变量来说,它的全部回

收稿日期:2008—0l一10;修复日期:2008—0l一28

基金项目:教育部人文社科重点研究基地基金项目《中国地区间收入分配差异与劳动力转移的经济增长效应分析》

(07JJD790145);教育部人文社科研究基金项目《数据挖掘中关联规则的统计研究和应用}(2006JA910003)

作者简介:陈建宝(1965一),男。云南曲靖人,澳大利亚科庭理工大学理学博士,厦门大学经济学院计划统计系教授、博士

生导师,厦门大学宏观经济研究中心研究员,研究方向:空间统计学,宏观经济学,数量经济学;丁军军(1980一),男,安徽合肥人,硕士生,研究方向:金融工程和计量经济学。

iYiY

统计与信息论坛

归分位系数基本保持不变,这就意味着对于经济发展迅速与缓慢的国家而言,起初的单位资本产出对于经济增长的影响基本相同;但是教育支出占GDP

的比重以及公共消费占GDP的比重这两个自变量对于经济发展缓慢的国家影响更加的强烈[2l。

Chen使用分位数回归方法深入研究了美国8250名

男性的BMI(身体质量指数,一种广泛用于测量偏

胖还是偏瘦的指标,BMI=体重/身高2)情况,并得

出结论:在2~20岁这一快速成长期中,BMI非常迅速的增加;在中年期间其值保持比较稳定;60岁

以后,BMI的值开始减少…3。这对于如何保持一个健康的身体提供了一种非常有效的措施,可以在各

个阶段中分别采取相应的控制体重的方法。

在概要介绍分位数回归的基本情况后,本文第

二部分介绍分位数回归的概念及其估计性质;第三

部分回顾分位数回归系数的算法,回归系数的检验方法以及拟合优度检验;第四部对分位数回归在实际中的应用。特别是在经济领域的应用做了详细的文献综述;第五部分为结语。

二、分位数回归的概念

如果一个学生在一次体检中,他的身高超过r比例的参加这次体检的学生,而低于1一r比例的参

加这次体检的学生,那么,我们就说他的身高排在全

体参加体检的学生的第r分位。按照这个思想,我们可以得出在参加这次体检的学生中,会有一半学生

的身高超过中位数的值,一半学生的身高低于中位

数的值。同样,四分位是将参考群分为四等分,五分

位是将参考群分为五等分,十分位则将参考群分为

十等分,其他的分位也依次类推。

分位数回归是对以古典条件均值模型为基础的

最小二乘法的延伸,它用几个分位函数来估计整体模型。分位数回归法的特殊情况就是中位数回归(最小一乘回归),用对称权重解决残差最小化问题,而

其他条件分位数回归则需要用非对称权重解决残差

最小化。

定义:设随机变量y的分布函数为F(y)=P(y≤Y),则y的第r分位数为Q(r)=inf{Y:

F(y)≥r},其中中位数可以表示为Q(1/2)。

对于y的一组随机样本{Y1,Y2,…,%},样本

—L

均值是min∑(Yf—e)2的最优解,而样本中位数是

‘=I

最小化残差绝对值和的解,即O(1-/2)=巴i娶∑I

Yi

c℃^i=I

90

一搴I。对于其他的第r分位数,我们可以求解下式:

min口∈矿[∑rmIn口∈矿L厶r

—e一∈I+

I+∑(1一r)I厶【l—r)l

i∈Ii:yi≥¥l

iG

li:丑<eI

一搴门,等价的表示为:mine“(Yi—e),这里…i=1

lD,(z)=rzI[o。。)(z)一(1一r)zl(--OOto)(z),其中,(・)为示性函数。对于一般线性条件均值函数

E(y

X=z)=z≯,通过求解p=

』l’

argmin口∈矿∑(Yi—x’Z3)2得到参数估计值。而一般

i=I

线性条件分位数函数为Q(r

X=z)=z≯(r),

—L

通过求解p(r)=argmin#eF∑(Yi—z7乒)得到参

i=l

数估计值。对于任意的r∈(o,1),参数声(r)称为第

r回归分位数。

分位数回归采用加权残差绝对值之和的方法估计参数,其优点体现在以下几方面:首先,它对模型中的随机扰动项不需做任何分布的假定,这样整个回归模型就具有很强的稳健性;其次,分位数回归本身没有使用一个连接函数来描述因变量的均值和方差的相互关系,因此分位数回归有着比较好的弹性性质;第三,分位数回归由于是对所有分位数进行回归,因此对于数据中出现的异常点具有耐抗性;第四,不同于普通的最小二乘回归,分位数回归对于因

变量具有单调变换性;最后,分位数回归估计出来的

参数具有在大样本理论下的渐进优良性…。

三、分位数回归模型的估计与检验

明显地,分位数回归模型中的参数估计,区间

估计,分位数回归系数假设检验以及拟合优度检验方法要比传统的线性回归模型中相应问题的求解要复杂得多。下面简要归纳介绍这些方法,详细内容见相关参考文献。

(一)参数估计

目前,分位数回归大致可以分为参数回归模型、

非参数回归模型、半参数回归模型这三类,每种模型都有其各自的估计方法。

1.参数回归模型

该回归模型的方程为:Y=邵+E,其中£为随

机变量。为了分析自变量X对因变量y在其各分位

数r的影响,我们需要求解

声(r)=argmin#Ep∑Pr(Yi—x'Z3)

(1)

j=I

其中P。(z)=戎J[o.。)(z)一(1一r)zI(一oo。o)(z)。

(1)式等价于求解一个线性规划问题

陈建宝,丁军军:分位数回归技术综述

Max{y'z

X乞=(1一r)X'e,z∈[0,1]“}(2)

其中e为单位向量。这样问题转化为对(2)式的求

解,目前对(2)式的算法主要有如下几种:

(1)单纯形算法(SimplexMethod)

Koenker和Orey[4](1993)把分两步解决最优化问题的单纯形算法(见lMrrodale&R0berts【5],1973)扩展到所有回归分位数中。该算法估计出来的参数具有很好的稳定性,但是在处理大型数据时运算的速度会显著的降低。

(2)内点算法(Interior

Point

Method)

由于单纯形算法在处理大型数据时效率低下,Karmarker便提出了内点算法[61;Portnoy和Koenker把这种方法使用在分位数回归中,得出了在处理大型数据时内点算法的运算速度远快于单纯形法的结论[7l。但是内点算法也有自身的缺陷,它在每一步计算时都要进行因数分解,当自变量比较多的时候效率比较低;其次,如果要达到和单纯形算法一样的精确度,就必须进行舍入步骤的计算,这也降低算法的运行效率。

(3)平滑算法(SmoothingMethod)

上述两种算法都有各自的优点和不足之处,而有限平滑算法则是一种同时兼顾运算效率以及运算速度的方法。Madsen和Nislsen使用这种算法于最小一乘回归上(中位数回归)[8],Chen把这种算法扩展到计算回归分位数中[9I。平滑算法用一个平滑函数来逼近(1)式,因此牛顿一拉尔夫方法可以反复地使用,这样经过有限步以后就能获得参数解。

上述三种算法相辅相成,虽然单纯形法在处理

大型数据时效率很低,但是估计出来的参数具有很

好的稳定性,尤其是当数据中存在大量杠杆点和野

值时,单纯形法可以计算出参数解,而这时其他两种算法都可能失败。内点算法对于那些具有大量观察值和少量变量的数据集运算效率很高。平滑算法在理论上比较简单,它适合处理具有大量观察值以及很多变量的数据集。Chen结合这三种算法提出了

一种自适应算法L9|。

2.非参数回归模型

Yu和Jones提出了一种估计条件分布的方

法【1们。例女口’.--IV2用F(y

27)=∑三1∞f(27)I(yi

<y)来估计条件分布函数F(y

z),其中,-Oi(37)为

权重,满足r-Oi(37)≠0且∑;I-,∞i(37)=1,I(yi<

y)为示性函数。但是,这种使用核加权估计的条件分布有些缺陷:首先它不是一个分布函数,因为它不

是一个单调函数并且它的取值范围不在[0,1]内。

人们

避熹辫…“Y71

户(y

37)

∑川i

P(27)Kh(37f一27)1……一一

X),其中Kh(五一z)=K(竿)为核密度函数,

Pi(z)≥0,∑二,Pi(z)=1,∑三,Pi(z)(而一

z)Kh(矗一z)=Oo第二个问题是依据这种方法估

计出来的分位数回归曲线可能会出现交错的现象,于是Yu和Jones提出一种双核方法,用P(y

27)=

∑三,叫i(z)力坦-≯来估计F(z

y),其中n(q)

=I

W(v)dv为密度函数w(越)的分布函数[10]。

3.半参数回归模型

Green和Silverman讨论了半参数回归模型的估计[11】,一般的在半参数模型中假定因变量y的条件分位函数qr依赖于自变量x以及函数g(t):

q。=zp+g(t)

(3)

可以通过求解下面的最小化问题来估计参数卢和

g(t):

∑三,P,{E—z寥一g(£)}十ol,(f)2dt

(4)

Koenker,Ng和Portony研究了一个算法来计算(4)式[12】。

另外,Yu提出了两阶段法【13】,该方法没有对(2)式求解,它使用一种由Bhattacharya和Gala—gopadhyay提出的五值逼近理论来求解回归分位系数[14】。第一步对样本按照自变量x排序,得到数据

集{(毛,Yi)}iI。然后给定r,对数据集{(墨+H,Yi+j一1)}f(歹=1,2,…,,z—k一1,五=

max{譬,}兰},r。,r2分别为r的最小值和最大maxli,再f,r1,分另u刀r明最爿、但利最大

值)使用k值逼近来估计第r个回归分位系数q,(z)。第二步对于由上步估计出来的咒一k一1个

回归分位系数口。(z)使用最小二乘核平滑得到最终的回归分位系数估计值。

对于回归分位系数置信区间的估计方法依据目前的文献也可以分为三种,下面分别加以介绍:

(1)直接估计法(Direct

Estimation

Method)

该方法依据估计出来的回归分位系数的渐进正态性来计算置信区间。比较有代表性的是Sparsitv算法,它是一种最直接并且运算速度也是最快的算法,假定随机项为独立同分布且分布函数为F,密度

统计与信息论坛

№tt[1】(1982)得出了:

函数f=F7且f(F’1(r))>OoKoenker和/磊(p(r)一声(r))一N(O,∞2(f,F)O一1)

(5)

其中叫2(r,F)=3(1一r)俨(F-1(f)),n=

lira以.1∑X;X7io因此我们就可以用(5)式来计算出

回归分位系数的置信区间,但是我们先要估计出Sparsity函数,该函数为密度函数的倒数s(r)=[f(F-1)(r))]一。Sparsity函数的估计值对于随机

项为独立同分布这一假设十分敏感,如果随机项不

满足独立同分布那么这个估计值就是非稳健。为了解决这一问题,Koenker和Machado[2](1999)考虑了随机项为非独立同分布的情况,并提出了局部密度函数的估计方法。

(2)秩得分法(Rank

Score

Method)

Koenker提出了秩得分算法,该算法是对秩得分检验的延伸[15]。首先求解Max{Y—X2叩),口lX71口=(1一£)x7∥,口∈[0,1]”}。得到秩得分函数占。(t)={三。l(t),…,占。。(£)},其中可为线性模型y=X1p1+X2忽+£中系数皮的显著性检验:』9(r)=17。求第r分位数的秩得分函数占碰(t)的积分得到红(£)=r—f(£<r),从而得出第r个分位数的和

广l

占。{=一f.红(£)荔。i(r)=三耐(r)一(I—r),然后令

oU

L(7)=7i1

.S。(叩)n:1/'2(其中Sn(17)=

r~上一‘,

r/-1/2X'2b。(叩)一N(0,r(1一r)亿),n。=

n-IX72(f—Xl(X7lXl)_1X71)x2),赋予Tn一个阈值,随着刁的改变计算t(可)直到其值超过该阈值,这样就可以通过插值的方法得到回归分位系数的置信区间。秩得分法算法比较简单,但是对于大型数据处理效率较慢。

(3)重复抽样法(Resamplingmethod)

重复抽样法使用Bootstrap算法,它可以从残差中抽样也可以从数据{墨,沈}抽样。KoenkeIll5】(1994)提出了HeqfBootstrap算法,该算法直接从整个分位数回归过程中重复抽样。Parzen,Wei以及Ying使用另一种更简单的Bootstrap算法,当数据中出现异方差时能够计算出稳健的参数估计量Ll61。这些算法对高维的大型数据运算时需要花费很长的时间。H毛和Hu提出了一种新的重复抽样法,该方法使用了MCMB(Markov

ChainMarginal

Bootstrap)算法,这种算法能够进行高效率的运算,大大节省了运算时间(17]。重复抽样法能够克服直

92

接法和秩得分法的缺陷,但是对于小样本时计算出的参数估计值不够稳定。

综上所述,无论是参数的点估计还是区间估计,每种方法都有自身的优势也有自身的不足之处,因此还有很大的空间去研究出一种最优、可信并且运算效率高的算法。

(二)参数显著性检验考虑分位数回归模型:

Yi

Xil向+xf2f12+ui

(6)

其中“i来自独立同分布,其分布函数为F,使为q维回归系数,p=(J91,皮)。对于假设检验H0:使(r)=0,常用的是Wald检验与似然比检验。Wald

检验主要定义统计量L(z.)=口72(r)艺

(r)-1忽(f),其中艺(r)=与(r)2n22,为恕(r)

的协方差估计量,0(r)=/习两;(r),;(r)为

上文中Sparsity函数的估计值,n22=(n22—02lnll-Inl2)~,Dd为参数估计的协方差阵中的对

应元素;后者首先要分别计算Do(r)=∑陆(M—z乒(r))和Dl(r)=∑A(M—z1扫l(r)),再定义

统计量‰(r)=2(r(1一r);(r))。(D1(f)一

Do(r)),Koenker与Machado[2](1999)证明了这两

种检验统计量瓦,(r)和了k(f)在原假设下都服从

z:,这样便可以检验回归系数的显著性。

(三)拟合优度

Koenker与Machado[2](1999)依据最小二乘回归中拟合优度R2的计算思想,提出了分位数回归中

拟合优度的计算方法,定义为RI(r)=1一茜事警,

很明显D1(r)≥Do(r),因此0≤R1(r)≤1。最小二乘回归中的R2依据残差平方和度量了回归平方和占总离差平方和的比重,而R1(r)则按照残差绝对值的加权和,度量了在某个分位数下分位数回归的拟合效果。因此不像R2反映的是整个分布的拟合情况,R1(r)描述的是在某个分位数下的局部拟合效果。

以上计算方法基本上都是通过迭代法来完成。但大多数方法的实现都可以使用现成的软件包。目前计算分位数回归的统计软件主要有Stata、Sas(详见support.sas.com)以及R(详见Ⅵ兀wr.e(:on..uiuc.edu/roger/research/rq/rq.htmI)o

四、分位数回归的应用

与传统的OLS回归相比,由于分位数回归所具

陈建宝,丁军军:分位数回归技术综述

有的显而易见的优点,近10多年来,分位数回归的

理论和方法在各个领域中都得到了非常迅速的发展,Koenker和Hallock对于分位数回归的稳健性、变量的异方差性和样本的选择方面以及分位数回归在二元响应模型、久期模型、面板数据、时间序列、极值理论、非线性模型、非参数模型和多元分析中的发展做了精彩的回顾[18]。分位数回归的应用也十分.广泛:在环境科学方面,Chock,Winkler和(;hen使用非参数分位数回归法研究了匹兹堡这座城市中日死亡率和空气污染集中度的相互关系[19],Hilary和Andrzej运用分位数回归对天气数据进行了分析【驯;在生态学方面,Koenker.和Schorfheide分析了上世纪全球气候改变的过程[21】,Dunham,Cade和Terrell研究了不同的河流对鲑鱼密度的影响[221;在生存分析方面,Koenker和Hallock【18J(2001)研究了

诸多因数对于新生儿出体重的影响;Cole和

Green[23】以及Royston和~tn】an[24]还讨论了分位数回归在医学上的应用。

下面我们主要介绍分位数回归在经济领域中的应用。

在劳动力市场方面,Buchinsky研究了美国的劳动力市场[25];Schultz和Mwabu研究了南非的劳动力市场[26];Montenegro分析了智利的情况[27】;

Fithzenberger和Kurz,Fithzenberger、Hujer、Macur—

dy和Schnabe讨论了德国劳动力市场的情况[28—29】;值得一提的是Machado与Mata扩展了Oaxaca的分解法,并提出了一种依据分位数回归过程来模拟边际分布的方法来研究葡萄牙的劳动力市场m1;Yu,Philippe和Zhang使用贝叶斯分位数回归研究了英国1991~2001年间的工资结构的分布情况【31o;Angrist,Chemozhukov和Fernandez一、d使用分位数回归方法研究了美国的工资结构的分布情况[32】;Papapetrou则研究了希腊公私企业中的工资差距情况【33J。

Deaton对于分位数回归在需求分析方面上的应用做了介绍,并分析了巴基斯坦的Engel曲线L343;Hendricks与Koenker使用分位数回归研究了电力消费需求情况[351;Manning、Blumberg和

Moulton讨论了酒精使用的需求隋况[36I。Taylor运

用指数加权分位数回归来预测超级市场的日销售情况[37]。

收入不平等问题是分位数回归的另一个研究方面。Gosling、Machin和Meghir研究了英国家庭的收入和财富的分布状况m1;Conley和Galenson探讨了

美国的几个城市在19世纪中期财富的累积情况【驯;Trede和Morillo比较了美国与德国的收入机动性[40一411。

分位数回归目前在金融方面的应用主要在两个

方面。金融资产组合方面:B司ssett和Chert运用分

位数回归来评估共同基金的投资类型[42-431;Barnes和Hughes研究了美国资本市场的CAMP模型[441;Ma和Pohlman运用分位数回归讨论了资产收益预

测与最优资产组合的构造[45]。金融风险方面:在金

融市场的风险管理中,VaR已经成为其标志性指标。VaR能够将金融机构面临的所有种类各异、形式多样的风险加总成为一个简单的数字。它是指某个特定的头寸或组合,在给定的持有期内以及给定的置信水平上,金融机构所面临的最大损失,例如组合价值的5%的分位数可以看成是组合将要面临的最大损失。更一般的,记y表示组合的市场价值,y的第r分位数记为Y满足P(Y≤y)=r,这时称Y为1一r水平下的风险值。计算VaR的方法很多.但都有特定的假设条件和适用范围,因此Engle和Manganelli首次在VaR的基础上提出了条件VaR

模型(CAVi出),并使用分位数回归的方法来估计参

数,通过对数据的模拟得出了这一模型对于厚尾数据的表现为最优的结论[46】;Taylor使用分位数回归

的方法来估计多期收益的风险值VaR[47】;(;her—

nozhukov和Umantsev使用分位数回归深入研究了CVaR的模型与估计方面的问题[48】;Chell和Chen分别用分位数回归方法和方差一协方差法计算日经225指数的VaR值,实证结果为前者很大程度上优于后者【491;Georgios和Leonidas使用CAViaR模型估计了美国和希腊证券市场中的市场风险值[501。

五、结语

分位数回归思想的提出至今已经有近30多年

了,经过这近30多年的发展,分位数回归在理论和

方法上都越来越成熟,并被广泛应用于多种学科中。它对于实际问题能提供更加全面的分析,无论是线性模型还是非线性模型,分位数回归都是一种很好

的工具,它对一般回归模型做工有益的补充。尽管

如此,分位数回归在理论和方法上依然还有很大的提升空间,例如分位数回归在多元分析方面的发展就很不成熟,Koenker和Hallock已有专文论述[51]。在应用方面,特别是在金融方面的应用才刚刚起步。有兴趣对分位数回归做进一步了解和研究的学者可以参考本文列出的相关参考文献。

93

统计与信息论坛

中国目前在分位数回归这一领域上的研究还比理论、方法和应用研究。我们相信将分位数回归应

用于中国社会、经济各个领域的相关数据分析必能

较滞后,研究成果较少,只有少数几篇文章发表。本文的目的在于引起更多国内学者关注分位数回归的

得出更多有用的信息。

参考文献:

[1]Kodlkel"R,BasseRGW.Regressionquantiles[J].Eccagxlletrica,1978,46:33—50.[2]KoenkerR,Machado

—1310.

F.C_gx蛔of

nlass

fitandrelatedinferenceprocessesforquantfleregression[J].JASA,1999。94:1296

[3]ChertC.Growthchs.rtsofbody[4]KoenkerR,OreyD.Computing[5]Ba/'rodaleI,Roberts

839—848.

index(BMI)withquantileregression[R].MS.2004.

quantiles[J].AppliedStatistics。1993,43:410—414.

regression

FDK.An

improvedalgorithmfordiscrete11linearapproximation[J].SIAMJ.Numer.Anal.,10:

KamuarkerN.Anewpolynonaialtimealgorithm

linearprogranmfing[J].Combinatorica,1984,4:373—395.

陆口,,

Portnoy

S。KoenkerR.TheGat塔sianhareandtheLaplacianTortoise:computabilityofsquared—error

vea's1J¥absolute—a材

estimators[J].Stat.,Science,1997,12:279—300.陋,

MadsenK。NielsenHB.Afinitemaoothing235.

algorithmfor

linerL1

estimation[J].SIAMJ.Optimization,1993,3:223—

p,

ChenC.An

PisonYu

adaptive

algorithm

forquantileregression[C]//ThoeryandApplicationsofRecentRobustMethods.HubertM。

G,S咖yfA,VanSAelst,Series:StatisticsforIndustryandTechnology,Birkhauser,Basel,2004,39—48.

K。JonesMC.Locallinearquantileregression[J].JASA,1999,90:1257—1270.

.=Ⅱ们I=.GreenPJ。Silven-nanBW.Nonparametricregressionandgeneralizedlinearmodels:aroughnesspenaltyapproach[M].ChapmanHall.NewYork,1994.

nH纠卯n们

KoenkerR,NgP,PortnoyS.Quantilesmoothingsplines[J].Biometrika,1994,81:673—680.

Yu

K.Smoothingregressionquantilebycombiningk—NN

estimation

withlocalkernelfitting[J].StatisticaSinica,1999,

9:759—774.

BhattacharyaPK,GangopadhyayAK.Kernelandnearestneighbourquantileregressionmodel[J].Ecor,ometrica,1990,66:627—651.

n纠

KoenkerR.Cxdidenceintervalsforquantileregression[M].InAsymptoticStatistics:Proceedingofthe5thPragueSympo-slum

on

AsymptoticStatistics.Editedby

M.Huskova,Physica一№,1994.

OFl

l=印

ParzenMI,WeiLJ,YingZ.Aresamplingmethodbased350.

pivotal

estimatingfunctions[J】.Biometrika,1994,81:341—

nnn刀印明

HeX,HuF.Markovchainmarginal[botstrap[J].JASA,2002,97:783—795.

KoenkerR。HallockK.Quantileregression:anintroduction[J].JournalofEconomicPerspectives,2001,15:143—156.ChockDP,WinklerSL,ChenC.Astudyoftheassociationbetweendailymortalityandambientairpollutantconcentrations

in

Pittsburgh,Pennsylvania[J].Journalof

theAirand

WasteManagefnentAss—ation,2000,50:1481—1500.

眨们

HilaryMG,AndrzejSK.Modellingweatherdatabyapproximateregressionquantiles[J].ANIZIAMJ.,2003,44(E):229—248.

KonekerR。Scl'Ka'fheideF.Quantile

splinen矧elsforglobaltemperaturechange[J].ClimateChange,1994,28:395—404.

oftheAmerican

眨眨¨纠

DunhamJB,CadeBS,TerrellJW.Influencesofspatialandtefnporalvariationon凰h—habitatrelationshipsdefinedby

regression

quantiles[J].Transactions

FisheriesSociety,2002,131:86—98.

[23]

ColeT

J,GreenPJ.Smoothingl'efe/'enceeentilecurves:the

LMS

methodandpenalizedlikdilxxxt[J].Statisticsin

Medicine,1992,11:1305—1319.

[24]

RoystonP,AltmanDG.Regressionusingfractionalpolynomialsforcontinuouscovariates:parsimoniousparametricmodelling(with

discussion)[J].AppliedStatistics,1994,43:429—467.

[25]BuchinskyM.ChangesinUSwagestructurel963—1987:anapplicationofquantileresression[J].Econometrica,1994・62:

405—458.

[26]

94

SchultzT,MwabuG.LabourunionsandthedistributionofwagesandemploymentinSouthAfrica[J].IrA.andLalx)rRela一

陈建宝,丁军军:分位数回归技术综述

tionsRev.,1998,51:680—703.

[27]MontenegroC.nest_tutti/reofwagesin

1998,25:71—98.

Chile1960—1996:an-applicationofquantileregression[J].EstudiosdeE唧10fnja,

[28]Fitzenberger

B,Kurz

C.Newinsiighta

on

earnings

trendsacrossskill

groupsandindustriesin

w笛tGemmny[J].Empirical

Economics。2003,28(3):479—514.

[29]FitzenbergerB,HuierR,MaCurdyT,Sehmbel

R.Testing

usingquantileregressionsforcensoreddata[J].Empirical

Ec删cS,2001,26(1):41—86.

to

foruniformwagetrendsinwest—Germany:Acohortanalysis

[30]MachadoJAF,MataJ.Counterfactualdeconapositionofchangesinwagedistributionsusingquantileregression[J].JournalofAppliedEconometrics2005,4:445—465.

[31]Yu

K,PhilipeG,Zhang

J.Bayesianquantileregression:孤appicationthewagedistributionin1990sBritain[J].

Sankhya,2005,67:359—377.

[32]AngristJ,ChernozhukovV,Fernandez一砌I.Quantihregression

wage

under

misspecification,with

all

applicationtotheU.S.

structure[J].Econometrica,2006,74(2):539—564.

unequaldistribution

[33]PapapetrouE.Theofthepublic—private

sector

wagegapin

Greece:evidencefromquantile

regression

[J].AppliedEconomicsLetters,2006,13(4):205—210.[34]D∞tonA.The

analysisof

Ixxtsehold

surveys:a

microeconometric

approach

todevelopmentp。l研[M].Johns

Hopkins

ⅧversityPress,Baltimore,MD。1997.

[35]HendricksW,KoenkerR.Hierarchicalsplinemodelsforconditional

1991,87:58—68.

quantilesand

thedmaandforelectricity[J].JASA,

[36]ManningW,BlumbergL,Moulton

L.Thedemand

foralcohol:thedifferentialresponse

to

E珊mi∞,1995,14:123—148.

Operational

price[J].Journal

ofHealth

[37]TaylorJ.Forecastingdailysupemaarket

salesusingexponentiallyweightedquantileregression[J].EuropeanJournalof

Research,2007,178:154—167.

since

[38]GoslingA,MachinS,MeghirC.whthashappenedtothewagesofmen

ChangingDistributionofIncomeandWealthintheUnitedKingdom.1996.[39]ConleyT,Galemon

468—493.

D.Nativityandwealthin

19667[C]//HillsJ.NewInequalities:the

mid—nineteenth—centurydties[J].JournalofEconomicHistory,1998,58:

[40]TredeM.Makingmobilityvisible:agraphicaldevice[J].[41]MorilbD.Incomemobility谢t}lnonparametriequantiles:

2000.

E00nomi曙Letters,1998,59:77—82.

comparisonoftheU.S.andGermany[R].Workingpaper。

[42]

Bassett

G,ChenH.Quantilestyle:quantilesto

on

ass瞄mutual

fundinvestmentstyles[R].Presented

atthe

International

Conference

EconE疆nie

ApplicationsofQuantileRegression,Komtanz,2000.

[43]BassettG,ChenH.Quantilestyle:retLLrn—basedattributionusingregressionquantiles[J].EmpiricalEconomics,2001。26:

7—40.

[44]Ba_rllesM,HughesA.A

quantileregressionanalysis

of

the嘲sectionofstockmarketreturn[R].Workingpaper,Federal

ReserveBankofBoston,2002.

[45]Ma1,PohlmanL.Return

paper

forecastsand

optimalportfolioconstruction:aquantileregressionapproach[R].SSRNWorking

880478,2005.

at

[46]

EngleRF,ManganelliS.CAViaR:conditionalautoregressivevalueandEconomicStatistics,2004,22:367—381.

riskbyregressionquantiles[J].JournalofBusiness

[47]TaylorJ.Aquantile

regreSsionapproach

to

qstimatingthedistributionofmulti—periodreturns[J].JournalofDerivatives,

1999(蹦1):64—78.

[48]Chernozhukov

V,Umantsev

L.Conditionalvalue

at

risk:aspectsofmodellingandestimation[J].EmpiricalEcononics,

2001。3:271—292.

[49]ChenMY,(3henJE.Statisticalinferences[50]GeoriosK,Leonidasz.Conditional

International

inquantileregression

models:primalanddualaspects[R].Manuscript,2001.

autoregressioninFinancial

quantiles:estimatingmarketriskformajorstockmarkets[C].TheSecond

Symlx葛ium“Advances

Forecasting”,2005.

[51]KoenkerR,Hallock

F.Quantileregression:anintroduction[J].JournalofE(x)lKlllicPerspectives,2001,15:143—156.

95

统计与信息论坛

[52]KoenkerR.Quantileregression[M].Cambridge:CambridgeUniversity[53]ChenC,WeiY.Computation[54]Yu

350.

K,Luz,Stander

issues

P煅,2005,London.

area[J].The

Statistician,2003,52:331—

onquantileregrl函orl[J】.Sankhya。2005,67:399—417.

current

J.Quantileregression:applicationsand

research

(责任编辑:张治国)

AReviewofTechnologies

on

Quantile

Regression

CHENJian—bao。DINGJun-jun

(Maeroeconc疵csResearchCenter,Xiamen

the

University,Xiamen361005,Fujian)

vector

Abstract:Ordinaryleastsquare(OLS)regressionmodelstherelationshipbetween

ofcovariateand

conditionalmo_弛_rlof

responsegiven.However,quantileregressionmodelstherelationship

between

covari・

ateandtheconditional

quantilesofgiven.Takentogethertheensembleofestimated

on

conditional

quantileoffers

muchmorecompleteviewoftheeffectofcovariatesthelocation。scaleandshapeofthedistributionofthe

ale

re—

sponsevariable.Itresponse.In

this

isespeciallyusefulinapplicationswherepeople

wefirst

interested

in

upper

or

lowerquantilesof

paper

introduce

theconceptof

quantileregression,thenprovidesomebrief

methods

ofappli—

aboutestimation,hypothesistestsandgoodness—of—fitofquantileregression,some

important

aspects

cationsineconomics

are

reviewed,asummaryisgiveninthefinalsection.

testing;application

Keywords:OLSregression;quantile

regression;estimation;hypothesis

(上接第83页)

[23][24]

StulzRM.Managerialcontrolofvotingrights:financingpoliciesandthemarketforcorporatecontrol[J].Journalof

Financial

Egg)lx3mics,1988,20(1/2):25—54.

FlaggJC,GirouxGA,WigginsCE.Predictingcorporatebankruptcyusingfailingfirms[J].ReviewofFinancial

Economics。1991,1(Fall):67—79.

[25]

HillNT,Perry

SE,AndesS.Evaluatingfirmsinfinancialdistress:锄eventhistoryanalysis[J].JournalofApplied

&】Sin瞄Research,1996,12(3):60—71.

(责任编辑:崔国平)

AnEmpiricalStudy

on

FinancialDistressPredictionBased

on

CorporateGovernance

(Schoolof

E∞删cs,Xialnell

GUOHui—hong,ZHOUYong-qiang

University,Xiamen361005,China)

Abstract:Statisticallydisposingcorporatefinancialinformationandgovernanceingredientinvirtueoffactor

analysisand

paired—sample

test

respectively,thepaperdevelopsandempiricallytests

two

Logisticregression

models

for

indicators

predictingfinancialdistressinChina’Slistedcompanies,i.e.modelwhichjustincludefinancialandmodelwhichsyncretizefinancialindicatorsandcorporategovernanceindicators.Thestudyfinds

are

thatthecorporategovernanceindicatorsprominentlyrelatedto

one.

financial

distress;moreover。the

model

in—

cludingcorporategovernanceindicatorsdominatestheother

Key

words:financialdistress;corporategovernance;factoranalysis;Logistic

regression

分位数回归技术综述

作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:

陈建宝, 丁军军, CHEN Jian-bao, DING Jun-jun厦门大学,宏观经济研究中心,福建,厦门,361005统计与信息论坛

STATISTICS & INFORMATION FORUM2008,23(3)9次

参考文献(54条)

1. Papapetrou E The unequal distribution of the public-private sector wage gap in Greece:evidencefrom quantile regression 2006(04)

2. Angrist J;Chernozhukov V;Fernandez-val I Quantile regression under misspecification,with anapplication to the U.S.wage structure[外文期刊] 2006(02)3. Koenker R;Orey D Computing regression quantiles 1993

4. Georios K;Leonidas Z Conditional autoregression quantiles:estimating market risk for major stockmarkets 2005

5. Chen M Y;Chen J E Statistical inferences in quantile regression models:primal and dual aspects2001

6. Chernozhukov V;Umantsev L Conditional value at risk:aspects of modelling and estimation 20017. Koneker R;Schorfheide F Quantile spline models for global temperature change[外文期刊] 19948. Hilary M G;Andrzej S K Modelling weather data by approximate regression quantiles 2003(E)9. Chock D P;Winkler S L;Chen C A study of the association between daily mortality and ambient airpollutant concentrations in Pittsburgh,Pennsylvania 200010. Koenker R;Hallock K Quantile regression:an introduction 200111. Chen C An adaptive algorithm for quantile regression 2004

12. Madsen K;Nielsen H B A finite smoothing algorithm for liner L1 estimation 1993

13. Portnoy S;Koenker R The Gaussian hare and the Laplacian Tortoise:computability of squared-errorversus absolute-error estimators 1997

14. Karmarker N A new polynomial time algorithm for linear programming 1984

15. Barrodale I;Roberts F D K An improved algorithm for discrete l1 linear approximation16. Yu K;Lu Z;Stander J Quantile regression:applications and current research area 200317. Chen C;Wei Y Computation issues on quantile regression 200518. Koenker R Quantile regression 2005

19. Koenker R;Hallock K F Quantile regression:an introduction 2001

20. Taylor J A quantile regression approach to qstimating the distribution of multi-period returns1999(03)

21. Engle R F;Manganelli S CAViaR:conditional autoregressive value at risk by regression quantiles[外文期刊] 2004(4)

22. Ma l;Pohlman L Return forecasts and optimal portfolio construction:a quantile regressionapproach[SSRN Working paper 880478] 2005

23. Barnes M;Hughes A A quantile regression analysis of the cross section of stock market return 200224. Bassett G;Chen H Quantile style:return-based attribution using regression quantiles 200125. Bassett G;Chen H Quantile style:quantiles to assess mutual fund investment styles 2000

26. Morillo D Income mobility with nonparametric quantiles:a comparison of the U.S.and Germany 200027. Trede M Making mobility visible:a graphical device[外文期刊] 1998

28. Conley T;Galenson D Nativity and wealth in mid-nineteenth-century cities 199829. Gosling A;Machin S;Meghir C What has happened to the wages of men since 1966? 1996

30. Taylor J Forecasting daily supermarket sales using exponentially weighted quantile regression[外文期刊] 2007(1)

31. Manning W;Blumberg L;Moulton L The demand for alcohol:the differential response to price 199532. Hendricks W;Koenker R Hierarchical spline models for conditional quantiles and the demand forelectricity 1991

33. Deaton A The analysis of household surveys:a microeconometric approach to development policy 199734. Chen C Growth charts of body mass index (BMI) with quantile regression 2004

35. Koenker R;Machado A F Goodness of fit and related inference processes for quantile regression1999

36. Yu K;Philipe G;Zhang J Bayesian quantile regression:an appication to the wage distribution in1990s Britain 2005

37. Machado J A F;Mata J Counterfactual decomposition of changes in wage distributions using quantileregression [外文期刊] 2005(4)

38. Fitzenberger B;Hujer R;MaCurdy T;Schnabel R Testing for uniform wage trends in West-Germany:Acohort analysis using quantile regressions for censored data 2001(01)

39. Fitzenberger B;Kurz C New insights on earnings trends across skill groups and industries in WestGermany 2003(03)

40. Montenegro C The structure of wages in Chile 1960-1996:an application of quantile regression 199841. Schultz T;Mwabu G Labour unions and the distribution of wages and employment in South Africa 199842. Buchinsky M Changes in US wage structure 1963-1987:an application of quantile resression 199443. Royston P;Altman D G Regression using fractional polynomials for continuouscovariates:parsimonious parametric modelling (with discussion) 1994

44. Cole T J;Green P J Smoothing reference centile curves:the LMS method and penalized likelihood[外文期刊] 1992

45. Dunham J B;Cade B S;Terrell J W Influences of spatial and temporal variation on fish-habitatrelationships defined by regression quantiles[外文期刊] 2002(1)46. He X;Hu F Markov chain marginal Bootstrap 2002

47. Parzen M I;Wei L J;Ying Z A resampling method based on pivotal estimating functions 199448. Koenker R Confidence intervals for quantile regression 1994

49. Bhattacharya P K;Gangopadhyay A K Kernel and nearest neighbour quantile regression model 1990

51. Koenker R;Ng P;Portnoy S Quantile smoothing splines 1994

52. Green P J;Silverman B W Nonparametric regression and generalized linear models:a roughnesspenalty approach 1994

53. Yu K;Jones M C Local linear quantile regression 1999

54. Koenker R;Bassett G W Regression quantiles 1978

本文读者也读过(10条)

1. 李育安. LI Yu-an 分位数回归及应用简介[期刊论文]-统计与信息论坛2006,21(3)

2. 吴建南. 马伟. WU Jian-nan. MA Wei 估计极端行为模型:分位数回归方法及其实现与应用[期刊论文]-数理统计与管理2006,25(5)

3. 刘生龙 教育和经验对中国居民收入的影响——基于分位数回归和审查分位数回归的实证研究[期刊论文]-数量经济技术经济研究2008,25(4)

4. 关静 分位数回归理论及其应用[学位论文]2008

5. 韩月丽 极值统计与分位数回归理论及其应用[学位论文]2009

6. 陈娟. 林龙. 叶阿忠 基于分位数回归的中国居民消费研究[期刊论文]-数量经济技术经济研究2008,26(2)

7. 齐晓丽. 徐晓明 基于面板数据的分位数回归及实证研究[期刊论文]-科学时代(上半月)2010(3)

8. 张利 线性分位数回归模型及其应用[学位论文]2009

9. 齐晓丽. 金善女. 梁慧超. 连建新. QI Xiao-li. JIN Shan-nü. LIANG Hui-chao. LIAN Jian-xin 基于面板数据的分位数回归及实证研究[期刊论文]-河北工业大学学报2010,39(3)

10. 孙文杰. 沈坤荣. Sun Wenjie. Shen Kunrong 技术引进与中国企业的自主创新:基于分位数回归模型的经验研究

[期刊论文]-世界经济2007,30(11)

引证文献(12条)

1. 潘美玲 金融发展对外商直接投资经济增长效应的比较分析——基于面板分位数回归技术[期刊论文]-生态经济2011(12)

2. 朱慧明. 王彦红. 曾惠芳 基于逆跳MCMC的贝叶斯分位自回归模型研究[期刊论文]-统计与信息论坛 2010(1)

3. 付月. 金英姬. 姜今锡 基于MM算法的分位数计算方法[期刊论文]-延边大学学报(自然科学版) 2010(2)

4. 齐晓丽. 徐晓明 基于面板数据的分位数回归及实证研究[期刊论文]-科学时代(上半月) 2010(3)

5. 吴拥政 区域金融发展与经济增长的实证分析——基于中部六省地级市区数据与分位数回归方法[期刊论文]-经济研究导刊 2010(12)

6. 焦元 上海证券市场稳定性检验——分位数回归方法的一个应用[期刊论文]-统计科学与实践 2010(12)

7. 陈胜蓝 上市公司盈余管理与高管薪酬实证研究——基于分位数回归的分析[期刊论文]-广东技术师范学院学报2009(4)

8. 陈建宝. 杜小敏. 董海龙 基于分位数回归的中国居民收入和消费的实证分析[期刊论文]-统计与信息论坛 2009(7)

9. 李超 我国固定资产投资的分位数回归解析[期刊论文]-北方经济 2009(24)

10. 王如丰 利率对汇率变化反应了吗?——基于开放经济下泰勒规则的分位数回归[期刊论文]-财贸研究 2009(6)

11. 李智. 韩学山. 杨明. 钟世民 基于分位点回归的风电功率波动区间分析[期刊论文]-电力系统自动化 2011(3)

12. 焦元 上海证券市场稳定性检验——分位数回归方法的一个应用[期刊论文]-统计科学与实践 2010(12)

本文链接:http://d.g.wanfangdata.com.cn/Periodical_tjyxxlt200803018.aspx

第23卷第3期

统计与信息论坛

2008年3月

Vd.23

No.3

Statistics&InformationForum

Mar..2008

【观点综述】

分位数回归技术综述

陈建宝,丁军军

(厦门大学宏观经济研究中心,福建厦门361005)

摘要:普通最小二乘回归建立了在自变量X=z下因变量y的条件均值与X的关系的线性模型。而分位数回归(QuantileRegression)则利用自变量x和因变量y的条件分位数进行建模。与普通的均值回归相比,它能充分反映自变量X对于因变量y的分布的位置、刻度和形状的影响,有着十分广泛的应用,尤其是对于一些非常关注尾部特征的情况。文章介绍了分位数回归的概念以及分位数回归的估计、检验和拟合优度,回顾了分位数回归的发展过程以及其在一些经济研究领域中的应用,最后做了总结。

关键词:0LS回归;分位数回归;估计;检验;应用中图分类号:0212;F222.3

文献标识码:A

文章编号:1007—3116(2008)03—0089—08

一、引

量的条件分位数对自变量X进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普传统的线性回归模型描述了因变量的条件分布通最小二乘回归只能描述自变量X对于因变量y受到自变量X的影响过程。普通最dx--乘法是估计局部变化的影响而言,更能精确地描述自变量X对回归系数的最基本的方法,它描述了自变量X对于于因变量y的变化范围以及条件分布形状的影响。因变量y的均值影响。如果模型中的随机扰动项来分位数回归能够捕捉分布的尾部特征,当自变量对自均值为零而且同方差的分布,那么回归系数的最不同部分的因变量的分布产生不同的影响时.例如dx--乘估计为最佳线性无偏估计(BLUE);如果近出现左偏或右偏的情况时。它能更加全面的刻画分一步随机扰动项服从正态分布,那么回归系数的最布的特征,从而得到全面的分析,而且其分位数回归dx--乘法或极大似然估计为最小方差无偏估计系数估计比OLS回归系数估计更稳健。

(MⅥ甩)。但是在实际的经济生活中,这种假设常近10多年来,分位数回归在国外得到了迅猛的常不被满足,饲如数据出现尖峰或厚尾的分布、存在发展及应用,其研究领域包括经济、医学、环境科学、显著的异方差等情况,这时的最小二乘法估计将不生存分析以及动植物学等方面(见本文第四部分)。再具有上述优良性且稳健性非常差。最小二乘回归为了说明分位数回归的有用性,我们特介绍两个分假定自变量X只能影响因变量的条件分布的位置,位数回归实证分析的例子。Koenker和Machado分但不能影响其分布的刻度或形状的任何其他方面。

析了1965~1975以及1975~1985这两段时间内世为了弥补普通最dx--乘法(0Ls)在回归分析中界主要国家的经济增长情况。模型选取了13个影响的缺陷,Koenkel"和Pxassett于1978年提出了分位数经济增长的自变量,通过分位数回归得出结论:对于回归(QuantileRegression)的思想…。它依据因变

起初的单位资本产出这一自变量来说,它的全部回

收稿日期:2008—0l一10;修复日期:2008—0l一28

基金项目:教育部人文社科重点研究基地基金项目《中国地区间收入分配差异与劳动力转移的经济增长效应分析》

(07JJD790145);教育部人文社科研究基金项目《数据挖掘中关联规则的统计研究和应用}(2006JA910003)

作者简介:陈建宝(1965一),男。云南曲靖人,澳大利亚科庭理工大学理学博士,厦门大学经济学院计划统计系教授、博士

生导师,厦门大学宏观经济研究中心研究员,研究方向:空间统计学,宏观经济学,数量经济学;丁军军(1980一),男,安徽合肥人,硕士生,研究方向:金融工程和计量经济学。

iYiY

统计与信息论坛

归分位系数基本保持不变,这就意味着对于经济发展迅速与缓慢的国家而言,起初的单位资本产出对于经济增长的影响基本相同;但是教育支出占GDP

的比重以及公共消费占GDP的比重这两个自变量对于经济发展缓慢的国家影响更加的强烈[2l。

Chen使用分位数回归方法深入研究了美国8250名

男性的BMI(身体质量指数,一种广泛用于测量偏

胖还是偏瘦的指标,BMI=体重/身高2)情况,并得

出结论:在2~20岁这一快速成长期中,BMI非常迅速的增加;在中年期间其值保持比较稳定;60岁

以后,BMI的值开始减少…3。这对于如何保持一个健康的身体提供了一种非常有效的措施,可以在各

个阶段中分别采取相应的控制体重的方法。

在概要介绍分位数回归的基本情况后,本文第

二部分介绍分位数回归的概念及其估计性质;第三

部分回顾分位数回归系数的算法,回归系数的检验方法以及拟合优度检验;第四部对分位数回归在实际中的应用。特别是在经济领域的应用做了详细的文献综述;第五部分为结语。

二、分位数回归的概念

如果一个学生在一次体检中,他的身高超过r比例的参加这次体检的学生,而低于1一r比例的参

加这次体检的学生,那么,我们就说他的身高排在全

体参加体检的学生的第r分位。按照这个思想,我们可以得出在参加这次体检的学生中,会有一半学生

的身高超过中位数的值,一半学生的身高低于中位

数的值。同样,四分位是将参考群分为四等分,五分

位是将参考群分为五等分,十分位则将参考群分为

十等分,其他的分位也依次类推。

分位数回归是对以古典条件均值模型为基础的

最小二乘法的延伸,它用几个分位函数来估计整体模型。分位数回归法的特殊情况就是中位数回归(最小一乘回归),用对称权重解决残差最小化问题,而

其他条件分位数回归则需要用非对称权重解决残差

最小化。

定义:设随机变量y的分布函数为F(y)=P(y≤Y),则y的第r分位数为Q(r)=inf{Y:

F(y)≥r},其中中位数可以表示为Q(1/2)。

对于y的一组随机样本{Y1,Y2,…,%},样本

—L

均值是min∑(Yf—e)2的最优解,而样本中位数是

‘=I

最小化残差绝对值和的解,即O(1-/2)=巴i娶∑I

Yi

c℃^i=I

90

一搴I。对于其他的第r分位数,我们可以求解下式:

min口∈矿[∑rmIn口∈矿L厶r

—e一∈I+

I+∑(1一r)I厶【l—r)l

i∈Ii:yi≥¥l

iG

li:丑<eI

一搴门,等价的表示为:mine“(Yi—e),这里…i=1

lD,(z)=rzI[o。。)(z)一(1一r)zl(--OOto)(z),其中,(・)为示性函数。对于一般线性条件均值函数

E(y

X=z)=z≯,通过求解p=

』l’

argmin口∈矿∑(Yi—x’Z3)2得到参数估计值。而一般

i=I

线性条件分位数函数为Q(r

X=z)=z≯(r),

—L

通过求解p(r)=argmin#eF∑(Yi—z7乒)得到参

i=l

数估计值。对于任意的r∈(o,1),参数声(r)称为第

r回归分位数。

分位数回归采用加权残差绝对值之和的方法估计参数,其优点体现在以下几方面:首先,它对模型中的随机扰动项不需做任何分布的假定,这样整个回归模型就具有很强的稳健性;其次,分位数回归本身没有使用一个连接函数来描述因变量的均值和方差的相互关系,因此分位数回归有着比较好的弹性性质;第三,分位数回归由于是对所有分位数进行回归,因此对于数据中出现的异常点具有耐抗性;第四,不同于普通的最小二乘回归,分位数回归对于因

变量具有单调变换性;最后,分位数回归估计出来的

参数具有在大样本理论下的渐进优良性…。

三、分位数回归模型的估计与检验

明显地,分位数回归模型中的参数估计,区间

估计,分位数回归系数假设检验以及拟合优度检验方法要比传统的线性回归模型中相应问题的求解要复杂得多。下面简要归纳介绍这些方法,详细内容见相关参考文献。

(一)参数估计

目前,分位数回归大致可以分为参数回归模型、

非参数回归模型、半参数回归模型这三类,每种模型都有其各自的估计方法。

1.参数回归模型

该回归模型的方程为:Y=邵+E,其中£为随

机变量。为了分析自变量X对因变量y在其各分位

数r的影响,我们需要求解

声(r)=argmin#Ep∑Pr(Yi—x'Z3)

(1)

j=I

其中P。(z)=戎J[o.。)(z)一(1一r)zI(一oo。o)(z)。

(1)式等价于求解一个线性规划问题

陈建宝,丁军军:分位数回归技术综述

Max{y'z

X乞=(1一r)X'e,z∈[0,1]“}(2)

其中e为单位向量。这样问题转化为对(2)式的求

解,目前对(2)式的算法主要有如下几种:

(1)单纯形算法(SimplexMethod)

Koenker和Orey[4](1993)把分两步解决最优化问题的单纯形算法(见lMrrodale&R0berts【5],1973)扩展到所有回归分位数中。该算法估计出来的参数具有很好的稳定性,但是在处理大型数据时运算的速度会显著的降低。

(2)内点算法(Interior

Point

Method)

由于单纯形算法在处理大型数据时效率低下,Karmarker便提出了内点算法[61;Portnoy和Koenker把这种方法使用在分位数回归中,得出了在处理大型数据时内点算法的运算速度远快于单纯形法的结论[7l。但是内点算法也有自身的缺陷,它在每一步计算时都要进行因数分解,当自变量比较多的时候效率比较低;其次,如果要达到和单纯形算法一样的精确度,就必须进行舍入步骤的计算,这也降低算法的运行效率。

(3)平滑算法(SmoothingMethod)

上述两种算法都有各自的优点和不足之处,而有限平滑算法则是一种同时兼顾运算效率以及运算速度的方法。Madsen和Nislsen使用这种算法于最小一乘回归上(中位数回归)[8],Chen把这种算法扩展到计算回归分位数中[9I。平滑算法用一个平滑函数来逼近(1)式,因此牛顿一拉尔夫方法可以反复地使用,这样经过有限步以后就能获得参数解。

上述三种算法相辅相成,虽然单纯形法在处理

大型数据时效率很低,但是估计出来的参数具有很

好的稳定性,尤其是当数据中存在大量杠杆点和野

值时,单纯形法可以计算出参数解,而这时其他两种算法都可能失败。内点算法对于那些具有大量观察值和少量变量的数据集运算效率很高。平滑算法在理论上比较简单,它适合处理具有大量观察值以及很多变量的数据集。Chen结合这三种算法提出了

一种自适应算法L9|。

2.非参数回归模型

Yu和Jones提出了一种估计条件分布的方

法【1们。例女口’.--IV2用F(y

27)=∑三1∞f(27)I(yi

<y)来估计条件分布函数F(y

z),其中,-Oi(37)为

权重,满足r-Oi(37)≠0且∑;I-,∞i(37)=1,I(yi<

y)为示性函数。但是,这种使用核加权估计的条件分布有些缺陷:首先它不是一个分布函数,因为它不

是一个单调函数并且它的取值范围不在[0,1]内。

人们

避熹辫…“Y71

户(y

37)

∑川i

P(27)Kh(37f一27)1……一一

X),其中Kh(五一z)=K(竿)为核密度函数,

Pi(z)≥0,∑二,Pi(z)=1,∑三,Pi(z)(而一

z)Kh(矗一z)=Oo第二个问题是依据这种方法估

计出来的分位数回归曲线可能会出现交错的现象,于是Yu和Jones提出一种双核方法,用P(y

27)=

∑三,叫i(z)力坦-≯来估计F(z

y),其中n(q)

=I

W(v)dv为密度函数w(越)的分布函数[10]。

3.半参数回归模型

Green和Silverman讨论了半参数回归模型的估计[11】,一般的在半参数模型中假定因变量y的条件分位函数qr依赖于自变量x以及函数g(t):

q。=zp+g(t)

(3)

可以通过求解下面的最小化问题来估计参数卢和

g(t):

∑三,P,{E—z寥一g(£)}十ol,(f)2dt

(4)

Koenker,Ng和Portony研究了一个算法来计算(4)式[12】。

另外,Yu提出了两阶段法【13】,该方法没有对(2)式求解,它使用一种由Bhattacharya和Gala—gopadhyay提出的五值逼近理论来求解回归分位系数[14】。第一步对样本按照自变量x排序,得到数据

集{(毛,Yi)}iI。然后给定r,对数据集{(墨+H,Yi+j一1)}f(歹=1,2,…,,z—k一1,五=

max{譬,}兰},r。,r2分别为r的最小值和最大maxli,再f,r1,分另u刀r明最爿、但利最大

值)使用k值逼近来估计第r个回归分位系数q,(z)。第二步对于由上步估计出来的咒一k一1个

回归分位系数口。(z)使用最小二乘核平滑得到最终的回归分位系数估计值。

对于回归分位系数置信区间的估计方法依据目前的文献也可以分为三种,下面分别加以介绍:

(1)直接估计法(Direct

Estimation

Method)

该方法依据估计出来的回归分位系数的渐进正态性来计算置信区间。比较有代表性的是Sparsitv算法,它是一种最直接并且运算速度也是最快的算法,假定随机项为独立同分布且分布函数为F,密度

统计与信息论坛

№tt[1】(1982)得出了:

函数f=F7且f(F’1(r))>OoKoenker和/磊(p(r)一声(r))一N(O,∞2(f,F)O一1)

(5)

其中叫2(r,F)=3(1一r)俨(F-1(f)),n=

lira以.1∑X;X7io因此我们就可以用(5)式来计算出

回归分位系数的置信区间,但是我们先要估计出Sparsity函数,该函数为密度函数的倒数s(r)=[f(F-1)(r))]一。Sparsity函数的估计值对于随机

项为独立同分布这一假设十分敏感,如果随机项不

满足独立同分布那么这个估计值就是非稳健。为了解决这一问题,Koenker和Machado[2](1999)考虑了随机项为非独立同分布的情况,并提出了局部密度函数的估计方法。

(2)秩得分法(Rank

Score

Method)

Koenker提出了秩得分算法,该算法是对秩得分检验的延伸[15]。首先求解Max{Y—X2叩),口lX71口=(1一£)x7∥,口∈[0,1]”}。得到秩得分函数占。(t)={三。l(t),…,占。。(£)},其中可为线性模型y=X1p1+X2忽+£中系数皮的显著性检验:』9(r)=17。求第r分位数的秩得分函数占碰(t)的积分得到红(£)=r—f(£<r),从而得出第r个分位数的和

广l

占。{=一f.红(£)荔。i(r)=三耐(r)一(I—r),然后令

oU

L(7)=7i1

.S。(叩)n:1/'2(其中Sn(17)=

r~上一‘,

r/-1/2X'2b。(叩)一N(0,r(1一r)亿),n。=

n-IX72(f—Xl(X7lXl)_1X71)x2),赋予Tn一个阈值,随着刁的改变计算t(可)直到其值超过该阈值,这样就可以通过插值的方法得到回归分位系数的置信区间。秩得分法算法比较简单,但是对于大型数据处理效率较慢。

(3)重复抽样法(Resamplingmethod)

重复抽样法使用Bootstrap算法,它可以从残差中抽样也可以从数据{墨,沈}抽样。KoenkeIll5】(1994)提出了HeqfBootstrap算法,该算法直接从整个分位数回归过程中重复抽样。Parzen,Wei以及Ying使用另一种更简单的Bootstrap算法,当数据中出现异方差时能够计算出稳健的参数估计量Ll61。这些算法对高维的大型数据运算时需要花费很长的时间。H毛和Hu提出了一种新的重复抽样法,该方法使用了MCMB(Markov

ChainMarginal

Bootstrap)算法,这种算法能够进行高效率的运算,大大节省了运算时间(17]。重复抽样法能够克服直

92

接法和秩得分法的缺陷,但是对于小样本时计算出的参数估计值不够稳定。

综上所述,无论是参数的点估计还是区间估计,每种方法都有自身的优势也有自身的不足之处,因此还有很大的空间去研究出一种最优、可信并且运算效率高的算法。

(二)参数显著性检验考虑分位数回归模型:

Yi

Xil向+xf2f12+ui

(6)

其中“i来自独立同分布,其分布函数为F,使为q维回归系数,p=(J91,皮)。对于假设检验H0:使(r)=0,常用的是Wald检验与似然比检验。Wald

检验主要定义统计量L(z.)=口72(r)艺

(r)-1忽(f),其中艺(r)=与(r)2n22,为恕(r)

的协方差估计量,0(r)=/习两;(r),;(r)为

上文中Sparsity函数的估计值,n22=(n22—02lnll-Inl2)~,Dd为参数估计的协方差阵中的对

应元素;后者首先要分别计算Do(r)=∑陆(M—z乒(r))和Dl(r)=∑A(M—z1扫l(r)),再定义

统计量‰(r)=2(r(1一r);(r))。(D1(f)一

Do(r)),Koenker与Machado[2](1999)证明了这两

种检验统计量瓦,(r)和了k(f)在原假设下都服从

z:,这样便可以检验回归系数的显著性。

(三)拟合优度

Koenker与Machado[2](1999)依据最小二乘回归中拟合优度R2的计算思想,提出了分位数回归中

拟合优度的计算方法,定义为RI(r)=1一茜事警,

很明显D1(r)≥Do(r),因此0≤R1(r)≤1。最小二乘回归中的R2依据残差平方和度量了回归平方和占总离差平方和的比重,而R1(r)则按照残差绝对值的加权和,度量了在某个分位数下分位数回归的拟合效果。因此不像R2反映的是整个分布的拟合情况,R1(r)描述的是在某个分位数下的局部拟合效果。

以上计算方法基本上都是通过迭代法来完成。但大多数方法的实现都可以使用现成的软件包。目前计算分位数回归的统计软件主要有Stata、Sas(详见support.sas.com)以及R(详见Ⅵ兀wr.e(:on..uiuc.edu/roger/research/rq/rq.htmI)o

四、分位数回归的应用

与传统的OLS回归相比,由于分位数回归所具

陈建宝,丁军军:分位数回归技术综述

有的显而易见的优点,近10多年来,分位数回归的

理论和方法在各个领域中都得到了非常迅速的发展,Koenker和Hallock对于分位数回归的稳健性、变量的异方差性和样本的选择方面以及分位数回归在二元响应模型、久期模型、面板数据、时间序列、极值理论、非线性模型、非参数模型和多元分析中的发展做了精彩的回顾[18]。分位数回归的应用也十分.广泛:在环境科学方面,Chock,Winkler和(;hen使用非参数分位数回归法研究了匹兹堡这座城市中日死亡率和空气污染集中度的相互关系[19],Hilary和Andrzej运用分位数回归对天气数据进行了分析【驯;在生态学方面,Koenker.和Schorfheide分析了上世纪全球气候改变的过程[21】,Dunham,Cade和Terrell研究了不同的河流对鲑鱼密度的影响[221;在生存分析方面,Koenker和Hallock【18J(2001)研究了

诸多因数对于新生儿出体重的影响;Cole和

Green[23】以及Royston和~tn】an[24]还讨论了分位数回归在医学上的应用。

下面我们主要介绍分位数回归在经济领域中的应用。

在劳动力市场方面,Buchinsky研究了美国的劳动力市场[25];Schultz和Mwabu研究了南非的劳动力市场[26];Montenegro分析了智利的情况[27】;

Fithzenberger和Kurz,Fithzenberger、Hujer、Macur—

dy和Schnabe讨论了德国劳动力市场的情况[28—29】;值得一提的是Machado与Mata扩展了Oaxaca的分解法,并提出了一种依据分位数回归过程来模拟边际分布的方法来研究葡萄牙的劳动力市场m1;Yu,Philippe和Zhang使用贝叶斯分位数回归研究了英国1991~2001年间的工资结构的分布情况【31o;Angrist,Chemozhukov和Fernandez一、d使用分位数回归方法研究了美国的工资结构的分布情况[32】;Papapetrou则研究了希腊公私企业中的工资差距情况【33J。

Deaton对于分位数回归在需求分析方面上的应用做了介绍,并分析了巴基斯坦的Engel曲线L343;Hendricks与Koenker使用分位数回归研究了电力消费需求情况[351;Manning、Blumberg和

Moulton讨论了酒精使用的需求隋况[36I。Taylor运

用指数加权分位数回归来预测超级市场的日销售情况[37]。

收入不平等问题是分位数回归的另一个研究方面。Gosling、Machin和Meghir研究了英国家庭的收入和财富的分布状况m1;Conley和Galenson探讨了

美国的几个城市在19世纪中期财富的累积情况【驯;Trede和Morillo比较了美国与德国的收入机动性[40一411。

分位数回归目前在金融方面的应用主要在两个

方面。金融资产组合方面:B司ssett和Chert运用分

位数回归来评估共同基金的投资类型[42-431;Barnes和Hughes研究了美国资本市场的CAMP模型[441;Ma和Pohlman运用分位数回归讨论了资产收益预

测与最优资产组合的构造[45]。金融风险方面:在金

融市场的风险管理中,VaR已经成为其标志性指标。VaR能够将金融机构面临的所有种类各异、形式多样的风险加总成为一个简单的数字。它是指某个特定的头寸或组合,在给定的持有期内以及给定的置信水平上,金融机构所面临的最大损失,例如组合价值的5%的分位数可以看成是组合将要面临的最大损失。更一般的,记y表示组合的市场价值,y的第r分位数记为Y满足P(Y≤y)=r,这时称Y为1一r水平下的风险值。计算VaR的方法很多.但都有特定的假设条件和适用范围,因此Engle和Manganelli首次在VaR的基础上提出了条件VaR

模型(CAVi出),并使用分位数回归的方法来估计参

数,通过对数据的模拟得出了这一模型对于厚尾数据的表现为最优的结论[46】;Taylor使用分位数回归

的方法来估计多期收益的风险值VaR[47】;(;her—

nozhukov和Umantsev使用分位数回归深入研究了CVaR的模型与估计方面的问题[48】;Chell和Chen分别用分位数回归方法和方差一协方差法计算日经225指数的VaR值,实证结果为前者很大程度上优于后者【491;Georgios和Leonidas使用CAViaR模型估计了美国和希腊证券市场中的市场风险值[501。

五、结语

分位数回归思想的提出至今已经有近30多年

了,经过这近30多年的发展,分位数回归在理论和

方法上都越来越成熟,并被广泛应用于多种学科中。它对于实际问题能提供更加全面的分析,无论是线性模型还是非线性模型,分位数回归都是一种很好

的工具,它对一般回归模型做工有益的补充。尽管

如此,分位数回归在理论和方法上依然还有很大的提升空间,例如分位数回归在多元分析方面的发展就很不成熟,Koenker和Hallock已有专文论述[51]。在应用方面,特别是在金融方面的应用才刚刚起步。有兴趣对分位数回归做进一步了解和研究的学者可以参考本文列出的相关参考文献。

93

统计与信息论坛

中国目前在分位数回归这一领域上的研究还比理论、方法和应用研究。我们相信将分位数回归应

用于中国社会、经济各个领域的相关数据分析必能

较滞后,研究成果较少,只有少数几篇文章发表。本文的目的在于引起更多国内学者关注分位数回归的

得出更多有用的信息。

参考文献:

[1]Kodlkel"R,BasseRGW.Regressionquantiles[J].Eccagxlletrica,1978,46:33—50.[2]KoenkerR,Machado

—1310.

F.C_gx蛔of

nlass

fitandrelatedinferenceprocessesforquantfleregression[J].JASA,1999。94:1296

[3]ChertC.Growthchs.rtsofbody[4]KoenkerR,OreyD.Computing[5]Ba/'rodaleI,Roberts

839—848.

index(BMI)withquantileregression[R].MS.2004.

quantiles[J].AppliedStatistics。1993,43:410—414.

regression

FDK.An

improvedalgorithmfordiscrete11linearapproximation[J].SIAMJ.Numer.Anal.,10:

KamuarkerN.Anewpolynonaialtimealgorithm

linearprogranmfing[J].Combinatorica,1984,4:373—395.

陆口,,

Portnoy

S。KoenkerR.TheGat塔sianhareandtheLaplacianTortoise:computabilityofsquared—error

vea's1J¥absolute—a材

estimators[J].Stat.,Science,1997,12:279—300.陋,

MadsenK。NielsenHB.Afinitemaoothing235.

algorithmfor

linerL1

estimation[J].SIAMJ.Optimization,1993,3:223—

p,

ChenC.An

PisonYu

adaptive

algorithm

forquantileregression[C]//ThoeryandApplicationsofRecentRobustMethods.HubertM。

G,S咖yfA,VanSAelst,Series:StatisticsforIndustryandTechnology,Birkhauser,Basel,2004,39—48.

K。JonesMC.Locallinearquantileregression[J].JASA,1999,90:1257—1270.

.=Ⅱ们I=.GreenPJ。Silven-nanBW.Nonparametricregressionandgeneralizedlinearmodels:aroughnesspenaltyapproach[M].ChapmanHall.NewYork,1994.

nH纠卯n们

KoenkerR,NgP,PortnoyS.Quantilesmoothingsplines[J].Biometrika,1994,81:673—680.

Yu

K.Smoothingregressionquantilebycombiningk—NN

estimation

withlocalkernelfitting[J].StatisticaSinica,1999,

9:759—774.

BhattacharyaPK,GangopadhyayAK.Kernelandnearestneighbourquantileregressionmodel[J].Ecor,ometrica,1990,66:627—651.

n纠

KoenkerR.Cxdidenceintervalsforquantileregression[M].InAsymptoticStatistics:Proceedingofthe5thPragueSympo-slum

on

AsymptoticStatistics.Editedby

M.Huskova,Physica一№,1994.

OFl

l=印

ParzenMI,WeiLJ,YingZ.Aresamplingmethodbased350.

pivotal

estimatingfunctions[J】.Biometrika,1994,81:341—

nnn刀印明

HeX,HuF.Markovchainmarginal[botstrap[J].JASA,2002,97:783—795.

KoenkerR。HallockK.Quantileregression:anintroduction[J].JournalofEconomicPerspectives,2001,15:143—156.ChockDP,WinklerSL,ChenC.Astudyoftheassociationbetweendailymortalityandambientairpollutantconcentrations

in

Pittsburgh,Pennsylvania[J].Journalof

theAirand

WasteManagefnentAss—ation,2000,50:1481—1500.

眨们

HilaryMG,AndrzejSK.Modellingweatherdatabyapproximateregressionquantiles[J].ANIZIAMJ.,2003,44(E):229—248.

KonekerR。Scl'Ka'fheideF.Quantile

splinen矧elsforglobaltemperaturechange[J].ClimateChange,1994,28:395—404.

oftheAmerican

眨眨¨纠

DunhamJB,CadeBS,TerrellJW.Influencesofspatialandtefnporalvariationon凰h—habitatrelationshipsdefinedby

regression

quantiles[J].Transactions

FisheriesSociety,2002,131:86—98.

[23]

ColeT

J,GreenPJ.Smoothingl'efe/'enceeentilecurves:the

LMS

methodandpenalizedlikdilxxxt[J].Statisticsin

Medicine,1992,11:1305—1319.

[24]

RoystonP,AltmanDG.Regressionusingfractionalpolynomialsforcontinuouscovariates:parsimoniousparametricmodelling(with

discussion)[J].AppliedStatistics,1994,43:429—467.

[25]BuchinskyM.ChangesinUSwagestructurel963—1987:anapplicationofquantileresression[J].Econometrica,1994・62:

405—458.

[26]

94

SchultzT,MwabuG.LabourunionsandthedistributionofwagesandemploymentinSouthAfrica[J].IrA.andLalx)rRela一

陈建宝,丁军军:分位数回归技术综述

tionsRev.,1998,51:680—703.

[27]MontenegroC.nest_tutti/reofwagesin

1998,25:71—98.

Chile1960—1996:an-applicationofquantileregression[J].EstudiosdeE唧10fnja,

[28]Fitzenberger

B,Kurz

C.Newinsiighta

on

earnings

trendsacrossskill

groupsandindustriesin

w笛tGemmny[J].Empirical

Economics。2003,28(3):479—514.

[29]FitzenbergerB,HuierR,MaCurdyT,Sehmbel

R.Testing

usingquantileregressionsforcensoreddata[J].Empirical

Ec删cS,2001,26(1):41—86.

to

foruniformwagetrendsinwest—Germany:Acohortanalysis

[30]MachadoJAF,MataJ.Counterfactualdeconapositionofchangesinwagedistributionsusingquantileregression[J].JournalofAppliedEconometrics2005,4:445—465.

[31]Yu

K,PhilipeG,Zhang

J.Bayesianquantileregression:孤appicationthewagedistributionin1990sBritain[J].

Sankhya,2005,67:359—377.

[32]AngristJ,ChernozhukovV,Fernandez一砌I.Quantihregression

wage

under

misspecification,with

all

applicationtotheU.S.

structure[J].Econometrica,2006,74(2):539—564.

unequaldistribution

[33]PapapetrouE.Theofthepublic—private

sector

wagegapin

Greece:evidencefromquantile

regression

[J].AppliedEconomicsLetters,2006,13(4):205—210.[34]D∞tonA.The

analysisof

Ixxtsehold

surveys:a

microeconometric

approach

todevelopmentp。l研[M].Johns

Hopkins

ⅧversityPress,Baltimore,MD。1997.

[35]HendricksW,KoenkerR.Hierarchicalsplinemodelsforconditional

1991,87:58—68.

quantilesand

thedmaandforelectricity[J].JASA,

[36]ManningW,BlumbergL,Moulton

L.Thedemand

foralcohol:thedifferentialresponse

to

E珊mi∞,1995,14:123—148.

Operational

price[J].Journal

ofHealth

[37]TaylorJ.Forecastingdailysupemaarket

salesusingexponentiallyweightedquantileregression[J].EuropeanJournalof

Research,2007,178:154—167.

since

[38]GoslingA,MachinS,MeghirC.whthashappenedtothewagesofmen

ChangingDistributionofIncomeandWealthintheUnitedKingdom.1996.[39]ConleyT,Galemon

468—493.

D.Nativityandwealthin

19667[C]//HillsJ.NewInequalities:the

mid—nineteenth—centurydties[J].JournalofEconomicHistory,1998,58:

[40]TredeM.Makingmobilityvisible:agraphicaldevice[J].[41]MorilbD.Incomemobility谢t}lnonparametriequantiles:

2000.

E00nomi曙Letters,1998,59:77—82.

comparisonoftheU.S.andGermany[R].Workingpaper。

[42]

Bassett

G,ChenH.Quantilestyle:quantilesto

on

ass瞄mutual

fundinvestmentstyles[R].Presented

atthe

International

Conference

EconE疆nie

ApplicationsofQuantileRegression,Komtanz,2000.

[43]BassettG,ChenH.Quantilestyle:retLLrn—basedattributionusingregressionquantiles[J].EmpiricalEconomics,2001。26:

7—40.

[44]Ba_rllesM,HughesA.A

quantileregressionanalysis

of

the嘲sectionofstockmarketreturn[R].Workingpaper,Federal

ReserveBankofBoston,2002.

[45]Ma1,PohlmanL.Return

paper

forecastsand

optimalportfolioconstruction:aquantileregressionapproach[R].SSRNWorking

880478,2005.

at

[46]

EngleRF,ManganelliS.CAViaR:conditionalautoregressivevalueandEconomicStatistics,2004,22:367—381.

riskbyregressionquantiles[J].JournalofBusiness

[47]TaylorJ.Aquantile

regreSsionapproach

to

qstimatingthedistributionofmulti—periodreturns[J].JournalofDerivatives,

1999(蹦1):64—78.

[48]Chernozhukov

V,Umantsev

L.Conditionalvalue

at

risk:aspectsofmodellingandestimation[J].EmpiricalEcononics,

2001。3:271—292.

[49]ChenMY,(3henJE.Statisticalinferences[50]GeoriosK,Leonidasz.Conditional

International

inquantileregression

models:primalanddualaspects[R].Manuscript,2001.

autoregressioninFinancial

quantiles:estimatingmarketriskformajorstockmarkets[C].TheSecond

Symlx葛ium“Advances

Forecasting”,2005.

[51]KoenkerR,Hallock

F.Quantileregression:anintroduction[J].JournalofE(x)lKlllicPerspectives,2001,15:143—156.

95

统计与信息论坛

[52]KoenkerR.Quantileregression[M].Cambridge:CambridgeUniversity[53]ChenC,WeiY.Computation[54]Yu

350.

K,Luz,Stander

issues

P煅,2005,London.

area[J].The

Statistician,2003,52:331—

onquantileregrl函orl[J】.Sankhya。2005,67:399—417.

current

J.Quantileregression:applicationsand

research

(责任编辑:张治国)

AReviewofTechnologies

on

Quantile

Regression

CHENJian—bao。DINGJun-jun

(Maeroeconc疵csResearchCenter,Xiamen

the

University,Xiamen361005,Fujian)

vector

Abstract:Ordinaryleastsquare(OLS)regressionmodelstherelationshipbetween

ofcovariateand

conditionalmo_弛_rlof

responsegiven.However,quantileregressionmodelstherelationship

between

covari・

ateandtheconditional

quantilesofgiven.Takentogethertheensembleofestimated

on

conditional

quantileoffers

muchmorecompleteviewoftheeffectofcovariatesthelocation。scaleandshapeofthedistributionofthe

ale

re—

sponsevariable.Itresponse.In

this

isespeciallyusefulinapplicationswherepeople

wefirst

interested

in

upper

or

lowerquantilesof

paper

introduce

theconceptof

quantileregression,thenprovidesomebrief

methods

ofappli—

aboutestimation,hypothesistestsandgoodness—of—fitofquantileregression,some

important

aspects

cationsineconomics

are

reviewed,asummaryisgiveninthefinalsection.

testing;application

Keywords:OLSregression;quantile

regression;estimation;hypothesis

(上接第83页)

[23][24]

StulzRM.Managerialcontrolofvotingrights:financingpoliciesandthemarketforcorporatecontrol[J].Journalof

Financial

Egg)lx3mics,1988,20(1/2):25—54.

FlaggJC,GirouxGA,WigginsCE.Predictingcorporatebankruptcyusingfailingfirms[J].ReviewofFinancial

Economics。1991,1(Fall):67—79.

[25]

HillNT,Perry

SE,AndesS.Evaluatingfirmsinfinancialdistress:锄eventhistoryanalysis[J].JournalofApplied

&】Sin瞄Research,1996,12(3):60—71.

(责任编辑:崔国平)

AnEmpiricalStudy

on

FinancialDistressPredictionBased

on

CorporateGovernance

(Schoolof

E∞删cs,Xialnell

GUOHui—hong,ZHOUYong-qiang

University,Xiamen361005,China)

Abstract:Statisticallydisposingcorporatefinancialinformationandgovernanceingredientinvirtueoffactor

analysisand

paired—sample

test

respectively,thepaperdevelopsandempiricallytests

two

Logisticregression

models

for

indicators

predictingfinancialdistressinChina’Slistedcompanies,i.e.modelwhichjustincludefinancialandmodelwhichsyncretizefinancialindicatorsandcorporategovernanceindicators.Thestudyfinds

are

thatthecorporategovernanceindicatorsprominentlyrelatedto

one.

financial

distress;moreover。the

model

in—

cludingcorporategovernanceindicatorsdominatestheother

Key

words:financialdistress;corporategovernance;factoranalysis;Logistic

regression

分位数回归技术综述

作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:

陈建宝, 丁军军, CHEN Jian-bao, DING Jun-jun厦门大学,宏观经济研究中心,福建,厦门,361005统计与信息论坛

STATISTICS & INFORMATION FORUM2008,23(3)9次

参考文献(54条)

1. Papapetrou E The unequal distribution of the public-private sector wage gap in Greece:evidencefrom quantile regression 2006(04)

2. Angrist J;Chernozhukov V;Fernandez-val I Quantile regression under misspecification,with anapplication to the U.S.wage structure[外文期刊] 2006(02)3. Koenker R;Orey D Computing regression quantiles 1993

4. Georios K;Leonidas Z Conditional autoregression quantiles:estimating market risk for major stockmarkets 2005

5. Chen M Y;Chen J E Statistical inferences in quantile regression models:primal and dual aspects2001

6. Chernozhukov V;Umantsev L Conditional value at risk:aspects of modelling and estimation 20017. Koneker R;Schorfheide F Quantile spline models for global temperature change[外文期刊] 19948. Hilary M G;Andrzej S K Modelling weather data by approximate regression quantiles 2003(E)9. Chock D P;Winkler S L;Chen C A study of the association between daily mortality and ambient airpollutant concentrations in Pittsburgh,Pennsylvania 200010. Koenker R;Hallock K Quantile regression:an introduction 200111. Chen C An adaptive algorithm for quantile regression 2004

12. Madsen K;Nielsen H B A finite smoothing algorithm for liner L1 estimation 1993

13. Portnoy S;Koenker R The Gaussian hare and the Laplacian Tortoise:computability of squared-errorversus absolute-error estimators 1997

14. Karmarker N A new polynomial time algorithm for linear programming 1984

15. Barrodale I;Roberts F D K An improved algorithm for discrete l1 linear approximation16. Yu K;Lu Z;Stander J Quantile regression:applications and current research area 200317. Chen C;Wei Y Computation issues on quantile regression 200518. Koenker R Quantile regression 2005

19. Koenker R;Hallock K F Quantile regression:an introduction 2001

20. Taylor J A quantile regression approach to qstimating the distribution of multi-period returns1999(03)

21. Engle R F;Manganelli S CAViaR:conditional autoregressive value at risk by regression quantiles[外文期刊] 2004(4)

22. Ma l;Pohlman L Return forecasts and optimal portfolio construction:a quantile regressionapproach[SSRN Working paper 880478] 2005

23. Barnes M;Hughes A A quantile regression analysis of the cross section of stock market return 200224. Bassett G;Chen H Quantile style:return-based attribution using regression quantiles 200125. Bassett G;Chen H Quantile style:quantiles to assess mutual fund investment styles 2000

26. Morillo D Income mobility with nonparametric quantiles:a comparison of the U.S.and Germany 200027. Trede M Making mobility visible:a graphical device[外文期刊] 1998

28. Conley T;Galenson D Nativity and wealth in mid-nineteenth-century cities 199829. Gosling A;Machin S;Meghir C What has happened to the wages of men since 1966? 1996

30. Taylor J Forecasting daily supermarket sales using exponentially weighted quantile regression[外文期刊] 2007(1)

31. Manning W;Blumberg L;Moulton L The demand for alcohol:the differential response to price 199532. Hendricks W;Koenker R Hierarchical spline models for conditional quantiles and the demand forelectricity 1991

33. Deaton A The analysis of household surveys:a microeconometric approach to development policy 199734. Chen C Growth charts of body mass index (BMI) with quantile regression 2004

35. Koenker R;Machado A F Goodness of fit and related inference processes for quantile regression1999

36. Yu K;Philipe G;Zhang J Bayesian quantile regression:an appication to the wage distribution in1990s Britain 2005

37. Machado J A F;Mata J Counterfactual decomposition of changes in wage distributions using quantileregression [外文期刊] 2005(4)

38. Fitzenberger B;Hujer R;MaCurdy T;Schnabel R Testing for uniform wage trends in West-Germany:Acohort analysis using quantile regressions for censored data 2001(01)

39. Fitzenberger B;Kurz C New insights on earnings trends across skill groups and industries in WestGermany 2003(03)

40. Montenegro C The structure of wages in Chile 1960-1996:an application of quantile regression 199841. Schultz T;Mwabu G Labour unions and the distribution of wages and employment in South Africa 199842. Buchinsky M Changes in US wage structure 1963-1987:an application of quantile resression 199443. Royston P;Altman D G Regression using fractional polynomials for continuouscovariates:parsimonious parametric modelling (with discussion) 1994

44. Cole T J;Green P J Smoothing reference centile curves:the LMS method and penalized likelihood[外文期刊] 1992

45. Dunham J B;Cade B S;Terrell J W Influences of spatial and temporal variation on fish-habitatrelationships defined by regression quantiles[外文期刊] 2002(1)46. He X;Hu F Markov chain marginal Bootstrap 2002

47. Parzen M I;Wei L J;Ying Z A resampling method based on pivotal estimating functions 199448. Koenker R Confidence intervals for quantile regression 1994

49. Bhattacharya P K;Gangopadhyay A K Kernel and nearest neighbour quantile regression model 1990

51. Koenker R;Ng P;Portnoy S Quantile smoothing splines 1994

52. Green P J;Silverman B W Nonparametric regression and generalized linear models:a roughnesspenalty approach 1994

53. Yu K;Jones M C Local linear quantile regression 1999

54. Koenker R;Bassett G W Regression quantiles 1978

本文读者也读过(10条)

1. 李育安. LI Yu-an 分位数回归及应用简介[期刊论文]-统计与信息论坛2006,21(3)

2. 吴建南. 马伟. WU Jian-nan. MA Wei 估计极端行为模型:分位数回归方法及其实现与应用[期刊论文]-数理统计与管理2006,25(5)

3. 刘生龙 教育和经验对中国居民收入的影响——基于分位数回归和审查分位数回归的实证研究[期刊论文]-数量经济技术经济研究2008,25(4)

4. 关静 分位数回归理论及其应用[学位论文]2008

5. 韩月丽 极值统计与分位数回归理论及其应用[学位论文]2009

6. 陈娟. 林龙. 叶阿忠 基于分位数回归的中国居民消费研究[期刊论文]-数量经济技术经济研究2008,26(2)

7. 齐晓丽. 徐晓明 基于面板数据的分位数回归及实证研究[期刊论文]-科学时代(上半月)2010(3)

8. 张利 线性分位数回归模型及其应用[学位论文]2009

9. 齐晓丽. 金善女. 梁慧超. 连建新. QI Xiao-li. JIN Shan-nü. LIANG Hui-chao. LIAN Jian-xin 基于面板数据的分位数回归及实证研究[期刊论文]-河北工业大学学报2010,39(3)

10. 孙文杰. 沈坤荣. Sun Wenjie. Shen Kunrong 技术引进与中国企业的自主创新:基于分位数回归模型的经验研究

[期刊论文]-世界经济2007,30(11)

引证文献(12条)

1. 潘美玲 金融发展对外商直接投资经济增长效应的比较分析——基于面板分位数回归技术[期刊论文]-生态经济2011(12)

2. 朱慧明. 王彦红. 曾惠芳 基于逆跳MCMC的贝叶斯分位自回归模型研究[期刊论文]-统计与信息论坛 2010(1)

3. 付月. 金英姬. 姜今锡 基于MM算法的分位数计算方法[期刊论文]-延边大学学报(自然科学版) 2010(2)

4. 齐晓丽. 徐晓明 基于面板数据的分位数回归及实证研究[期刊论文]-科学时代(上半月) 2010(3)

5. 吴拥政 区域金融发展与经济增长的实证分析——基于中部六省地级市区数据与分位数回归方法[期刊论文]-经济研究导刊 2010(12)

6. 焦元 上海证券市场稳定性检验——分位数回归方法的一个应用[期刊论文]-统计科学与实践 2010(12)

7. 陈胜蓝 上市公司盈余管理与高管薪酬实证研究——基于分位数回归的分析[期刊论文]-广东技术师范学院学报2009(4)

8. 陈建宝. 杜小敏. 董海龙 基于分位数回归的中国居民收入和消费的实证分析[期刊论文]-统计与信息论坛 2009(7)

9. 李超 我国固定资产投资的分位数回归解析[期刊论文]-北方经济 2009(24)

10. 王如丰 利率对汇率变化反应了吗?——基于开放经济下泰勒规则的分位数回归[期刊论文]-财贸研究 2009(6)

11. 李智. 韩学山. 杨明. 钟世民 基于分位点回归的风电功率波动区间分析[期刊论文]-电力系统自动化 2011(3)

12. 焦元 上海证券市场稳定性检验——分位数回归方法的一个应用[期刊论文]-统计科学与实践 2010(12)

本文链接:http://d.g.wanfangdata.com.cn/Periodical_tjyxxlt200803018.aspx


相关文章

  • 航空公司收益管理研究综述
  • 第24卷第5期 中国民航学院学报 JOURNALOFCIVILAVIATIONUNIVERSITYOFCHINA Vol.24No.5October,2006 2006年10月 航空公司收益管理研究综述 樊 玮a,吴桐水b (中国民航大学a ...查看


  • 国际呼吸杂志
  • 国匾堕咝盘查!!!!至!旦箜!!鲞星!塑!翌!』垦竺£生!』!!塑!z!!!!!∑皇!:!!:型旦:!・63・<国际呼吸杂志>稿约 <国际呼吸杂志>(原名<国外医学呼吸系统分册>)为卫生部主管,中华医学会 ...查看


  • [中国医药导报]投稿须知
  • <中国医药导报>投稿须知 1. 字数 要求省部级及以上基金论文6500-8500字符,论著.综述8500-10500字符,其他论文8000-8500字符为宜.上述字符数均含空格. 2. 文题 题名要简明确切,能反映文稿的中心内容 ...查看


  • 我国股指期货价格发现功能研究
  • 第29卷第5期2012年5月统计研究 StatisticalResearchVol.29,No.5May.2012 我国股指期货价格发现功能研究 方匡南 蔡振忠 * 内容提要:本文基于沪深300股指期货5分钟高频数据,利用协整检验.误差修正 ...查看


  • [中华妇产科杂志]稿约
  • ・79・ <中华妇产科杂志>稿约 <中华妇产科杂志>为中国科学技术协会主管.中华医学会主办的妇产科专业学术期刊,以广大妇产科医师为主要读者对象,报道妇产科领域领先的科研成果和临床诊疗经验.以及对妇产科临床有指导作用. ...查看


  • [中华创伤杂志]稿约
  • 生堡剑笾盘盍!堂生Z月筮箜鲞筮!翅堡!也』墅坐坐:亟垃!塑:!丛:箜:№:Z <中华创伤杂志>稿约 <中华创伤杂志>是中华医学会主办的,国内惟一能全面.系统地反映我国创伤医学成果和发展动向的高级医学专业学术期刊.本刊 ...查看


  • 我国医疗资源分配与健康资本投资
  • 我国医疗资源分配问题探究 专业:国民经济管理 学生 :李壮 指导教师:路征教授 摘要:医疗资源分配一直以来就是我国经济发展与研究中的重要问题,与居民的生产与生活也是 息息相关,如何让医疗资源更好的服务于社会作用于健康资本的发展一直以来就是国 ...查看


  • 概率论英文专业词汇
  • 概率论与数理统计词汇英汉对照表 A absolute value 绝对值 accept 接受 acceptable region 接受域 additivity 可加性 adjusted 调整的 alternative hypothesis ...查看


  • 分位数回归及应用简介
  • 第21卷第3期2006年5月 统计与信息论坛 Vol. 21No. 3May ,2006 [统计理论与方法] 分位数回归及应用简介 李育安1,2 (1. 中国人民武装警察部队学院, 河北廊坊065000;2. 中国人民大学统计学院, 北京1 ...查看


热门内容