关于大学贫困生认定的数学模型
摘要
为贯彻落实党和政府对家庭经济困难学生的关怀,帮助他们顺利完成学业,
激励他们勤奋学习、全面发展,根据学校“家庭经济困难学生认定工作实施办法”(每年9月下旬),贫困生认定工作在全校启动。认定对象涉及在校就读的所有本科生。贫困生的认定结果,将直接作为国家励志奖学金、国家助学金的评定资格,因此,认定工作意义重大。
如何对贫困生进行客观界定一直是困扰各高校学生工作管理部门的难题。选取能够充分反映学生家庭收支状况的变量,利用具有代表性的样本可建立用于贫困生界定的Logistic 回归模型, 通过对样本数据的检验表明,该模型能够成功地对贫困生进行界定。
关键词:高校;贫困生界定; Logistic 回归模型; 综合评价体系
一、问题的重述
根据学校“家庭经济困难学生认定工作实施办法”(每年9月下旬),贫困生认定工作在全校启动。评定指标体系是否公平、公正、合理对于品定结果至关重要,甚至影响到贫困学生能否最终顺利完成学业,因此,制定一套规范的量化评价指标失败在高校学生工作中的重要任务,大学贫困生认定模型的建立是当务之急,意义重大。
二、问题分析
大学贫困生的认定模型是贫困大学生在学校获得各类奖、助学金以及其他贫
困补助的依据,是学校贫困蜘蛛体系的重要组成部分。而当前的许多界定标准往往存在评定标准的依据或原理不明确,评定方法带有很强主观性,人为操纵幅度大的问题,由此可能导致评价程序繁琐,评价结果与现实反差较大等。
根据《教育部财政部关于认真做好高等学校家庭经济困难学生认定工作的指导意见》制定了贫困生认定标准,则建立的数学模型将考虑一下几个因素:(1)
孤儿、烈士子女或优抚家庭子女等无直接经济来源者;(2)单亲或父母年事已高或患病长期卧床家庭缺乏劳动力, 家庭又无固定经济来源且亲友无资助能力者;(3)家庭被地方政府列为特困户,难以维持基本生活者;(4)家庭为民政部门确定的城市居民最低生活保障对象者;(5)学生家庭或本人突遭不幸(如家庭遭遇自然灾害,学生本人突发疾病或意外事故),超越家庭经济承受能力者;(6)来自老少边穷地区,经济条件差,家庭无固定经济来源,基本生活难以维持者;(7)因家庭经济贫困,无力支付在校期间必要的学习和生活费用的学生
三、模型假设
1、等级认定中忽略地域因素以及其它主观不可预测因素。 2、如果符合条件,国家有足够的钱来资助学生。 3、国家在短时间内不会改变发放助学金政策。 4、忽略一些偶发因素。
5、假设参加给贫困生打分的学生及老师都是公正的,因此,我们认为用打分法确定的贫困生是合理的。 6、每年数据及时更新。
四、符号说明
五、模型的建立
5.1对模型的分析
根据其所提供的家庭经济各项收入、支出数据,把一些能够反映学生日常消费行为的指标的加权之和作为大学生贫困的判定依据。即学生家庭是否可以提供其日常消费行为所需费用。根据其家庭支出(学费、生活费、种地投入、看病费用和其他花费)与家庭各项收入(种地收入、打工收入、正式收入、生意收入、退休金以及其他收入)的比值的大小作为初步判定其是否贫困的依据(如表一)。根据要求和实际本文取家庭支出与家庭各项收入的比值A大于等于5判定为贫困(表附一)。 表一:
5.2 Logistic 回归模型建立
选取样本中180个数据建立数学模型,进行分析。收集变量如表二:
X1表示户口类型,1表示农村,0表示城市;
X2几人正上大学;X3表示种地收入,单位为元;X4=表示打工收入,单位为元; X5表示正式收入,单位为元;X6表示生意收入,单位为元;X7表示退休金,单位为元;X8表示其他收入,单位为元;X9表示综合收入,单位为元;X10表示学费,单位为元;X11表示生活费,单位为元;X12表示看病费用,单位为元;X13表示种地投入,单位为元;X14表示其他花费,单位为元;X15表综合花费,单位为元;X16表示家庭收支情况,1表透支,0表盈余及收支平衡 ;Y=1,0分别表示贫困和不贫困。
用stata作逐步回归分析
逐步回归
X12的P值最大并且P>0.05 ,故剔除X12;
X13的P值最大并且P>0.05 ,故剔除X13;
X2的P值最大并且P>0.05 ,故剔除X2;
X1的P值最大并且P>0.05 ,故剔除X1;
X8的P值最大并且P>0.05 ,故剔除X8;
X7的P值最大并且P>0.05 ,故剔除X7
所有变量的P值均
R=exp(0.2425932-0.0000282x3-0.0000241x4-0.0000125x5-0.0000192x6+0.0000111x9+0.0000062x10+0.00000612x11) P=R/(1+R)
X3表示种地收入,单位为元;X4=表示打工收入,单位为元;X5表示正式收入,单位为元;X6表示生意收入,单位为元;X9表示综合收入,单位为元;X10表示学费,单位为元;X11表示生活费,单位为元。
建模结果表明,模型能够对全部样本数据进行识别。当要判定一个学生是否贫困时,只要把此学生的家庭种地收入、打工收入、正式收入、生意收入、综合收入、学费以及生活费带入上述表达式,如果P 大于0.6,则可以判定该学生贫困,否则为不贫困。
X1表示户口类型,1表示农村,0表示城市;
X2几人正上大学;X3表示种地收入,单位为元;X4=表示打工收入,单位为元; X5表示正式收入,单位为元;X6表示生意收入,单位为元;X7表示退休金,单位为元;X8表示其他收入,单位为元;X9表示综合收入,单位为元;X10表示学费,单位为元;X11表示生活费,单位为元;X12表示看病费用,单位为元;X13表示种地投入,单位为元;X14表示其他花费,单位为元;X15表综合花费,单位为元;X16表示家庭收支情况,1表透支,0表盈余及收支平衡 ;Y=1,0分别表示贫困和不贫困。
5.3模型的检验
用20个样本作为检验样本,忽略样本数量较少对建立数学模型的影响, Logistic 回归模型的值与初步判定值基本上接近(结果见表三)。检验结果显示,样本数据的信息比较充分,Logistic 回归模型能够很好的解决贫困生的判定问题,能够用于关于大学贫困生认定模型。
六、模型的应用与推广
根据本校部分大学生家庭的统计情况,和该校大学生资助比例。为了估计本校还有多少家庭贫困的大学生不能获得国家资助,在本校随机抽取不同专业的两个班,调查两个班级中的学生家庭收支情况以及获得国家资助人数比例。将调查相关数据带入所建立的Logistic 回归数学模型,计算得出调查学生的贫困判定值P(附表二),得出相应贫困生比例。经了解,本校有在校大学生14000人,获得国家资助的人数为4956人,经计算可以大致得出全校实际贫困人数为6690人,仍有1734人未获得国家资助。
附录:计算P值的C++程序
#include #include #include
using namespace std;
//把数据从文件中读出来
void get_from_file() {
int i,j;double a[50][7],b[50],r,p,m; ifstream infile("f2.dat",ios::in); if(!infile) {
cerr
}
for(j=0;j
for(i=0;i
infile>>a[j][i]; coutcout
infile.close();
//计算p的值
for(j=0;j
r=0.2425932-0.0000282*a[j][0]-0.0000241*a[j][1]-0.0000125*a[j][2]-0.0000192*a[j][3]+0.0000111*a[j][4]+(6.2e-06)*a[j][5]+(6.12e-06)*a[j][6];
m=pow(2.7183,r); b[j]=m/(1+m);
cout
//把p送到文件中
ofstream outfile("f1.dat",ios::out); if(!outfile) {
cerr
for(j=0;j
outfile
outfile
outfile.close(); }
int main() {
get_from_file();
return 0; }
专业一 学生标号
1 2
3 4 5 户口类型 农村 农村 农村 农村 城市 兄妹中几个正读大学
1 1 4 1 1 种地收入 800到1200 800到1200 800到1200 800到1200 无 打工收入 10000以下 10000以下 10000以下 无 无 正式工作收入 无 无 无 无
10000以下 做生意收无 无 无 无 无 6 7 8 9
10 11 12 13 14 15 16 17 18 19 20
退休金 无 无 无 无 无 无
农村 农村 农村 城市
农村 农村 农村 农村 农村 城市 农村 农村 农村 农村 农村 其他收 入 无 无
无
8000
无 无 1 1 2 2 1 2 1 1 1 2 2 1 1 1 1
家庭综合收 入
15000
15000
12000
12000
30000以上 无 无 30000以上 无 无
无
30000以上 无 500到800 10000以下 无
无 无 无
30000以上 无
20000到无
30000 无
10000以20000到无
无 30000 无 800到1200 无 无 无
800到1200 10000以下 无 无
800到1200 10000以下 无 10000以20000到无
无
无 30000 800到1200 10000以下 无 无 无 无
无 无 10000到1200以上 20000
无 无 无
10000以下 无 无 800到1200 10000以下 无
无
种地投 其他学费
生活费
看病费用
入
费
5000 6000 2000
500 无
5000
2500
无
3000 到
5000
6000 4000 1000 无 5000 4000 200
2000 8000 2000 无 无 无 5000
8000 无
无
无
无 无 无 无 无 无 无 无 30000以上
10000
30000以上
30000
5000 5000 5000 5000 7200 无 2000 无 5000 无 6000 无 无 1000 无
无 500 无
无
2无 无 无 无 无 无 无 无 无 无
专业二
1 2 3 4 5 6 7 8 无 无 无 无 无
无
20000
无 无 无
户口类型 农村 农村 农村 农村 农村 农村 农村 农村
30000
10000
15000
20000
30000
10000
到
20000
兄妹中有几个正读大学 0 2 0
1个 2个
0个 1个
5000 5000 5000 1000 5000 2500 5000 5000
5000
10000
10000
15000
10000
8000 10000
5000 40000
24000 1000
5000
其他收入 种地收入 500-800 不种地
500-800
800-1200
500-800
800-1200 1200以上
无 无
无
无
1200 4000到5000 4000
2无
30
3000
3000
8
无
13000 15
5000 5000 3
800
1000 无
打工收入 正式工作
不打工 无正式工不打工 无正式工不打工 无正式工一万到两万 0元 0元 0元 0元 0元 一万以下 0元 0元
0元
9 农村 10 农村 11 农村 12 农村 13 农村 14 农村 15 农村 16 农村 17 农村 18 农村 19 农村 20 农村 21 农村 22 城市 23 城市 24 农村 25 农村 26 城市 27 城市 28 农村 29 城市 30 农村
0个
1个
1个
1个
0个
1个
0个 2
2
1
1
1
1个
1个
1个
1个
0个
0个
2个
1
2
800-1200 1200以上 800-1200 500-800 0元 1200以上 800-1200 不种地 800——1200元
500——800元
800——1200元
800——1200元
800——1200元 0元 0元 0元 500-800 0元 0元 500-800 0元
500——800元
0元 一万到两万 一万以下 0元 两万到三万 一万以下 0元
一万以下 一万以下 不打工 不打工 不打工 一万以下 一万到两万 一万到两万 0元 一万到两万 0元 0元 0元 0元 一万元以下
0元 0元 0元 0元 0元 0元
0元 无正式工
无正式工无式工作入
无正式工
无正式工
无正式工0元 0元
一万到两0元 0元
三万以上0元
两万到三
无正式工
31 农村 32 农村 2
2
1200以上 500——800元
不打工 不打工 无正式工
无正式工33 农村 34 农村 35 农村 36 农村 37 农村 38 城市 39 农村 40 城市 41 农村 42 农村 43 农村 44 农村 45 农村 46 农村 47 城市 48 农村 49 农村 50 农村 51 农村 52 农村 53 农村
3个
1个
1个 1个 3个
1个 2个
1个
2个
2个
0个
0个
1个
1个
2个
2个 2个 1个 2个
800-12000
1
2
1200元以上 500-800 500-800
800-1200
500-800
0 800-1200 0元 500-800 800-1200 500-800 800-1200 1200以上 800-1200 500-800 500-800 1200元以上 1200元以上 500-800 1200以上 500-800
一万以下 不打工 不打工 不打工 不打工 不打工
不打工 0元 0元 0元 0元 一万以下 0元 0元
两万-三万 无 一万以下 一万以下 0元
一万以下 0元 0元
0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元
0元
一万以下0元 0元 0元 0元 0元
54 农村 55 农村 56 农村 57 农村 58 城市 59 农村 60 农村 61 农村 62 农村 63 农村 64 农村 65 农村 66 农村 67 农村 68 农村 69 农村 70 农村 71 农村 72 农村 73 农村 74 农村 75 农村 76 农村
1个 1个
1个
1个 1个 1个 2个
1个
2个
2个
1个
2个
1个
1个
0个
0个
0个
1个 1个 1个
0个
1个 0个
0元 500-800
500-800
500-800 500-800 500-800 800-1200
500-800 500-800 500-800 1200以上 500-800 500-800 1200以上 500--800 0元 1200以上 1200以上 500--800 0元 500-800 1200以上 800-1200 500-800 500-800
一万以下 0元 一万以下 一万以下 0 0元
0元 0元 0元 0元 0元 一万以下 一万以下 一万以下 一万以下 0元 一万以下 0元 一万到两万一万以下 0元 0元 一万以下 一万以下
0元 0元 0元 0元 0元 0元 0元 0元
一万以下0元 0元 0元 0元 0元
一万到两0元 0元 0元
一万以下0元 0元 0元 0元
77 城市 0
不种地 不打工 三万元以78 农村 79 农村 80 农村 81 农村 82 农村 83 农村 84 农村 85 农村 86 农村 87 农村 88 农村 89 城市 90 城市 91 农村 92 农村 93 农村 94 农村 95 农村 96 农村 97 农村 98 农村 99 农村 农村
0 3 0 1 2 1 0 1个 1个 1个 1个 1个 1个 2个 2个 1个 1个 1个 1个 1个 2个 2个 1个
500—800元 800--1200 1200以上 1200以上 800—1200 800—1200 800—1200 800-1200元 500-800元 500-800元 500-800元 500-800元 500-800元 500-800元 800-1200元 1200元以上 0元 0元 800-1200元 500-800元 800-1200元 800-1200元 500-800元
不打工
一万到两万 一万到两万 一万到两万 一万到两万 0元
一万以下 一万以下 一万以下 一万以下 一万以下 一万以下 一万以下 一万以下 一万以下 一到两万 0元 0元 一万以下 0元 0元 0元 一万以下
0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元
一万元以0元 0元 0元 0元 0元
100
做生意收入 不做生意 三万以上 不做生意 0元
一万以下 0元 0元
退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金
其他收入 5000 0 0 0元 0元 500元 0元 家庭综合收入 9000 几十万 18000 21500元 15000元 1500元 10000元 学费 13000 3.3万 12300 12300元 20000元 25000元 12000元
生活费2400 5000 3000 5000元5000元4000元4000元0元 0元 0元 0元 0元 0元 0元 0元
不做生意 不做生意 不做生意 不做生意 不做生意 不做生意 0元
一万以下 0元 0元
两万到三万 0元 0元 0元
不做生意 不做生意 不做生意 0元 0元 0元 0元 0元
一万到两万 0元
20000元 一万以下 0元 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 0元 0元 0元 0元 0元
一万到两万0元 0元
无退休金 无退休金 无退休金 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元
0元 0元 0元 0元 4000元 0元 0元
500-1000 0 无
1000元 0元 无 无
3000元 0元 0元 1000元 0元 0元 0元 0元 0
1000元 100元
1000—2000 0元 0元 0元 0元 500
元 2000元 0元 0元
8000元 3500元 14000元 2500元 6000元 2500元 17000元 2000元 15000元 5000元 1500元 2500元 5000元 5000元 17000元 26000元 20000元 16000元 25000元 35000元 800-1200元 25000元 20000元 15000元 一万元 20000元 700元 500元 4200元 2000-3000元 30000元 2500元 22000元 16000元 2000元
11000元 12300元 20000元 12300元 11000元 12300元 11000元 12300元 16300 17300元 11000元 11000元 11000元 11000元 13000元 11000元 11000元 11000元 12300元 12300元 11000元 11000元 24800元 15300元 一万多元 17000元 13000元 11000元 12300元 30000元 18000元 21000元 11000元 11000元 11000元 4000元4000元202003500元5000元6500元100003500元6000 500元2000元2000元5000元5000元8500元150002000元4000元4000元150001300元[1**********]000元三千多7200元3000元250003000元[1**********]000元8000元10000200元
0元 0元
一万以下 0元
一万以下 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 7000元 2000元 0元 100多 0元 0元 0元 12000元 10000元 11000元 3万到4万 一万多 12000元 23000元 1万 12300元 11000元 22300元 12300元 11000元 12300元 18000元 1万三 3000元4000元3500元5000元5000元5000元10000一万 0元 0元 0元 0元 0元 0元
两万到三万0元
三万以上 一万到两万一万以下 0元 0元 0元 0元 0元 0元 0元 0元 0元
一万以下 一万到两万0元 0元 0元 0元
两万到三万0元 0元 0元
一万到两万0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元
一万以下0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 200元 2000元 0元 0元 2000元 0元 0元 0元 0元 0元 0元 2000元 100元 0元 1500元 3000元 300元 0元 0元 1000元 0元 15000元 0元 0元 0元 0元 5000元 0元 0元 0元 6000元 500元 0元 0元
两万 600元 1万 17000元 1万5千 20000元 两万 一万 60000元 21000元 15000元 10000元 12000元 10000元 19000元 一万多元 30000元 7000元 5000元 20000元 少于50000万 25000元 25000元 10000元 30000元 负 3--4万 20000 3000—20000 30000 30000 11000 8000 10000元 30000元
2万 15800元 8000元 11000元 123000元 11000元 12300元 11000元 26000元 13000元 12300元 15000元 12300元 11000元 11000元 11000元 11000元 11000元 12300元 13000元 12300元 12000元 12300元 12000元 12300元
11000 15000 19000 15000 13000 20000 1000 12000 12300元 12300元 1万44000元不一定4800元400元600元2000元5000元100003000元3500元5000元4000元600元4000元4500元1000元3000元7000元5000元3000元6000元6000元5000元8000元未知 2000 150005000—5000 7000 4000 2000 3000元6000元
0元 0元 0元 0元 0元 0元
一万元以下 0元 0元 0元 0元 0元 0元 0元 0元
一万元以下 0元 2000元 0元 0元 0元 0元 0元 0元 4000元 12000元 10000元 1000元 2500元 30000元 10000元 20000元 12300元 12300元 12300元 12300元 13000元 12300元 12300元 12300元 3000元3000元3000元2400元5000元8000元5000元5000元0元
一万元以下 0元 0元 0元 0元 4000元 0元 0元 0元 3500元 0元 3000元 0元 0元 12500元 22300元 4300元 4000元 1000元
12300元 12300元 14400元 12300元 12300元 5000元6000元3800元5000元300元
关于大学贫困生认定的数学模型
摘要
为贯彻落实党和政府对家庭经济困难学生的关怀,帮助他们顺利完成学业,
激励他们勤奋学习、全面发展,根据学校“家庭经济困难学生认定工作实施办法”(每年9月下旬),贫困生认定工作在全校启动。认定对象涉及在校就读的所有本科生。贫困生的认定结果,将直接作为国家励志奖学金、国家助学金的评定资格,因此,认定工作意义重大。
如何对贫困生进行客观界定一直是困扰各高校学生工作管理部门的难题。选取能够充分反映学生家庭收支状况的变量,利用具有代表性的样本可建立用于贫困生界定的Logistic 回归模型, 通过对样本数据的检验表明,该模型能够成功地对贫困生进行界定。
关键词:高校;贫困生界定; Logistic 回归模型; 综合评价体系
一、问题的重述
根据学校“家庭经济困难学生认定工作实施办法”(每年9月下旬),贫困生认定工作在全校启动。评定指标体系是否公平、公正、合理对于品定结果至关重要,甚至影响到贫困学生能否最终顺利完成学业,因此,制定一套规范的量化评价指标失败在高校学生工作中的重要任务,大学贫困生认定模型的建立是当务之急,意义重大。
二、问题分析
大学贫困生的认定模型是贫困大学生在学校获得各类奖、助学金以及其他贫
困补助的依据,是学校贫困蜘蛛体系的重要组成部分。而当前的许多界定标准往往存在评定标准的依据或原理不明确,评定方法带有很强主观性,人为操纵幅度大的问题,由此可能导致评价程序繁琐,评价结果与现实反差较大等。
根据《教育部财政部关于认真做好高等学校家庭经济困难学生认定工作的指导意见》制定了贫困生认定标准,则建立的数学模型将考虑一下几个因素:(1)
孤儿、烈士子女或优抚家庭子女等无直接经济来源者;(2)单亲或父母年事已高或患病长期卧床家庭缺乏劳动力, 家庭又无固定经济来源且亲友无资助能力者;(3)家庭被地方政府列为特困户,难以维持基本生活者;(4)家庭为民政部门确定的城市居民最低生活保障对象者;(5)学生家庭或本人突遭不幸(如家庭遭遇自然灾害,学生本人突发疾病或意外事故),超越家庭经济承受能力者;(6)来自老少边穷地区,经济条件差,家庭无固定经济来源,基本生活难以维持者;(7)因家庭经济贫困,无力支付在校期间必要的学习和生活费用的学生
三、模型假设
1、等级认定中忽略地域因素以及其它主观不可预测因素。 2、如果符合条件,国家有足够的钱来资助学生。 3、国家在短时间内不会改变发放助学金政策。 4、忽略一些偶发因素。
5、假设参加给贫困生打分的学生及老师都是公正的,因此,我们认为用打分法确定的贫困生是合理的。 6、每年数据及时更新。
四、符号说明
五、模型的建立
5.1对模型的分析
根据其所提供的家庭经济各项收入、支出数据,把一些能够反映学生日常消费行为的指标的加权之和作为大学生贫困的判定依据。即学生家庭是否可以提供其日常消费行为所需费用。根据其家庭支出(学费、生活费、种地投入、看病费用和其他花费)与家庭各项收入(种地收入、打工收入、正式收入、生意收入、退休金以及其他收入)的比值的大小作为初步判定其是否贫困的依据(如表一)。根据要求和实际本文取家庭支出与家庭各项收入的比值A大于等于5判定为贫困(表附一)。 表一:
5.2 Logistic 回归模型建立
选取样本中180个数据建立数学模型,进行分析。收集变量如表二:
X1表示户口类型,1表示农村,0表示城市;
X2几人正上大学;X3表示种地收入,单位为元;X4=表示打工收入,单位为元; X5表示正式收入,单位为元;X6表示生意收入,单位为元;X7表示退休金,单位为元;X8表示其他收入,单位为元;X9表示综合收入,单位为元;X10表示学费,单位为元;X11表示生活费,单位为元;X12表示看病费用,单位为元;X13表示种地投入,单位为元;X14表示其他花费,单位为元;X15表综合花费,单位为元;X16表示家庭收支情况,1表透支,0表盈余及收支平衡 ;Y=1,0分别表示贫困和不贫困。
用stata作逐步回归分析
逐步回归
X12的P值最大并且P>0.05 ,故剔除X12;
X13的P值最大并且P>0.05 ,故剔除X13;
X2的P值最大并且P>0.05 ,故剔除X2;
X1的P值最大并且P>0.05 ,故剔除X1;
X8的P值最大并且P>0.05 ,故剔除X8;
X7的P值最大并且P>0.05 ,故剔除X7
所有变量的P值均
R=exp(0.2425932-0.0000282x3-0.0000241x4-0.0000125x5-0.0000192x6+0.0000111x9+0.0000062x10+0.00000612x11) P=R/(1+R)
X3表示种地收入,单位为元;X4=表示打工收入,单位为元;X5表示正式收入,单位为元;X6表示生意收入,单位为元;X9表示综合收入,单位为元;X10表示学费,单位为元;X11表示生活费,单位为元。
建模结果表明,模型能够对全部样本数据进行识别。当要判定一个学生是否贫困时,只要把此学生的家庭种地收入、打工收入、正式收入、生意收入、综合收入、学费以及生活费带入上述表达式,如果P 大于0.6,则可以判定该学生贫困,否则为不贫困。
X1表示户口类型,1表示农村,0表示城市;
X2几人正上大学;X3表示种地收入,单位为元;X4=表示打工收入,单位为元; X5表示正式收入,单位为元;X6表示生意收入,单位为元;X7表示退休金,单位为元;X8表示其他收入,单位为元;X9表示综合收入,单位为元;X10表示学费,单位为元;X11表示生活费,单位为元;X12表示看病费用,单位为元;X13表示种地投入,单位为元;X14表示其他花费,单位为元;X15表综合花费,单位为元;X16表示家庭收支情况,1表透支,0表盈余及收支平衡 ;Y=1,0分别表示贫困和不贫困。
5.3模型的检验
用20个样本作为检验样本,忽略样本数量较少对建立数学模型的影响, Logistic 回归模型的值与初步判定值基本上接近(结果见表三)。检验结果显示,样本数据的信息比较充分,Logistic 回归模型能够很好的解决贫困生的判定问题,能够用于关于大学贫困生认定模型。
六、模型的应用与推广
根据本校部分大学生家庭的统计情况,和该校大学生资助比例。为了估计本校还有多少家庭贫困的大学生不能获得国家资助,在本校随机抽取不同专业的两个班,调查两个班级中的学生家庭收支情况以及获得国家资助人数比例。将调查相关数据带入所建立的Logistic 回归数学模型,计算得出调查学生的贫困判定值P(附表二),得出相应贫困生比例。经了解,本校有在校大学生14000人,获得国家资助的人数为4956人,经计算可以大致得出全校实际贫困人数为6690人,仍有1734人未获得国家资助。
附录:计算P值的C++程序
#include #include #include
using namespace std;
//把数据从文件中读出来
void get_from_file() {
int i,j;double a[50][7],b[50],r,p,m; ifstream infile("f2.dat",ios::in); if(!infile) {
cerr
}
for(j=0;j
for(i=0;i
infile>>a[j][i]; coutcout
infile.close();
//计算p的值
for(j=0;j
r=0.2425932-0.0000282*a[j][0]-0.0000241*a[j][1]-0.0000125*a[j][2]-0.0000192*a[j][3]+0.0000111*a[j][4]+(6.2e-06)*a[j][5]+(6.12e-06)*a[j][6];
m=pow(2.7183,r); b[j]=m/(1+m);
cout
//把p送到文件中
ofstream outfile("f1.dat",ios::out); if(!outfile) {
cerr
for(j=0;j
outfile
outfile
outfile.close(); }
int main() {
get_from_file();
return 0; }
专业一 学生标号
1 2
3 4 5 户口类型 农村 农村 农村 农村 城市 兄妹中几个正读大学
1 1 4 1 1 种地收入 800到1200 800到1200 800到1200 800到1200 无 打工收入 10000以下 10000以下 10000以下 无 无 正式工作收入 无 无 无 无
10000以下 做生意收无 无 无 无 无 6 7 8 9
10 11 12 13 14 15 16 17 18 19 20
退休金 无 无 无 无 无 无
农村 农村 农村 城市
农村 农村 农村 农村 农村 城市 农村 农村 农村 农村 农村 其他收 入 无 无
无
8000
无 无 1 1 2 2 1 2 1 1 1 2 2 1 1 1 1
家庭综合收 入
15000
15000
12000
12000
30000以上 无 无 30000以上 无 无
无
30000以上 无 500到800 10000以下 无
无 无 无
30000以上 无
20000到无
30000 无
10000以20000到无
无 30000 无 800到1200 无 无 无
800到1200 10000以下 无 无
800到1200 10000以下 无 10000以20000到无
无
无 30000 800到1200 10000以下 无 无 无 无
无 无 10000到1200以上 20000
无 无 无
10000以下 无 无 800到1200 10000以下 无
无
种地投 其他学费
生活费
看病费用
入
费
5000 6000 2000
500 无
5000
2500
无
3000 到
5000
6000 4000 1000 无 5000 4000 200
2000 8000 2000 无 无 无 5000
8000 无
无
无
无 无 无 无 无 无 无 无 30000以上
10000
30000以上
30000
5000 5000 5000 5000 7200 无 2000 无 5000 无 6000 无 无 1000 无
无 500 无
无
2无 无 无 无 无 无 无 无 无 无
专业二
1 2 3 4 5 6 7 8 无 无 无 无 无
无
20000
无 无 无
户口类型 农村 农村 农村 农村 农村 农村 农村 农村
30000
10000
15000
20000
30000
10000
到
20000
兄妹中有几个正读大学 0 2 0
1个 2个
0个 1个
5000 5000 5000 1000 5000 2500 5000 5000
5000
10000
10000
15000
10000
8000 10000
5000 40000
24000 1000
5000
其他收入 种地收入 500-800 不种地
500-800
800-1200
500-800
800-1200 1200以上
无 无
无
无
1200 4000到5000 4000
2无
30
3000
3000
8
无
13000 15
5000 5000 3
800
1000 无
打工收入 正式工作
不打工 无正式工不打工 无正式工不打工 无正式工一万到两万 0元 0元 0元 0元 0元 一万以下 0元 0元
0元
9 农村 10 农村 11 农村 12 农村 13 农村 14 农村 15 农村 16 农村 17 农村 18 农村 19 农村 20 农村 21 农村 22 城市 23 城市 24 农村 25 农村 26 城市 27 城市 28 农村 29 城市 30 农村
0个
1个
1个
1个
0个
1个
0个 2
2
1
1
1
1个
1个
1个
1个
0个
0个
2个
1
2
800-1200 1200以上 800-1200 500-800 0元 1200以上 800-1200 不种地 800——1200元
500——800元
800——1200元
800——1200元
800——1200元 0元 0元 0元 500-800 0元 0元 500-800 0元
500——800元
0元 一万到两万 一万以下 0元 两万到三万 一万以下 0元
一万以下 一万以下 不打工 不打工 不打工 一万以下 一万到两万 一万到两万 0元 一万到两万 0元 0元 0元 0元 一万元以下
0元 0元 0元 0元 0元 0元
0元 无正式工
无正式工无式工作入
无正式工
无正式工
无正式工0元 0元
一万到两0元 0元
三万以上0元
两万到三
无正式工
31 农村 32 农村 2
2
1200以上 500——800元
不打工 不打工 无正式工
无正式工33 农村 34 农村 35 农村 36 农村 37 农村 38 城市 39 农村 40 城市 41 农村 42 农村 43 农村 44 农村 45 农村 46 农村 47 城市 48 农村 49 农村 50 农村 51 农村 52 农村 53 农村
3个
1个
1个 1个 3个
1个 2个
1个
2个
2个
0个
0个
1个
1个
2个
2个 2个 1个 2个
800-12000
1
2
1200元以上 500-800 500-800
800-1200
500-800
0 800-1200 0元 500-800 800-1200 500-800 800-1200 1200以上 800-1200 500-800 500-800 1200元以上 1200元以上 500-800 1200以上 500-800
一万以下 不打工 不打工 不打工 不打工 不打工
不打工 0元 0元 0元 0元 一万以下 0元 0元
两万-三万 无 一万以下 一万以下 0元
一万以下 0元 0元
0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元
0元
一万以下0元 0元 0元 0元 0元
54 农村 55 农村 56 农村 57 农村 58 城市 59 农村 60 农村 61 农村 62 农村 63 农村 64 农村 65 农村 66 农村 67 农村 68 农村 69 农村 70 农村 71 农村 72 农村 73 农村 74 农村 75 农村 76 农村
1个 1个
1个
1个 1个 1个 2个
1个
2个
2个
1个
2个
1个
1个
0个
0个
0个
1个 1个 1个
0个
1个 0个
0元 500-800
500-800
500-800 500-800 500-800 800-1200
500-800 500-800 500-800 1200以上 500-800 500-800 1200以上 500--800 0元 1200以上 1200以上 500--800 0元 500-800 1200以上 800-1200 500-800 500-800
一万以下 0元 一万以下 一万以下 0 0元
0元 0元 0元 0元 0元 一万以下 一万以下 一万以下 一万以下 0元 一万以下 0元 一万到两万一万以下 0元 0元 一万以下 一万以下
0元 0元 0元 0元 0元 0元 0元 0元
一万以下0元 0元 0元 0元 0元
一万到两0元 0元 0元
一万以下0元 0元 0元 0元
77 城市 0
不种地 不打工 三万元以78 农村 79 农村 80 农村 81 农村 82 农村 83 农村 84 农村 85 农村 86 农村 87 农村 88 农村 89 城市 90 城市 91 农村 92 农村 93 农村 94 农村 95 农村 96 农村 97 农村 98 农村 99 农村 农村
0 3 0 1 2 1 0 1个 1个 1个 1个 1个 1个 2个 2个 1个 1个 1个 1个 1个 2个 2个 1个
500—800元 800--1200 1200以上 1200以上 800—1200 800—1200 800—1200 800-1200元 500-800元 500-800元 500-800元 500-800元 500-800元 500-800元 800-1200元 1200元以上 0元 0元 800-1200元 500-800元 800-1200元 800-1200元 500-800元
不打工
一万到两万 一万到两万 一万到两万 一万到两万 0元
一万以下 一万以下 一万以下 一万以下 一万以下 一万以下 一万以下 一万以下 一万以下 一到两万 0元 0元 一万以下 0元 0元 0元 一万以下
0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元
一万元以0元 0元 0元 0元 0元
100
做生意收入 不做生意 三万以上 不做生意 0元
一万以下 0元 0元
退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金
其他收入 5000 0 0 0元 0元 500元 0元 家庭综合收入 9000 几十万 18000 21500元 15000元 1500元 10000元 学费 13000 3.3万 12300 12300元 20000元 25000元 12000元
生活费2400 5000 3000 5000元5000元4000元4000元0元 0元 0元 0元 0元 0元 0元 0元
不做生意 不做生意 不做生意 不做生意 不做生意 不做生意 0元
一万以下 0元 0元
两万到三万 0元 0元 0元
不做生意 不做生意 不做生意 0元 0元 0元 0元 0元
一万到两万 0元
20000元 一万以下 0元 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 无退休金 0元 0元 0元 0元 0元
一万到两万0元 0元
无退休金 无退休金 无退休金 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元
0元 0元 0元 0元 4000元 0元 0元
500-1000 0 无
1000元 0元 无 无
3000元 0元 0元 1000元 0元 0元 0元 0元 0
1000元 100元
1000—2000 0元 0元 0元 0元 500
元 2000元 0元 0元
8000元 3500元 14000元 2500元 6000元 2500元 17000元 2000元 15000元 5000元 1500元 2500元 5000元 5000元 17000元 26000元 20000元 16000元 25000元 35000元 800-1200元 25000元 20000元 15000元 一万元 20000元 700元 500元 4200元 2000-3000元 30000元 2500元 22000元 16000元 2000元
11000元 12300元 20000元 12300元 11000元 12300元 11000元 12300元 16300 17300元 11000元 11000元 11000元 11000元 13000元 11000元 11000元 11000元 12300元 12300元 11000元 11000元 24800元 15300元 一万多元 17000元 13000元 11000元 12300元 30000元 18000元 21000元 11000元 11000元 11000元 4000元4000元202003500元5000元6500元100003500元6000 500元2000元2000元5000元5000元8500元150002000元4000元4000元150001300元[1**********]000元三千多7200元3000元250003000元[1**********]000元8000元10000200元
0元 0元
一万以下 0元
一万以下 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 7000元 2000元 0元 100多 0元 0元 0元 12000元 10000元 11000元 3万到4万 一万多 12000元 23000元 1万 12300元 11000元 22300元 12300元 11000元 12300元 18000元 1万三 3000元4000元3500元5000元5000元5000元10000一万 0元 0元 0元 0元 0元 0元
两万到三万0元
三万以上 一万到两万一万以下 0元 0元 0元 0元 0元 0元 0元 0元 0元
一万以下 一万到两万0元 0元 0元 0元
两万到三万0元 0元 0元
一万到两万0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元
一万以下0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 0元 200元 2000元 0元 0元 2000元 0元 0元 0元 0元 0元 0元 2000元 100元 0元 1500元 3000元 300元 0元 0元 1000元 0元 15000元 0元 0元 0元 0元 5000元 0元 0元 0元 6000元 500元 0元 0元
两万 600元 1万 17000元 1万5千 20000元 两万 一万 60000元 21000元 15000元 10000元 12000元 10000元 19000元 一万多元 30000元 7000元 5000元 20000元 少于50000万 25000元 25000元 10000元 30000元 负 3--4万 20000 3000—20000 30000 30000 11000 8000 10000元 30000元
2万 15800元 8000元 11000元 123000元 11000元 12300元 11000元 26000元 13000元 12300元 15000元 12300元 11000元 11000元 11000元 11000元 11000元 12300元 13000元 12300元 12000元 12300元 12000元 12300元
11000 15000 19000 15000 13000 20000 1000 12000 12300元 12300元 1万44000元不一定4800元400元600元2000元5000元100003000元3500元5000元4000元600元4000元4500元1000元3000元7000元5000元3000元6000元6000元5000元8000元未知 2000 150005000—5000 7000 4000 2000 3000元6000元
0元 0元 0元 0元 0元 0元
一万元以下 0元 0元 0元 0元 0元 0元 0元 0元
一万元以下 0元 2000元 0元 0元 0元 0元 0元 0元 4000元 12000元 10000元 1000元 2500元 30000元 10000元 20000元 12300元 12300元 12300元 12300元 13000元 12300元 12300元 12300元 3000元3000元3000元2400元5000元8000元5000元5000元0元
一万元以下 0元 0元 0元 0元 4000元 0元 0元 0元 3500元 0元 3000元 0元 0元 12500元 22300元 4300元 4000元 1000元
12300元 12300元 14400元 12300元 12300元 5000元6000元3800元5000元300元