《中国好声音》的影响力评估
摘要
本文在《中国好声音》这一音乐选秀节目备受欢迎的背景下,对《中国好声音》的影响力进行评估并建立以下模型。
模型一:灰色预测模型。为了更能准确的预测第八期到十六期的收视率,我们通过在百度百科上搜查的权威数据,但考虑到数据很少的情况,我们首先采用了灰色预测模型,以过去七期的收视率为依据,建立了GM(1,1)的灰微分方程模型求得其影子方程,得出未来收视率,再利用MATLAB 做出收视率趋势图。我们由图中可以看出,随着时间的变化,收视率一直呈增长趋势,但后期增长态势较为缓和。此外,为了给中国的品牌量出价值,树立名牌意识,增强国际竞争,我国制定了品牌价值的衡量公式:P=M+S+D。在这个标准体系下的价值量化,基本能够体现人们心目中中国品牌现状及其各自的地位状况,可以成为衡量中国品牌现状的一个参考。通过查阅资料知道《中国好声音》的总制作成本6000万元,而总收入为10亿元,其中利润为9.4亿元。根据品牌价值公式计算得到P 6. 27亿元。
模型二:文本挖掘模型。首先运用搜索引擎,对各新闻网站关于《中国好声音》的报道数据进行统计。接着根据所选取的百度新闻、腾讯新闻和凤凰新闻三个网络媒体中1到8月内对《中国好声音》的报道数量,并将这三个网络媒体中1到8月份期间,各月份的关于《中国好声音》的报道新闻数量进行统计、拟合,最终得出《中国好声音》在百度新闻、腾讯新闻和凤凰新闻三大网站上的影响力综合指数分别为0.242911、0.151049和0.007431。
本文运用的结构化的思想、数据挖掘的方法还可以运用到海量数据的处理上,比如对于网站海量信息的分类。
关键词:灰色预测模型,收视率,文本挖掘模型,影响力,MATLAB
一、问题分析
本文以当下热播的选秀类节目《中国好声音》作为背景,为了定量预测其影响力。根据以往收视率数据通过建立数学模型,预测出后期节目的收视情况以体现其影响力。并计算出《中国好声音》的品牌价值,通过查找其前期制作,宣传的投入费用,以及节目播出后获得的广告费,赞助费等,通过中国目前现有的价值品牌评价指标可求得其现有品牌价值。再利用文本挖掘模型通过对数据的拟合,计算出《中国好声音》在具有代表性的知名网站的影响力。
二、符号说明
字母符号
符号解释 模型序列
X Z
X 的均值生成序列
发展系数 灰色作用量 绝对残差序列 相对残差序列 关联度系数 综合影响力指标
a
b
∆
φ r I
三、模型假设
1、每期节目的播放不受外界其他事件干扰;
2、从百度百科上查得的节目收视率真实;
3、每位观众都是本着自愿原则选择是否观看该节目;
四、模型的建立与求解
(一)模型一:灰色预测模型[1] 1. 模型的建立
令X (0)为GM(1,1)建模序列,
X (0)=(x (0)(1),x (0)(2),...,x (0)(n )) ,
X (1)为X (0)的1-AGO 序列,
X (1)=(x (1)(1),x (1)(2),...,x (1)(n )) , x (k ) =
(1)
∑x
i =1
k
(0)
(i ) , k =1,2,..., n
令Z (1)为X (1)的紧邻均值生成序列,
Z (1)=(z (1)(2),z (1)(3),...,z (1)(n ))
z (1) (k ) =0.5x (1) (k ) +0.5x (1) (k -1)
则GM(1,1)的定义型,即GM(1,1)的灰微分方程模型为
x (0) (k ) +az (1) (k ) =b
ˆ=(a , b ) T ,ˆ为待估参数向量,即α式中a 称为发展系数,b 为灰色作用量。设α
则灰微分方程(7.3.2)的最小二乘估计参数列满足
α=(B T B ) -1B T Y n 其中
⎡-z (1)(2)1⎤⎡x (0)(2)⎤
⎢(1)⎥⎢(0)⎥-z (3)1⎥, Y n =⎢x (3)⎥ B =⎢⎢... ⎢... ⎥... ⎥⎢(1)⎥⎢(0)⎥-z (n ) 1⎢⎥⎢⎣⎦⎣x (n ) ⎥⎦
∧
称
dx (1)
+ax (1)=b dt
为灰色微分方程x (0) (k ) +az (1) (k ) =b 的白化方程,也叫影子方程。
如上所述,则有
dx (1)
+ax (1)=b 的解也称时间响应函数为 1)白化方程dt
b b
ˆ(1)(t ) =(x (1)(0)-) e -at + x
a a
2)GM(1,1)灰色微分方程x (0) (k ) +az (1) (k ) =b 的时间响应序列为
ˆ(1)(k +1) =[x (1)(0)-x
b -ak b
]e +,k =1,2,..., n
a a
3)取x (1)(0)=x (0)(1),则
ˆ(1)(k +1) =[x (0)(1)-x
b -ak b
]e +,k =1,2,..., n
a a
2. 模型的求解
设X (0)(k ) ={3.62,4.17,4.63,4.885,5.011,5.08,5.257}
对于x (0) (k ) +az (1) (k ) =b 公式,通过MATLAB [2]求得:a=-0.5360,b=-0.1008 根据1—7期数据,运用MATLAB 预测出未来8—16期的收视率:
表1 收视率预测表
期数 收视率 期数 收视率 1 3.6200 9 5.2843 2 4.1728 10 5.2983 3 4.5823 11 5.3066 4 4.8614 12 5.3115 5 5.0411 13 5.3143 6 5.1525 14 5.3160 7 5.2200 15 5.3169 8 5.2604 16 5.3175 由上述收视率统计结果可绘制出图1,根据图1的变化趋势,可以得出以下结论:在不受重大事件的影响下,收视率将继续增长,但增长幅度会趋于平稳。
图1 收视率变化趋势
3. 模型检验
3.1 残差检验
ˆ(1)(k ) ,得 (1)根据预测公式,计算X
ˆ(1)(k ) ={3.62,7.79,12.42,17.305,22.316,27.573,32.830}X
(k =0,1, „ ,6)
ˆ(0)(k ) 序列,k =1,2, „ ,6 (2)累减生成X
ˆ(0)(k ) ={3.6200,4.1728,4.5823,4.8614,5.0411,5.1525,5.2200}X
原始序列:X (0)(k ) ={3.62,4.17,4.63,4.885,5.011,5.08,5.257}
(3)计算绝对残差和相对残差序列
绝对残差序列:∆(0)={0,0.0028,0.0477,0.0236,0.0301,0.0725,
0.037}
相对残差序列:φ={0,0.07%,1.03%,0.48%,0.6%,0.7%,}
相对残差不超过1.03%,模型精确度高。
3.2 进行关联度检验
ˆ(0)的绝对残差序列∆(0)(k ) (1) 计算序列x (0)与x
∆(0)={0,0.02,0,0.04,0.02,0.01}
min{∆(0)(k ) } = min{0,0.0028,0.0477,0.0236,0.0301,0.0725,
0.037}= 0
max{∆(0)(k ) } = max{0,0.0028,0.0477,0.0236,0.0301,0.0725,
0.037}= 0.0725
(2) 计算关联系数
由于只有两个序列(即一个参考序列,一个被比较序列)故不再寻求第二级最小差和最大差。
η(k ) =
min{∆(k )}+P max{∆(k )}
(k =1,..., 6, P =0. 5)
∆(k ) +P max{∆(k )}
求得η(k ) ={ 0.5500,0.4600,0.2550,0.1250,0.0700,0.1770}
(3) 计算关联度
1n
r i =∑ηi (k ) =0.51
n k =1
r =0.51是满足P=0.5时的检验准则r >0.5的。 3.3 后验差检验
(1)计算:(0)=
1
[3.62+4.17+4.63+4.885+5.011+5.08+5.257]=4.66 7
(2)计算X (0) 序列的均方差:
[x S =(
1
(0)
(k ) -(0)]2
n -1
) 1/2=0.5815
(3)计算残差的均值:=(4)计算残差的均方差:
S 2
1
[∆(k ) ]=0.03 7
2
[∆(k ) -]=(
n -1
) 1/2=0.0251
(5)计算C :C =
S 2
=0.0251/0.5815=0.0432 S 1
(6)计算小残差概率:S 0=0.51⨯0.5815=0.2966
e k =∆(k ) -={0.03,0.027,0.018,0.006,0.0001,0.0425,0.007}
所有e i 都小于S 0,故小残差概率P {e i
现在我们研究《中国好声音》品牌价值,关于这部分的研究,我们采用符合中国实际情况的价值品牌评价公式进行计算。其公式为P =M +S +D 其中:
P :品牌的综合价值; M :品牌的市场竞争力; S :品牌的超值创利能力; D :品牌的发展潜力。
通过查询资料可知,《中国好声音》总收入10亿,制作成本6000万,净利润为9.4亿。
M=10⨯109⨯5.02%=5.02⨯108元(5.02%为收视率的平均值)
S=9.4⨯109⨯0.5=3.7⨯109元 D=9.4⨯109⨯0.22=2.068⨯109元
从而得到品牌价值P 为6.27亿元。 (二)模型二:文本挖掘模型[3]
对于新兴媒体来说,主要是互联网方面,我们可以采用以下做法来定量衡量中国好声音的影响力:
首先选取知名网络新闻媒体,在此们选择了新浪新闻网、腾讯新闻网、百度新闻网、网易新闻网和凤凰新闻网等五大新闻网站作为评价的载体。在网络上获
取到这五家新闻网站报道中国好声音相关新闻的数量,如表1所示:
表1 新闻网站报道中国好声音相关新闻的数量
[4]
单位:条
新闻网站 新浪新闻网 腾讯新闻网 百度新闻网 网易新闻网 凤凰新闻网 报到相关 新闻数量
由上表数据选取百度新闻、腾讯新闻和凤凰新闻作为具有代表性的网络媒体进行分析,运用搜索引擎搜索到从2013年1月到8月各个月份的关于中国好声音的新闻数量
16134
113308
3580000
12000 7963884
B ij (i =1, 2, 3; j =1, 2, 3, 4, 5, 6, 7, 8),如表2所示:
表2 百度新闻2013年各月份报道中国好声音相关新闻的数量 单位:条
时间 1月 2月 3月 4月 5月 6月 7月 8月
新闻
1030000 854600
数量
966000 1040000 1010000 1240000 1800000
2750000
图1 2013年百度新闻各月份中国好声音的新闻数量
[6]
表3 腾讯新闻2013年各月份报道中国好声音相关新闻的数量 单位:条
时间 新闻 1月
36900
2月
38700
3月
43610
4月
50050
5月
68650
6月
77650
7月
101000
8月
104580
图2 2013年腾讯新闻各月份中国好声音的新闻数量
[5]
表4 凤凰新闻2013年各月份报道中国好声音相关新闻的数量 单位:条
时间 1月 2月 3月 4月 5月 6月 7月 8月
新闻
1569000 1953000 2003200 2600890 3888500 4370600 6820000
7653000
数量
图4 2013年凤凰新闻各月份中国好声音的新闻数量
由图可以发现百度新闻、腾讯新闻和凤凰新闻的统计的折线图上点的分布与传统媒体大致相似,可以采取类似的处理方法
∑B
I 1=
j =2
8
1j 8
-∑B 1j
j =1
4
∑B
j =2
1j
∑B
I 2=
j =2
8
2j 8
-∑B 2j
j =1
4
∑B
j =2
2j
而对于新闻报道来说,可以由前六个月的报道量通过线性拟合的方法来预测出没有播出《中国好声音》的情况下后四个月的信息量。
用Microsoft Office Excel 2003的线性拟合方法拟合出方程为:
y =5. 2381x +22. 426将x j (j =1, 2, 3, 4)代入y =5. 2381x +22. 426得到后六个月的预测数
据。拿后六个月的预测数据与后六个月的实际数据进行比较
z j =
B 3j -y j
B 3j
8
算出综合影响力指标 I 3
=∑Z j
j =1
由此得出百度新闻、腾讯新闻和凤凰新闻所反应出中国好声音的影响力I 1、I 2、
I 3分别是0.042911、0.121049和0.207431。
五、模型评价与推广
本文思路清晰,模型恰当,具有很强的适用性和推广型。由于所查询到的数据需要进行后期处理,故我们灵活利用EXCEL ,MATLAB 等软件作出必须的图表,这样给统计数据和处理数据带来了很大的方便。
利用了灰色预测模型,简化了模型建立难度,并且可方便地利用数学软件进行求解。因此本模型因其预测性,可以广泛的运用于按时间顺序排列的、随时间变化且互相关联的数据序列。例如商品销售额的预测、发电总量的预测、全民所有制单位固定资产投资总额的预测。
运用文本挖掘模型定量分析影响力没有数学上确定的计算方法,而影响力也包括了社会的方方面面,很难定量来评价。在模型的建立过程中我们着重从“影响力”这个关键词入手深入分析。采用媒体这个侧面来分析影响力,因为媒体是采集和发布信息的主要载体,其覆盖面广泛并且传播力强。在众多媒体中,我们采用了传统的媒体和现代媒体两方面并选取世界最知名的媒体来收集数据,因为这两大媒体在现代社会是并存的,这样保证了数据的全面性和可靠性。数据采集采用先进的文本挖掘和互联网数据查询技术,以此获得大量的可用数据。
其不足之处在于,虽然利用灰色预测的出的数据相对接近真实值,但由于数据量不够充足,还是造成了很大误差,需要查询更精确的数据以待改进。而且文本挖掘模型也因媒体个数众多,数据海量,由于时间和精力的有限性,获得的数据的覆盖面还是不能完全达到要求。另一方面,文本挖掘的工具不够先进,掌握的技术有限,因此数据的挖掘过程进行的不彻底,数据的可靠性会受到一定的影响。
参考文献
[1] 姜启源,谢金星,叶俊,数学模型,北京:高等教育出版社,2003。 [2] 黄忠霖,黄京,基本科学计算的MATLAB 实现,北京:国防工业出版社, 2011。 [3] 孙 峰,浅述数据挖掘,甘肃科技,26(9):19-34,2010。 [4] 百度新闻,http://news.baidu.com/,2013.8.29。 [5] 腾讯新闻,http://news.qq.com/,2013.8.29。 [6] 凤凰新闻,http://www.ifeng.com/,2013.8.2。
附录:
matlab 预算未来收视率
clc,clear
x1=[3.62,4.17,4.63,4.885,5.01,5.08,5.257];
n=length(x1);
nian=1:16;
plot(nian,x1,'o-');
x0=diff(x1);
x0=[x1(1),x0]
for i=2:n
z1(i)=0.5*(x1(i)+x1(i-1));
end
z1
B=[-z1(2:end)',z1(2:end)'.^2]
Y=x0(2:end)'
abhat=B\Y %估计参数a,b 的值
x=dsolve('Dx+a*x=b*x^2','x(0)=x0'); %求解常微分方程
x=subs(x,{'a','b','x0'},{abhat(1),abhat(2),x1(1)}); %代入参数值 yuce=subs(x,'t',0:22) %计算预测值
digits(6); x=vpa(x) %显示微分方程的解,为了提高计算精度,把该语句放在计算预测值之后%或者不使用该语句
yuce(24)=yuce(23);
x1_all=[x1,1,10];
epsilon=x1_all-yuce %计算残差
delta=abs(epsilon./x1_all) %计算相对误差
delta_mean=mean(delta) %计算平均相对误差
x1_all_0=x1_all-x1_all(1); %数据列的始点零化像
yuce_0=yuce-yuce(1); %数据列的始点零化像
s0=abs(sum(x1_all_0(1:end-1))+0.5*x1_all_0(end));
s1=abs(sum(yuce_0(1:end-1))+0.5*yuce_0(end));
tt=yuce_0-x1_all_0;
s1_s0=abs(sum(tt(1:end-1))+0.5*tt(end));
absdegree=(1+s0+s1)/(1+s0+s1+s1_s0) %计算灰色绝对关联度
c=std(epsilon,1)/std(x1_all,1) %计算标准差比值
《中国好声音》的影响力评估
摘要
本文在《中国好声音》这一音乐选秀节目备受欢迎的背景下,对《中国好声音》的影响力进行评估并建立以下模型。
模型一:灰色预测模型。为了更能准确的预测第八期到十六期的收视率,我们通过在百度百科上搜查的权威数据,但考虑到数据很少的情况,我们首先采用了灰色预测模型,以过去七期的收视率为依据,建立了GM(1,1)的灰微分方程模型求得其影子方程,得出未来收视率,再利用MATLAB 做出收视率趋势图。我们由图中可以看出,随着时间的变化,收视率一直呈增长趋势,但后期增长态势较为缓和。此外,为了给中国的品牌量出价值,树立名牌意识,增强国际竞争,我国制定了品牌价值的衡量公式:P=M+S+D。在这个标准体系下的价值量化,基本能够体现人们心目中中国品牌现状及其各自的地位状况,可以成为衡量中国品牌现状的一个参考。通过查阅资料知道《中国好声音》的总制作成本6000万元,而总收入为10亿元,其中利润为9.4亿元。根据品牌价值公式计算得到P 6. 27亿元。
模型二:文本挖掘模型。首先运用搜索引擎,对各新闻网站关于《中国好声音》的报道数据进行统计。接着根据所选取的百度新闻、腾讯新闻和凤凰新闻三个网络媒体中1到8月内对《中国好声音》的报道数量,并将这三个网络媒体中1到8月份期间,各月份的关于《中国好声音》的报道新闻数量进行统计、拟合,最终得出《中国好声音》在百度新闻、腾讯新闻和凤凰新闻三大网站上的影响力综合指数分别为0.242911、0.151049和0.007431。
本文运用的结构化的思想、数据挖掘的方法还可以运用到海量数据的处理上,比如对于网站海量信息的分类。
关键词:灰色预测模型,收视率,文本挖掘模型,影响力,MATLAB
一、问题分析
本文以当下热播的选秀类节目《中国好声音》作为背景,为了定量预测其影响力。根据以往收视率数据通过建立数学模型,预测出后期节目的收视情况以体现其影响力。并计算出《中国好声音》的品牌价值,通过查找其前期制作,宣传的投入费用,以及节目播出后获得的广告费,赞助费等,通过中国目前现有的价值品牌评价指标可求得其现有品牌价值。再利用文本挖掘模型通过对数据的拟合,计算出《中国好声音》在具有代表性的知名网站的影响力。
二、符号说明
字母符号
符号解释 模型序列
X Z
X 的均值生成序列
发展系数 灰色作用量 绝对残差序列 相对残差序列 关联度系数 综合影响力指标
a
b
∆
φ r I
三、模型假设
1、每期节目的播放不受外界其他事件干扰;
2、从百度百科上查得的节目收视率真实;
3、每位观众都是本着自愿原则选择是否观看该节目;
四、模型的建立与求解
(一)模型一:灰色预测模型[1] 1. 模型的建立
令X (0)为GM(1,1)建模序列,
X (0)=(x (0)(1),x (0)(2),...,x (0)(n )) ,
X (1)为X (0)的1-AGO 序列,
X (1)=(x (1)(1),x (1)(2),...,x (1)(n )) , x (k ) =
(1)
∑x
i =1
k
(0)
(i ) , k =1,2,..., n
令Z (1)为X (1)的紧邻均值生成序列,
Z (1)=(z (1)(2),z (1)(3),...,z (1)(n ))
z (1) (k ) =0.5x (1) (k ) +0.5x (1) (k -1)
则GM(1,1)的定义型,即GM(1,1)的灰微分方程模型为
x (0) (k ) +az (1) (k ) =b
ˆ=(a , b ) T ,ˆ为待估参数向量,即α式中a 称为发展系数,b 为灰色作用量。设α
则灰微分方程(7.3.2)的最小二乘估计参数列满足
α=(B T B ) -1B T Y n 其中
⎡-z (1)(2)1⎤⎡x (0)(2)⎤
⎢(1)⎥⎢(0)⎥-z (3)1⎥, Y n =⎢x (3)⎥ B =⎢⎢... ⎢... ⎥... ⎥⎢(1)⎥⎢(0)⎥-z (n ) 1⎢⎥⎢⎣⎦⎣x (n ) ⎥⎦
∧
称
dx (1)
+ax (1)=b dt
为灰色微分方程x (0) (k ) +az (1) (k ) =b 的白化方程,也叫影子方程。
如上所述,则有
dx (1)
+ax (1)=b 的解也称时间响应函数为 1)白化方程dt
b b
ˆ(1)(t ) =(x (1)(0)-) e -at + x
a a
2)GM(1,1)灰色微分方程x (0) (k ) +az (1) (k ) =b 的时间响应序列为
ˆ(1)(k +1) =[x (1)(0)-x
b -ak b
]e +,k =1,2,..., n
a a
3)取x (1)(0)=x (0)(1),则
ˆ(1)(k +1) =[x (0)(1)-x
b -ak b
]e +,k =1,2,..., n
a a
2. 模型的求解
设X (0)(k ) ={3.62,4.17,4.63,4.885,5.011,5.08,5.257}
对于x (0) (k ) +az (1) (k ) =b 公式,通过MATLAB [2]求得:a=-0.5360,b=-0.1008 根据1—7期数据,运用MATLAB 预测出未来8—16期的收视率:
表1 收视率预测表
期数 收视率 期数 收视率 1 3.6200 9 5.2843 2 4.1728 10 5.2983 3 4.5823 11 5.3066 4 4.8614 12 5.3115 5 5.0411 13 5.3143 6 5.1525 14 5.3160 7 5.2200 15 5.3169 8 5.2604 16 5.3175 由上述收视率统计结果可绘制出图1,根据图1的变化趋势,可以得出以下结论:在不受重大事件的影响下,收视率将继续增长,但增长幅度会趋于平稳。
图1 收视率变化趋势
3. 模型检验
3.1 残差检验
ˆ(1)(k ) ,得 (1)根据预测公式,计算X
ˆ(1)(k ) ={3.62,7.79,12.42,17.305,22.316,27.573,32.830}X
(k =0,1, „ ,6)
ˆ(0)(k ) 序列,k =1,2, „ ,6 (2)累减生成X
ˆ(0)(k ) ={3.6200,4.1728,4.5823,4.8614,5.0411,5.1525,5.2200}X
原始序列:X (0)(k ) ={3.62,4.17,4.63,4.885,5.011,5.08,5.257}
(3)计算绝对残差和相对残差序列
绝对残差序列:∆(0)={0,0.0028,0.0477,0.0236,0.0301,0.0725,
0.037}
相对残差序列:φ={0,0.07%,1.03%,0.48%,0.6%,0.7%,}
相对残差不超过1.03%,模型精确度高。
3.2 进行关联度检验
ˆ(0)的绝对残差序列∆(0)(k ) (1) 计算序列x (0)与x
∆(0)={0,0.02,0,0.04,0.02,0.01}
min{∆(0)(k ) } = min{0,0.0028,0.0477,0.0236,0.0301,0.0725,
0.037}= 0
max{∆(0)(k ) } = max{0,0.0028,0.0477,0.0236,0.0301,0.0725,
0.037}= 0.0725
(2) 计算关联系数
由于只有两个序列(即一个参考序列,一个被比较序列)故不再寻求第二级最小差和最大差。
η(k ) =
min{∆(k )}+P max{∆(k )}
(k =1,..., 6, P =0. 5)
∆(k ) +P max{∆(k )}
求得η(k ) ={ 0.5500,0.4600,0.2550,0.1250,0.0700,0.1770}
(3) 计算关联度
1n
r i =∑ηi (k ) =0.51
n k =1
r =0.51是满足P=0.5时的检验准则r >0.5的。 3.3 后验差检验
(1)计算:(0)=
1
[3.62+4.17+4.63+4.885+5.011+5.08+5.257]=4.66 7
(2)计算X (0) 序列的均方差:
[x S =(
1
(0)
(k ) -(0)]2
n -1
) 1/2=0.5815
(3)计算残差的均值:=(4)计算残差的均方差:
S 2
1
[∆(k ) ]=0.03 7
2
[∆(k ) -]=(
n -1
) 1/2=0.0251
(5)计算C :C =
S 2
=0.0251/0.5815=0.0432 S 1
(6)计算小残差概率:S 0=0.51⨯0.5815=0.2966
e k =∆(k ) -={0.03,0.027,0.018,0.006,0.0001,0.0425,0.007}
所有e i 都小于S 0,故小残差概率P {e i
现在我们研究《中国好声音》品牌价值,关于这部分的研究,我们采用符合中国实际情况的价值品牌评价公式进行计算。其公式为P =M +S +D 其中:
P :品牌的综合价值; M :品牌的市场竞争力; S :品牌的超值创利能力; D :品牌的发展潜力。
通过查询资料可知,《中国好声音》总收入10亿,制作成本6000万,净利润为9.4亿。
M=10⨯109⨯5.02%=5.02⨯108元(5.02%为收视率的平均值)
S=9.4⨯109⨯0.5=3.7⨯109元 D=9.4⨯109⨯0.22=2.068⨯109元
从而得到品牌价值P 为6.27亿元。 (二)模型二:文本挖掘模型[3]
对于新兴媒体来说,主要是互联网方面,我们可以采用以下做法来定量衡量中国好声音的影响力:
首先选取知名网络新闻媒体,在此们选择了新浪新闻网、腾讯新闻网、百度新闻网、网易新闻网和凤凰新闻网等五大新闻网站作为评价的载体。在网络上获
取到这五家新闻网站报道中国好声音相关新闻的数量,如表1所示:
表1 新闻网站报道中国好声音相关新闻的数量
[4]
单位:条
新闻网站 新浪新闻网 腾讯新闻网 百度新闻网 网易新闻网 凤凰新闻网 报到相关 新闻数量
由上表数据选取百度新闻、腾讯新闻和凤凰新闻作为具有代表性的网络媒体进行分析,运用搜索引擎搜索到从2013年1月到8月各个月份的关于中国好声音的新闻数量
16134
113308
3580000
12000 7963884
B ij (i =1, 2, 3; j =1, 2, 3, 4, 5, 6, 7, 8),如表2所示:
表2 百度新闻2013年各月份报道中国好声音相关新闻的数量 单位:条
时间 1月 2月 3月 4月 5月 6月 7月 8月
新闻
1030000 854600
数量
966000 1040000 1010000 1240000 1800000
2750000
图1 2013年百度新闻各月份中国好声音的新闻数量
[6]
表3 腾讯新闻2013年各月份报道中国好声音相关新闻的数量 单位:条
时间 新闻 1月
36900
2月
38700
3月
43610
4月
50050
5月
68650
6月
77650
7月
101000
8月
104580
图2 2013年腾讯新闻各月份中国好声音的新闻数量
[5]
表4 凤凰新闻2013年各月份报道中国好声音相关新闻的数量 单位:条
时间 1月 2月 3月 4月 5月 6月 7月 8月
新闻
1569000 1953000 2003200 2600890 3888500 4370600 6820000
7653000
数量
图4 2013年凤凰新闻各月份中国好声音的新闻数量
由图可以发现百度新闻、腾讯新闻和凤凰新闻的统计的折线图上点的分布与传统媒体大致相似,可以采取类似的处理方法
∑B
I 1=
j =2
8
1j 8
-∑B 1j
j =1
4
∑B
j =2
1j
∑B
I 2=
j =2
8
2j 8
-∑B 2j
j =1
4
∑B
j =2
2j
而对于新闻报道来说,可以由前六个月的报道量通过线性拟合的方法来预测出没有播出《中国好声音》的情况下后四个月的信息量。
用Microsoft Office Excel 2003的线性拟合方法拟合出方程为:
y =5. 2381x +22. 426将x j (j =1, 2, 3, 4)代入y =5. 2381x +22. 426得到后六个月的预测数
据。拿后六个月的预测数据与后六个月的实际数据进行比较
z j =
B 3j -y j
B 3j
8
算出综合影响力指标 I 3
=∑Z j
j =1
由此得出百度新闻、腾讯新闻和凤凰新闻所反应出中国好声音的影响力I 1、I 2、
I 3分别是0.042911、0.121049和0.207431。
五、模型评价与推广
本文思路清晰,模型恰当,具有很强的适用性和推广型。由于所查询到的数据需要进行后期处理,故我们灵活利用EXCEL ,MATLAB 等软件作出必须的图表,这样给统计数据和处理数据带来了很大的方便。
利用了灰色预测模型,简化了模型建立难度,并且可方便地利用数学软件进行求解。因此本模型因其预测性,可以广泛的运用于按时间顺序排列的、随时间变化且互相关联的数据序列。例如商品销售额的预测、发电总量的预测、全民所有制单位固定资产投资总额的预测。
运用文本挖掘模型定量分析影响力没有数学上确定的计算方法,而影响力也包括了社会的方方面面,很难定量来评价。在模型的建立过程中我们着重从“影响力”这个关键词入手深入分析。采用媒体这个侧面来分析影响力,因为媒体是采集和发布信息的主要载体,其覆盖面广泛并且传播力强。在众多媒体中,我们采用了传统的媒体和现代媒体两方面并选取世界最知名的媒体来收集数据,因为这两大媒体在现代社会是并存的,这样保证了数据的全面性和可靠性。数据采集采用先进的文本挖掘和互联网数据查询技术,以此获得大量的可用数据。
其不足之处在于,虽然利用灰色预测的出的数据相对接近真实值,但由于数据量不够充足,还是造成了很大误差,需要查询更精确的数据以待改进。而且文本挖掘模型也因媒体个数众多,数据海量,由于时间和精力的有限性,获得的数据的覆盖面还是不能完全达到要求。另一方面,文本挖掘的工具不够先进,掌握的技术有限,因此数据的挖掘过程进行的不彻底,数据的可靠性会受到一定的影响。
参考文献
[1] 姜启源,谢金星,叶俊,数学模型,北京:高等教育出版社,2003。 [2] 黄忠霖,黄京,基本科学计算的MATLAB 实现,北京:国防工业出版社, 2011。 [3] 孙 峰,浅述数据挖掘,甘肃科技,26(9):19-34,2010。 [4] 百度新闻,http://news.baidu.com/,2013.8.29。 [5] 腾讯新闻,http://news.qq.com/,2013.8.29。 [6] 凤凰新闻,http://www.ifeng.com/,2013.8.2。
附录:
matlab 预算未来收视率
clc,clear
x1=[3.62,4.17,4.63,4.885,5.01,5.08,5.257];
n=length(x1);
nian=1:16;
plot(nian,x1,'o-');
x0=diff(x1);
x0=[x1(1),x0]
for i=2:n
z1(i)=0.5*(x1(i)+x1(i-1));
end
z1
B=[-z1(2:end)',z1(2:end)'.^2]
Y=x0(2:end)'
abhat=B\Y %估计参数a,b 的值
x=dsolve('Dx+a*x=b*x^2','x(0)=x0'); %求解常微分方程
x=subs(x,{'a','b','x0'},{abhat(1),abhat(2),x1(1)}); %代入参数值 yuce=subs(x,'t',0:22) %计算预测值
digits(6); x=vpa(x) %显示微分方程的解,为了提高计算精度,把该语句放在计算预测值之后%或者不使用该语句
yuce(24)=yuce(23);
x1_all=[x1,1,10];
epsilon=x1_all-yuce %计算残差
delta=abs(epsilon./x1_all) %计算相对误差
delta_mean=mean(delta) %计算平均相对误差
x1_all_0=x1_all-x1_all(1); %数据列的始点零化像
yuce_0=yuce-yuce(1); %数据列的始点零化像
s0=abs(sum(x1_all_0(1:end-1))+0.5*x1_all_0(end));
s1=abs(sum(yuce_0(1:end-1))+0.5*yuce_0(end));
tt=yuce_0-x1_all_0;
s1_s0=abs(sum(tt(1:end-1))+0.5*tt(end));
absdegree=(1+s0+s1)/(1+s0+s1+s1_s0) %计算灰色绝对关联度
c=std(epsilon,1)/std(x1_all,1) %计算标准差比值