基于Web源的客户需求获取及分析方法

第10卷第9期2004年9月计算机集成制造系统

COmputerIntegratedManufacturingSyStemS

VOl.10NO.9Sep.2004

文章编号!1006-5911(2004)09-1165-06

基于Web源的客户需求获取及分析方法

郭伟 胡明艳

(天津大学机械工程学院 天津300072)

摘要!为把握市场动态和了解客户需求 提出一种从广域网中及时获取及分析客户信息的方法 在对比分

析分散式和集中式Web信息源优劣特征的基础上 提出了由集中式Web原始信息源到市场分析数据集间的映射关系 建立了以产品生命周期特征为基础的信息分析知识库以及相应的量化处理规则集 该方法基于所建立的知识库和分析规则 采用规则驱动的数据挖掘技术 首先进行原始Web信息单元特征定位分析 进而对信息单元中的客户需求进行词频统计分析和内容分析 以形成产品市场整体趋势以及系统的客户需求分布 最后结合典型行业的信息源进行了具体应用

关键词!源信息;客户需求;数据挖掘中图分类号!TP391.1文献标识码!A

0引言

客户需求是产品开发的驱动力 也是市场营销

不仅信息存储分散 而且内容也具有较大的发散性 对市场或客户的需求难以进行纵深地分析;集中式信息源围绕客户与市场来组织和展开 具有信息量大~涉及面广等诸多优点 为系统地进行用户需求分析提供了可能

表l分布方式

描分

布述于

决策的基础 但传统的市场调查方法由于成本高~周期长 已远不能满足企业对客户信息的需求 随着互联网的飞速发展 特别是集中汇聚客户信息的Web源已经成为了解客户需求~把握市场走向的重要渠道 其相关的理论方法和应用的研究日益成为

1~3]学术界与工业界关注的重点

Web的信息源特征分析

形式

特征

典型示例各网站的新闻频道

新闻~产品介绍~电子商务

信息量大但分散 获取和分析难度大 不全面

Web上的

分散式

多个网站

本文深入分析了Web信息源的特征 针对集中式信息源 建立了面向市场/客户分析的信息组织映射关系 详细介绍了相应的需求获取与分析的流程和方法 并以此为基础 结合汽车行业的典型信息源进行了工具的开发与具体应用的研究 ll.l基于Web的客户需求信息源特征分析

Web信息源特征

基于Web的客户需求信息的分布 总体上可以

集中在某一网站上

集中式

针对某一市场或产品的信息

BBS~产品论坛~厂商网站

信息量大且集中 获取方便 涉及面广

新浪网站的汽车论坛

从市场分析与客户需求角度出发 基于集中式

分为分散式和集中式两种(如表1) 分散式信息源

收稿日期!2003-08-18;修订日期!2003-11-27 基金项目!国家863/CIMS主题资助项目(2003AA415220) 作者简介!郭Web信息源的信息获取方法与基于市场调查方式

相比具有众多优点(如表2) 必将受到企业和客户

伟(1965-) 男 安徽人 天津大学机械工程学院教授 博士 主要从事CIMS的系统建模和集成技术~企业过程管理与优化等方

面的研究 E-mail:WguO@t u.edu.cn

计算机集成制造系统

第10卷

更大的重视O

表2信息获取途径集中式网络信息源市场调查(传统信息源)

信息获取成本成本低投入大成本高

信息数量数量庞大与投入有关

基于不同获取途径的信息特征对比表

时间

客户客户是

可靠性直接获取客户

内容广泛性涉及内容广泛根据预设的目标进行

产品\竞争\服务方面及时响应反应迟缓

周期短9实时反映客户信息

周期长

反馈慢

主动的信息9可靠性高客户是为提高可靠性被动的

必须加大投入

eb信息源的众多优点9必会使其成为集中式W

获取和分析客户需求的主要信息源O在集中式信息源中9网站论坛是最典型和实用的方式9许多商业网站都提供这种服务9通常每一个论坛都有主题9面向某一类或某一种产品9构成该主题的信息池O客

户通过在网站论坛注册与发表信息帖9形成丰富的用户信息9包含三类内容C①用户信息9如用户的姓名\年龄\职业\联系方式和经济状况等;②用户需求信息O如对产品的看法\意见\使用心得9构成一个信息单元9对某个品牌 产品而言9形成用户信息的聚集(产品信息池)O③产品 市场的累计信息9即某种产品的市场同步表现9产品在整个信息源中的关注状态等O

要求9构成以单元产品特征和技术特征为核心的两

S

第9期郭伟等:基于Web源的客户需求获取及分析方法研究

1167

表3典型分析知识库组织结构示例!汽车行业

面向整个信息源的知识框架

产品级

PLS}关注热点

产品名称型号生产商产量销量

PKD}子集 PKD}

机械部件ABS悬挂离合器

发动机功率.排量转速.扭矩油耗

投入期功能和技术

技术级

成熟期价格变化

衰退期不确定

成长期销售和售后服务

与产品所属的生命周期相联系的知识子集 技术类}转向机构助力方向盘

变速系统挂档自动挡手动挡

价格评论}

销售与售后服务}特约维修站.首保

政策法规}

降价性价比

税燃油税税改费

2.2基于规则的产品池信息单元特征定位分析在集中式Web信息源中 信息单元的特征表示

其中 X11

用户对产品焦点的关注 如产品的价格.服务.性能等0通过单元信息的特征分析 可以确定相关的PKD子集 并由此以相关的PKD子集为重点方向

与依据 使后续进行的信息单元的内容分析更为有效0

信息单元的特征分析 涉及了相关产品的PLS状态 根据分析知识库的构建 定义了下列两条规则以完成PLS状态界定和PKD的子集确定 由此完成单元信息的特征分析0以产品投入期为例 相关规则如下:

第一 依据市场 产品生命周期函数与信息源产品生命周期函数 确定关注产品的PLS值0(1>f(M S>=X1f1(M>+X2f2(S>0

其中 M S分别表示从市场分析维度和从信息源的结构特点分析维度出发的产品生命周期取值 X1和

(2>f1(M>=X11t+X12 +X13T

(3>f2(S>=X21P+X22O+X23 0

X12 X13 X21 X22和X23是各影响因子的权

重 与X1 X2形成一套权重体系 通过层次分析法(AHP>确定具体取值方案 然后选择典型产品的相关数据进行对比分析后确定最终取值0本文中(X1 X2 X11 X12 X13 X21 X22 X23>相应的取值为(0 4 0 6 0 5 0 2 0 3 0 4 0 5 0 1>0式中的t T P O和 分别代表表4中各影响因子的量纲-分值 是通过计算公式 中间值=(影响因子实际值-区间最小值>/(区间最大值-区间最小值> 计算出的中间值加上量纲下限得到的(无区间边界值取实际值的最大/最小值>0PLS的取值区间是依据典型产品的相关数据设计并验证的结果 与选取的分析对象.信息池容量等都有直接的关联 是以大量数据作为基础 以科学的数据挖掘方法---聚类分析[4~6]作为工具来确定的0

第二 依据产品信息单元的PLS状态值 确定关注产品的PKD子集0

EPLB:InVeSting} ThenInVeSting}0If

J

$

E

PKD:

(4>其中 J为信息单元所涉及的产品 $为相应的知识子集中的关键字0PKD子集中各类关键字是按照隶属度的大小有次序的排列的 如式(5>:

PKD:InVeSting}= TechnOlOgy} Price} Sale

(5>andSerVice} POlicy}}0

处于投入期的产品受到更多关注的往往是产品

本身的性能以及采用的新技术 因此技术类关键字作为首先分析的内容排在了PKD子集的最前沿

X2为各自权重0PLS的界定主要从两个方面考虑:①从市场分析维度分析产品所处的生命周期0瞬息万变的市场环境很难量化 只能选取可获得持续信息的细分市场进行分析0②从集中式信息源的数据结构和特点维度出发 挖掘相同周期的产品特性并量化其具体区间 实现产品的自动界定功能 如信息池累计存留时间.顾客发表评论的累计数量等都为产品周期的归属提供了可靠支持0其中 M S分别表示从市场分析维度和从信息源的结构特点分析维度出发的产品生命周期取值 X1和X2为各自权重0鉴于其各自因素的不同影响程度 将式(1>中f1(M>和f2(S>分解如下:

计算机集成制造系统

第10卷

其他类的关键字依此类推 其具体计算规则是选择

7

作一定周期的单元信息 按关键字进行词频统计

定和完善具有很重要的意义 先确定子集的初始状态 随着数据量的增加和方法的不断调整 以及分析结果的反馈 使用聚类分析等方法逐步完善各生命周期的PKD 为客户需求分析提供了参考

为其隶属于PKD子集的隶属度

市场整体分析和客户需求分析的效率与准确性对PKD的选择有很大的依赖性 因此PKD集的确

表4典型信息源中产品PLS状态界定判定规则

PLS及其取值区间

影响因子投入期 0 1

成长期 1 2 0.25 1 20 100 0.5 7.5 0.08 0.75 10 100 -10 10

成熟期 2 3 1 10 100 +> 7.5 100 0.75 min T 5

-10 10 min i

衰退期 3 4 10 +> 0 20 0 0.5 min T 5 +> -> -10 max i

分市场特征信息源特征

进入市场时间t a销售量 每周 市场占有率T %信息池累计存留时间P a信息池容量增长率O % %信息池容量增长变化率

0 0.25 0

20 0 0.5 0 0.08 max Oi 10 1

注!T 论坛存在时间 信息池容量增长率 平均每周信息单元数量的增长百分比 信息池容量增长变化率 同一信息池相邻

时间单元的增长率变化

2.3信息单元内容分析及其流程

信息单元的特征定位提供了关键字的有序集

合 PKD子集 为后续的内容分析奠定了基础 本文设计了用于论坛信息获取及信息单元内容分析的系统流程 如图2所示

第9期郭伟等:基于Web源的客户需求获取及分析方法研究

1169

表5论坛信息源结构及内容示例

客户信息

需求分析

职业

收入/(元/月)

年龄/车龄发表评论

/a

统计

品牌型号用户名时间评论内容(信息单元)

A

国内品牌

产品信息池

国际品牌

YOrk叶

2002-02-1559:4915:

Xmxm

2002-02-1516:07:50

技术性能评价

出租车司机4000

35/7

154

如果你现在用的高压线工作良

汽车论坛

好9那么即使你一味地加强火星塞的跳活能量9你也得不

到更多的马力输出

大家别急着买9我看还差得远呢9卖八万以内还算合理

价格评论

私企业主

>10000

37/3

54

3.2多层面的典型分析结果户需求统计数据显示平稳9在节假日期间都有规律性下降9此外在波动较大的时候都有针对本车型的事件(例如降价 促销等)发生9导致客户关注度的变化 由图4的累加图可以得到各车型的关注率9关注率的变化同样反应了市场的走向与波动

!长周期市场热点分析1

选取市场上五款经济型家庭轿车9根据2002-08-01至2002-10-31的信息源数据进行分析 图3 图4为长周期车型关注点击跟踪分析和点击分析累加图 由图3可以看出9在产品成熟期内9客

1170计算机集成制造系统

第10卷

!客户产品关注热点分析与相关内容分析2

选取A和B短周期的客户数据进行产品聚焦

场分析的理论方法 工具开发与应用等进行了积极的探索 参考文献!

1 ar-GUOGuOCing CHENGDOng WANGXiaOdOng etal.M

.Bei ing ChinaRenminUniVerSityketingmanagement M

郭国庆 成栋 王小东 等.市场营PreSS1997inChineSe.销管理 M .北京 中国人民大学出版社 1997. 2 iningOnWebXIEDanxia LIXiaOdOng.ApplicatiOnOfdatam

J .COmputerApplicatiOnS 2002 21 2 anddeSignOftOOlS

谢丹夏 李晓东数据挖掘技术在42-44inChineSe..Web

上的应用及其工具设计 计算机应用 J.200221242-44. 3 DANIELSJJ RISSLANDEL.AcaSe-baSedapprOachtO

intelligentinfOrmatiOnretrieVal A .PrOceedingSOfthe18th

annualinternatiOnalACMSIGIRCOnferenceOnReSearchandDeVelOpmentinInfOrmatiOnRetrieVal C .NeWYOrk NY USA ACMPreSS 1995.

LIUHOngyan CHENJian CHENGuOCing.ReVieWOfclaSSifi-catiOnalgOrithmSfOrdatamining J .JOurnalOfTSinghuaU-Sci Tech 2002 42 6 727-730 inChineSe .niVerSity 刘红岩 陈剑 陈国青.数据挖掘中数据分类算法综述 J .清华大学学报 自然科学版 2002 42 6727-730.

WEIKCNANCESBIPUSKORIUSGV.GainingcOn-SumerinSightSfrOmautOmatedtextualdataanalySiS A .PrO-ceedingSOfInStitutefOrOperatiOnSReSearchandtheManage- mentScienceSINFORMSSpring2000COnference C .

2000.GUOWei ZHENGJiangbO IHaiyan etal.MethOdOlOgyfOrprOductplanningbaSedOnmarketinfOrmatiOn J .JOurnal

OfCOmputer-AidedDeSign COmputerGraphicS2001 13

郭伟 郑江波 齐海燕 等.基于市1 48-51 inChineSe .

场综合分析的产品规划方法研究 J .计算机辅助设计与图形学学报 2001 13 1 48-51.

YEBingCHENYing.ReSearchOnSearchingInternetinfOr-matiOnOftradeprOductS J .COmputerIntegratedManufac-turingSyStemS 2002 8 6 487-490 inChineSe . 叶冰

陈鹰.行业产品的Internet信息搜索研究 J .计算机集成制造系统 2002 8 6487-490.

WANGJicheng PANJingui ZHANGFuyan.ReSearchOnWebtextmining J .JOurnalOfCOmputerReSearch DeVel-Opment 2000 37 5 513-520 inChineSe . 王继成 潘金贵 张福炎.W文本挖掘技术研究 ebJ .计算机研究与发展 2000 37 5 513-520.

分析 如表6所示 分析得出车型A的客户关注度

要高于B 同时 分析表明车型A和B的发动机及机械部件是当前用户都比较关注的结构部件 在表6的基础上 根据分析所确定的所属于产品A的发动机 机械部件和转向结构等客户信息单元集 可引入交互式分析 即由市场销售人员 产品设计人员参加的对信息单元内容的深度分析 以进一步建立完整客户需求

表6车型

评论数量580321

1

产品关注热点对比表

数量客户关注产品热点分析 前5名

2

3

4车轮 54

5变速机构

4 发动机 机械部件 转向结构

AB

241124

发动机 机械部件 126

87

85车身 63

42

变速机构 仪器部件

32

19

5 !其他典型分析3

将信息源积累的客户基本信息与市场热点分

析 产品关注热点分析等进行聚合分析 可进一步开展潜在客户的购买意向分析 现有客户服务需求与忠诚度分析以及围绕特定产品的内容深度分析等 4结束语

7 6 以Web为载体的信息源 为企业提供了新的动

态跟踪市场与分析客户需求的重要途径 本文在对网络信息源进行深入分析的基础上 利用数据挖掘的理论与方法 建立了完整的基于Web的客户信息获取与处理的理论方法与工具系统 并结合汽车行业进行了具体应用 取得了很好的效果 同时 对利

8 用Web信息源开展动态连续的客户需求分析与市

MethodologyofexploringandanalyzingtheVOcbasedonextensivewebdatasource

Sch.OfMechanicalEng. Tian inUniV. Tian in300072 China

Abstract InOrdertOtrackthemarkettrendSandObtainfullunderStandingOfVOiceOfCuStOmerS VOC aneWmethOdOfanalyZingdynamicprOductinfOrmatiOnthrOughtheWebmediaWaSpreSented.BaSedOntheanalySiSOfadVantageS diSadVantageSOfthediStributedandcOncentratedWebdataSOurce aSyStematicmappingrelatiOnShip frOmtheOriginalWebSOurcetOStructuredmarketingdataSetting WaSeStabliShed.ThenaknOWledgebaSeOrganiZedOnfeatureSOfPrOductSLifecycleStage PLS aSWellaStheinVOlVed

in-CuantitatiVeruleSuSedinclaSSifyingtheVOCinfOrmatiOn WaSdeVelOped.SO therule-driVendatamingmethOdWaSappliedtOidentifythePLSclaSSificatiOnOftheOriginaldatacell.FurthermOrethemethOdSOffreCuencycOuntingandcOntentanalyZingWerecOnductedtOthedatacellcOnSeCuentlySOthatbOthmar-kettrendandaSyStematicunderStandingOfVOCcOuldbeObtained.Finally adetailedprOceSSWaSpreS-entedbyuSingtypicalWebdataOnautOmOtiVeprOduct.Keywords dataSOurce VOiceOfcuStOmer datamining

ReceiVed18Aug.2003 accepted27NOV.2003.

FOundatiOnitem PrO ectSuppOrtedbytheNatiOnalHigh-Tech.R DPrOgram China NO.2003AA415220 .

GUOWei ~UMing-$On

基于Web源的客户需求获取及分析方法

作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:

郭伟, 胡明艳

天津大学,机械工程学院,天津,300072计算机集成制造系统

COMPUTER INTEGRATED MANUFACTURING SYSTEMS2004,10(9)11次

参考文献(8条)

1.郭国庆;成栋;王小东 市场营销管理 1997

2.王继成;潘金贵;张福炎 Web文本挖掘技术研究[期刊论文]-计算机研究与发展 2000(05)3.叶冰;陈鹰 行业产品的Internet信息搜索研究[期刊论文]-计算机集成制造系统 2002(06)

4.郭伟;郑江波;齐海燕 基于市场综合分析的产品规划方法研究[期刊论文]-计算机辅助设计与图形学学报2001(01)

5.WEI K C;NANCES B I;PUSKORIUS G V Gaining consumer insights from automated textual data analysis2000

6.刘红岩;陈剑;陈国青 数据挖掘中数据分类算法综述[期刊论文]-清华大学学报(自然科学版) 2002(06)7.DANIELS J J;RISSLAND E L A case-based approach to intelligent information retrieval 19958.谢丹夏;李晓东 数据挖掘技术在Web上的应用及其工具设计 2002(02)

引证文献(11条)

1.王新海.王志宏 Web客户隐性需求开发模式研究[期刊论文]-情报杂志 2009(1)

2.屠立.张树有 基于最小最大概率机的客户需求分类技术[期刊论文]-农业机械学报 2009(3)

3.崔剑.祁国宁.纪杨建.顾巧详.苏少辉.胡浩 基于客户结构阶层和BP的PLM客户需求[期刊论文]-浙江大学学报(工学版) 2008(3)

4.李君轶.杨敏 基于 Web 数据挖掘的旅游需求分析与预测[期刊论文]-旅游科学 2007(6)5.李益兵.熊志勇.王先轲 基于Web的客户需求获取方法研究与应用[期刊论文]-机械制造 2007(5)6.卢燕津.张昊.杨青海.祁国宁 大批量定制中的客户参与设计[期刊论文]-成组技术与生产现代化 2007(1)7.毛晓莉 浅析电子商务环境下我国旅游企业的客户获取[期刊论文]-昆明大学学报 2006(z1)8.陈丕庞 基于Web信息源的高校图书馆用户满意度测评方法的研究[期刊论文]-科技管理研究 2006(4)9.丁俊武.韩玉启.郑称德 基于TRIZ的产品需求获取研究[期刊论文]-计算机集成制造系统 2006(5)10.朱家诚 基于Web Services的客户定制产品设计系统研究[学位论文]博士 200511.丁俊武 基于创新问题解决理论的产品设计方法及其应用研究[学位论文]博士 2005

本文链接:http://d.g.wanfangdata.com.cn/Periodical_jsjjczzxt200409027.aspx

第10卷第9期2004年9月计算机集成制造系统

COmputerIntegratedManufacturingSyStemS

VOl.10NO.9Sep.2004

文章编号!1006-5911(2004)09-1165-06

基于Web源的客户需求获取及分析方法

郭伟 胡明艳

(天津大学机械工程学院 天津300072)

摘要!为把握市场动态和了解客户需求 提出一种从广域网中及时获取及分析客户信息的方法 在对比分

析分散式和集中式Web信息源优劣特征的基础上 提出了由集中式Web原始信息源到市场分析数据集间的映射关系 建立了以产品生命周期特征为基础的信息分析知识库以及相应的量化处理规则集 该方法基于所建立的知识库和分析规则 采用规则驱动的数据挖掘技术 首先进行原始Web信息单元特征定位分析 进而对信息单元中的客户需求进行词频统计分析和内容分析 以形成产品市场整体趋势以及系统的客户需求分布 最后结合典型行业的信息源进行了具体应用

关键词!源信息;客户需求;数据挖掘中图分类号!TP391.1文献标识码!A

0引言

客户需求是产品开发的驱动力 也是市场营销

不仅信息存储分散 而且内容也具有较大的发散性 对市场或客户的需求难以进行纵深地分析;集中式信息源围绕客户与市场来组织和展开 具有信息量大~涉及面广等诸多优点 为系统地进行用户需求分析提供了可能

表l分布方式

描分

布述于

决策的基础 但传统的市场调查方法由于成本高~周期长 已远不能满足企业对客户信息的需求 随着互联网的飞速发展 特别是集中汇聚客户信息的Web源已经成为了解客户需求~把握市场走向的重要渠道 其相关的理论方法和应用的研究日益成为

1~3]学术界与工业界关注的重点

Web的信息源特征分析

形式

特征

典型示例各网站的新闻频道

新闻~产品介绍~电子商务

信息量大但分散 获取和分析难度大 不全面

Web上的

分散式

多个网站

本文深入分析了Web信息源的特征 针对集中式信息源 建立了面向市场/客户分析的信息组织映射关系 详细介绍了相应的需求获取与分析的流程和方法 并以此为基础 结合汽车行业的典型信息源进行了工具的开发与具体应用的研究 ll.l基于Web的客户需求信息源特征分析

Web信息源特征

基于Web的客户需求信息的分布 总体上可以

集中在某一网站上

集中式

针对某一市场或产品的信息

BBS~产品论坛~厂商网站

信息量大且集中 获取方便 涉及面广

新浪网站的汽车论坛

从市场分析与客户需求角度出发 基于集中式

分为分散式和集中式两种(如表1) 分散式信息源

收稿日期!2003-08-18;修订日期!2003-11-27 基金项目!国家863/CIMS主题资助项目(2003AA415220) 作者简介!郭Web信息源的信息获取方法与基于市场调查方式

相比具有众多优点(如表2) 必将受到企业和客户

伟(1965-) 男 安徽人 天津大学机械工程学院教授 博士 主要从事CIMS的系统建模和集成技术~企业过程管理与优化等方

面的研究 E-mail:WguO@t u.edu.cn

计算机集成制造系统

第10卷

更大的重视O

表2信息获取途径集中式网络信息源市场调查(传统信息源)

信息获取成本成本低投入大成本高

信息数量数量庞大与投入有关

基于不同获取途径的信息特征对比表

时间

客户客户是

可靠性直接获取客户

内容广泛性涉及内容广泛根据预设的目标进行

产品\竞争\服务方面及时响应反应迟缓

周期短9实时反映客户信息

周期长

反馈慢

主动的信息9可靠性高客户是为提高可靠性被动的

必须加大投入

eb信息源的众多优点9必会使其成为集中式W

获取和分析客户需求的主要信息源O在集中式信息源中9网站论坛是最典型和实用的方式9许多商业网站都提供这种服务9通常每一个论坛都有主题9面向某一类或某一种产品9构成该主题的信息池O客

户通过在网站论坛注册与发表信息帖9形成丰富的用户信息9包含三类内容C①用户信息9如用户的姓名\年龄\职业\联系方式和经济状况等;②用户需求信息O如对产品的看法\意见\使用心得9构成一个信息单元9对某个品牌 产品而言9形成用户信息的聚集(产品信息池)O③产品 市场的累计信息9即某种产品的市场同步表现9产品在整个信息源中的关注状态等O

要求9构成以单元产品特征和技术特征为核心的两

S

第9期郭伟等:基于Web源的客户需求获取及分析方法研究

1167

表3典型分析知识库组织结构示例!汽车行业

面向整个信息源的知识框架

产品级

PLS}关注热点

产品名称型号生产商产量销量

PKD}子集 PKD}

机械部件ABS悬挂离合器

发动机功率.排量转速.扭矩油耗

投入期功能和技术

技术级

成熟期价格变化

衰退期不确定

成长期销售和售后服务

与产品所属的生命周期相联系的知识子集 技术类}转向机构助力方向盘

变速系统挂档自动挡手动挡

价格评论}

销售与售后服务}特约维修站.首保

政策法规}

降价性价比

税燃油税税改费

2.2基于规则的产品池信息单元特征定位分析在集中式Web信息源中 信息单元的特征表示

其中 X11

用户对产品焦点的关注 如产品的价格.服务.性能等0通过单元信息的特征分析 可以确定相关的PKD子集 并由此以相关的PKD子集为重点方向

与依据 使后续进行的信息单元的内容分析更为有效0

信息单元的特征分析 涉及了相关产品的PLS状态 根据分析知识库的构建 定义了下列两条规则以完成PLS状态界定和PKD的子集确定 由此完成单元信息的特征分析0以产品投入期为例 相关规则如下:

第一 依据市场 产品生命周期函数与信息源产品生命周期函数 确定关注产品的PLS值0(1>f(M S>=X1f1(M>+X2f2(S>0

其中 M S分别表示从市场分析维度和从信息源的结构特点分析维度出发的产品生命周期取值 X1和

(2>f1(M>=X11t+X12 +X13T

(3>f2(S>=X21P+X22O+X23 0

X12 X13 X21 X22和X23是各影响因子的权

重 与X1 X2形成一套权重体系 通过层次分析法(AHP>确定具体取值方案 然后选择典型产品的相关数据进行对比分析后确定最终取值0本文中(X1 X2 X11 X12 X13 X21 X22 X23>相应的取值为(0 4 0 6 0 5 0 2 0 3 0 4 0 5 0 1>0式中的t T P O和 分别代表表4中各影响因子的量纲-分值 是通过计算公式 中间值=(影响因子实际值-区间最小值>/(区间最大值-区间最小值> 计算出的中间值加上量纲下限得到的(无区间边界值取实际值的最大/最小值>0PLS的取值区间是依据典型产品的相关数据设计并验证的结果 与选取的分析对象.信息池容量等都有直接的关联 是以大量数据作为基础 以科学的数据挖掘方法---聚类分析[4~6]作为工具来确定的0

第二 依据产品信息单元的PLS状态值 确定关注产品的PKD子集0

EPLB:InVeSting} ThenInVeSting}0If

J

$

E

PKD:

(4>其中 J为信息单元所涉及的产品 $为相应的知识子集中的关键字0PKD子集中各类关键字是按照隶属度的大小有次序的排列的 如式(5>:

PKD:InVeSting}= TechnOlOgy} Price} Sale

(5>andSerVice} POlicy}}0

处于投入期的产品受到更多关注的往往是产品

本身的性能以及采用的新技术 因此技术类关键字作为首先分析的内容排在了PKD子集的最前沿

X2为各自权重0PLS的界定主要从两个方面考虑:①从市场分析维度分析产品所处的生命周期0瞬息万变的市场环境很难量化 只能选取可获得持续信息的细分市场进行分析0②从集中式信息源的数据结构和特点维度出发 挖掘相同周期的产品特性并量化其具体区间 实现产品的自动界定功能 如信息池累计存留时间.顾客发表评论的累计数量等都为产品周期的归属提供了可靠支持0其中 M S分别表示从市场分析维度和从信息源的结构特点分析维度出发的产品生命周期取值 X1和X2为各自权重0鉴于其各自因素的不同影响程度 将式(1>中f1(M>和f2(S>分解如下:

计算机集成制造系统

第10卷

其他类的关键字依此类推 其具体计算规则是选择

7

作一定周期的单元信息 按关键字进行词频统计

定和完善具有很重要的意义 先确定子集的初始状态 随着数据量的增加和方法的不断调整 以及分析结果的反馈 使用聚类分析等方法逐步完善各生命周期的PKD 为客户需求分析提供了参考

为其隶属于PKD子集的隶属度

市场整体分析和客户需求分析的效率与准确性对PKD的选择有很大的依赖性 因此PKD集的确

表4典型信息源中产品PLS状态界定判定规则

PLS及其取值区间

影响因子投入期 0 1

成长期 1 2 0.25 1 20 100 0.5 7.5 0.08 0.75 10 100 -10 10

成熟期 2 3 1 10 100 +> 7.5 100 0.75 min T 5

-10 10 min i

衰退期 3 4 10 +> 0 20 0 0.5 min T 5 +> -> -10 max i

分市场特征信息源特征

进入市场时间t a销售量 每周 市场占有率T %信息池累计存留时间P a信息池容量增长率O % %信息池容量增长变化率

0 0.25 0

20 0 0.5 0 0.08 max Oi 10 1

注!T 论坛存在时间 信息池容量增长率 平均每周信息单元数量的增长百分比 信息池容量增长变化率 同一信息池相邻

时间单元的增长率变化

2.3信息单元内容分析及其流程

信息单元的特征定位提供了关键字的有序集

合 PKD子集 为后续的内容分析奠定了基础 本文设计了用于论坛信息获取及信息单元内容分析的系统流程 如图2所示

第9期郭伟等:基于Web源的客户需求获取及分析方法研究

1169

表5论坛信息源结构及内容示例

客户信息

需求分析

职业

收入/(元/月)

年龄/车龄发表评论

/a

统计

品牌型号用户名时间评论内容(信息单元)

A

国内品牌

产品信息池

国际品牌

YOrk叶

2002-02-1559:4915:

Xmxm

2002-02-1516:07:50

技术性能评价

出租车司机4000

35/7

154

如果你现在用的高压线工作良

汽车论坛

好9那么即使你一味地加强火星塞的跳活能量9你也得不

到更多的马力输出

大家别急着买9我看还差得远呢9卖八万以内还算合理

价格评论

私企业主

>10000

37/3

54

3.2多层面的典型分析结果户需求统计数据显示平稳9在节假日期间都有规律性下降9此外在波动较大的时候都有针对本车型的事件(例如降价 促销等)发生9导致客户关注度的变化 由图4的累加图可以得到各车型的关注率9关注率的变化同样反应了市场的走向与波动

!长周期市场热点分析1

选取市场上五款经济型家庭轿车9根据2002-08-01至2002-10-31的信息源数据进行分析 图3 图4为长周期车型关注点击跟踪分析和点击分析累加图 由图3可以看出9在产品成熟期内9客

1170计算机集成制造系统

第10卷

!客户产品关注热点分析与相关内容分析2

选取A和B短周期的客户数据进行产品聚焦

场分析的理论方法 工具开发与应用等进行了积极的探索 参考文献!

1 ar-GUOGuOCing CHENGDOng WANGXiaOdOng etal.M

.Bei ing ChinaRenminUniVerSityketingmanagement M

郭国庆 成栋 王小东 等.市场营PreSS1997inChineSe.销管理 M .北京 中国人民大学出版社 1997. 2 iningOnWebXIEDanxia LIXiaOdOng.ApplicatiOnOfdatam

J .COmputerApplicatiOnS 2002 21 2 anddeSignOftOOlS

谢丹夏 李晓东数据挖掘技术在42-44inChineSe..Web

上的应用及其工具设计 计算机应用 J.200221242-44. 3 DANIELSJJ RISSLANDEL.AcaSe-baSedapprOachtO

intelligentinfOrmatiOnretrieVal A .PrOceedingSOfthe18th

annualinternatiOnalACMSIGIRCOnferenceOnReSearchandDeVelOpmentinInfOrmatiOnRetrieVal C .NeWYOrk NY USA ACMPreSS 1995.

LIUHOngyan CHENJian CHENGuOCing.ReVieWOfclaSSifi-catiOnalgOrithmSfOrdatamining J .JOurnalOfTSinghuaU-Sci Tech 2002 42 6 727-730 inChineSe .niVerSity 刘红岩 陈剑 陈国青.数据挖掘中数据分类算法综述 J .清华大学学报 自然科学版 2002 42 6727-730.

WEIKCNANCESBIPUSKORIUSGV.GainingcOn-SumerinSightSfrOmautOmatedtextualdataanalySiS A .PrO-ceedingSOfInStitutefOrOperatiOnSReSearchandtheManage- mentScienceSINFORMSSpring2000COnference C .

2000.GUOWei ZHENGJiangbO IHaiyan etal.MethOdOlOgyfOrprOductplanningbaSedOnmarketinfOrmatiOn J .JOurnal

OfCOmputer-AidedDeSign COmputerGraphicS2001 13

郭伟 郑江波 齐海燕 等.基于市1 48-51 inChineSe .

场综合分析的产品规划方法研究 J .计算机辅助设计与图形学学报 2001 13 1 48-51.

YEBingCHENYing.ReSearchOnSearchingInternetinfOr-matiOnOftradeprOductS J .COmputerIntegratedManufac-turingSyStemS 2002 8 6 487-490 inChineSe . 叶冰

陈鹰.行业产品的Internet信息搜索研究 J .计算机集成制造系统 2002 8 6487-490.

WANGJicheng PANJingui ZHANGFuyan.ReSearchOnWebtextmining J .JOurnalOfCOmputerReSearch DeVel-Opment 2000 37 5 513-520 inChineSe . 王继成 潘金贵 张福炎.W文本挖掘技术研究 ebJ .计算机研究与发展 2000 37 5 513-520.

分析 如表6所示 分析得出车型A的客户关注度

要高于B 同时 分析表明车型A和B的发动机及机械部件是当前用户都比较关注的结构部件 在表6的基础上 根据分析所确定的所属于产品A的发动机 机械部件和转向结构等客户信息单元集 可引入交互式分析 即由市场销售人员 产品设计人员参加的对信息单元内容的深度分析 以进一步建立完整客户需求

表6车型

评论数量580321

1

产品关注热点对比表

数量客户关注产品热点分析 前5名

2

3

4车轮 54

5变速机构

4 发动机 机械部件 转向结构

AB

241124

发动机 机械部件 126

87

85车身 63

42

变速机构 仪器部件

32

19

5 !其他典型分析3

将信息源积累的客户基本信息与市场热点分

析 产品关注热点分析等进行聚合分析 可进一步开展潜在客户的购买意向分析 现有客户服务需求与忠诚度分析以及围绕特定产品的内容深度分析等 4结束语

7 6 以Web为载体的信息源 为企业提供了新的动

态跟踪市场与分析客户需求的重要途径 本文在对网络信息源进行深入分析的基础上 利用数据挖掘的理论与方法 建立了完整的基于Web的客户信息获取与处理的理论方法与工具系统 并结合汽车行业进行了具体应用 取得了很好的效果 同时 对利

8 用Web信息源开展动态连续的客户需求分析与市

MethodologyofexploringandanalyzingtheVOcbasedonextensivewebdatasource

Sch.OfMechanicalEng. Tian inUniV. Tian in300072 China

Abstract InOrdertOtrackthemarkettrendSandObtainfullunderStandingOfVOiceOfCuStOmerS VOC aneWmethOdOfanalyZingdynamicprOductinfOrmatiOnthrOughtheWebmediaWaSpreSented.BaSedOntheanalySiSOfadVantageS diSadVantageSOfthediStributedandcOncentratedWebdataSOurce aSyStematicmappingrelatiOnShip frOmtheOriginalWebSOurcetOStructuredmarketingdataSetting WaSeStabliShed.ThenaknOWledgebaSeOrganiZedOnfeatureSOfPrOductSLifecycleStage PLS aSWellaStheinVOlVed

in-CuantitatiVeruleSuSedinclaSSifyingtheVOCinfOrmatiOn WaSdeVelOped.SO therule-driVendatamingmethOdWaSappliedtOidentifythePLSclaSSificatiOnOftheOriginaldatacell.FurthermOrethemethOdSOffreCuencycOuntingandcOntentanalyZingWerecOnductedtOthedatacellcOnSeCuentlySOthatbOthmar-kettrendandaSyStematicunderStandingOfVOCcOuldbeObtained.Finally adetailedprOceSSWaSpreS-entedbyuSingtypicalWebdataOnautOmOtiVeprOduct.Keywords dataSOurce VOiceOfcuStOmer datamining

ReceiVed18Aug.2003 accepted27NOV.2003.

FOundatiOnitem PrO ectSuppOrtedbytheNatiOnalHigh-Tech.R DPrOgram China NO.2003AA415220 .

GUOWei ~UMing-$On

基于Web源的客户需求获取及分析方法

作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:

郭伟, 胡明艳

天津大学,机械工程学院,天津,300072计算机集成制造系统

COMPUTER INTEGRATED MANUFACTURING SYSTEMS2004,10(9)11次

参考文献(8条)

1.郭国庆;成栋;王小东 市场营销管理 1997

2.王继成;潘金贵;张福炎 Web文本挖掘技术研究[期刊论文]-计算机研究与发展 2000(05)3.叶冰;陈鹰 行业产品的Internet信息搜索研究[期刊论文]-计算机集成制造系统 2002(06)

4.郭伟;郑江波;齐海燕 基于市场综合分析的产品规划方法研究[期刊论文]-计算机辅助设计与图形学学报2001(01)

5.WEI K C;NANCES B I;PUSKORIUS G V Gaining consumer insights from automated textual data analysis2000

6.刘红岩;陈剑;陈国青 数据挖掘中数据分类算法综述[期刊论文]-清华大学学报(自然科学版) 2002(06)7.DANIELS J J;RISSLAND E L A case-based approach to intelligent information retrieval 19958.谢丹夏;李晓东 数据挖掘技术在Web上的应用及其工具设计 2002(02)

引证文献(11条)

1.王新海.王志宏 Web客户隐性需求开发模式研究[期刊论文]-情报杂志 2009(1)

2.屠立.张树有 基于最小最大概率机的客户需求分类技术[期刊论文]-农业机械学报 2009(3)

3.崔剑.祁国宁.纪杨建.顾巧详.苏少辉.胡浩 基于客户结构阶层和BP的PLM客户需求[期刊论文]-浙江大学学报(工学版) 2008(3)

4.李君轶.杨敏 基于 Web 数据挖掘的旅游需求分析与预测[期刊论文]-旅游科学 2007(6)5.李益兵.熊志勇.王先轲 基于Web的客户需求获取方法研究与应用[期刊论文]-机械制造 2007(5)6.卢燕津.张昊.杨青海.祁国宁 大批量定制中的客户参与设计[期刊论文]-成组技术与生产现代化 2007(1)7.毛晓莉 浅析电子商务环境下我国旅游企业的客户获取[期刊论文]-昆明大学学报 2006(z1)8.陈丕庞 基于Web信息源的高校图书馆用户满意度测评方法的研究[期刊论文]-科技管理研究 2006(4)9.丁俊武.韩玉启.郑称德 基于TRIZ的产品需求获取研究[期刊论文]-计算机集成制造系统 2006(5)10.朱家诚 基于Web Services的客户定制产品设计系统研究[学位论文]博士 200511.丁俊武 基于创新问题解决理论的产品设计方法及其应用研究[学位论文]博士 2005

本文链接:http://d.g.wanfangdata.com.cn/Periodical_jsjjczzxt200409027.aspx


相关文章

  • 毕业设计:基于JSP的留言簿系统的设计与制作
  • 编号 毕业设计论文 题目: 留言簿系统的设计与制作 摘 要 Internet是目前世界上最大的计算机互联网络,它遍布全球,将世界各地各种规模的网络连接成一个整体.作为Internet上一种先进的,易于被人们所接受的信息检索手段,World ...查看


  • 网上书店毕业论文
  • 毕业论文 SHANGHAIUNIVERSITY GRADUATION PROJECT (THESIS) 网上书店系统 Online BookStore System 学 院 高等技术学院 专 业 计算机技术与应用 学 号 姓 名 导 师 江 ...查看


  • 面向服务的战场态势感知与协同技术研究
  • 第2期2012 年4月 Journal of CAEIT Vol.7No.2Apr.2012 檵檵0 共用态势图(COP )简称态势图,是军事指挥部门了解战场态势的主要手段,是广泛的战场态势感知系统.服务和应用的一个关键部分,是服务于决策制 ...查看


  • 基于web的项目管理系统:调研报告
  • 研究生课程论文(调研报告) 调研题目: 基于Web 的项目管理系统的分析与研究 调研目的: 分析项目管理系统模块的设计与实现 调研对象: 项目管理系统 调研方法: 通过文献.文档及网络等研究分析 调研时间: 2015.11.15 - 201 ...查看


  • 空间信息技术导论论文
  • 空间信息技术在现代物流中的应用 摘要: 介绍了基于空间信息技术的物流信息系统构建目标.技术架构等问题: 通过空间信息技术在物流中的应用现状分析,指出了未来空间在物流中应用的 三大发展趋势:物流信息可视化.物流信息数据融合.物流网络优化.空间 ...查看


  • 数据产品规格说明书
  • 数据管控产品规格说明书 第一章 引言 1.1 编写目的 本文档作为数据管控产品体系(元数据和数据质量管理)的产品方案说明书,介绍元数据和数据质量的解决方案. 1.2 项目背景 经过多年建设,企业一般已经初步建成了各类管理信息系统,虽然在运用 ...查看


  • Web信息采集技术研究与发展
  • 第27卷第12期2009年12月 情报科学 Vol. 27, No. 12December,2009 ·综述· Web 信息采集技术研究与发展 庞景安 (中国科学技术信息研究所, 北京100038) 摘要:本文对Web 信息采集技术的重要研 ...查看


  • 毕业综合实践报告模板
  • 毕业综合实践报告 姓 名: 学 号: 系 部: 专 业: 软件技术 班 级: 软件1班 指导教师: 完成日期 2011年6月5日 JAVA BS开发模式在销售管理软件上的运用 摘要 本文分析了Browser/Client结构的特点,同时列举 ...查看


  • 人力资源管理系统软件工程毕业设计论文
  • 摘要 人力资源管理系统是现代企业的核心业务系统之一,人力资源管理的状况和水平对企业的运作和效率至关重要.现代企业人力资源管理的内容非常丰富,可能包含档案管理.合同管理.薪酬管理.招聘管理.绩效管理.系统管理等很多部分.在本次毕业设计中,我们 ...查看


热门内容