电子商务小论文

安徽农业大学研究生课程论文封面

教师填写:

本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的课程论文,是本人独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。

论文作者签名:

数据挖掘与个性化推荐研究

摘要

数据挖掘技术经过了几十年的迅速发展,不仅在理论研究方面取得厂巨大的进步,而且在零售业,金融业,电信业等众多的领域中也已经被广泛的应用。然而相对于数据挖掘技术在国外的普遍应用,数据挖掘技术在国内的应用仍然处于探索阶段。

个性化推荐系统的概念是参照国外成熟的电子商务企业的模式提出的。在各种社区性网站中均有应用,典型的像新闻类,音乐类还有大家接触较多的电商类。

本文介绍了数据挖掘的概念以及个性化推荐的相关案例,以综述的形式带大家走进个性化推荐的课题。

关键词:数据挖掘,个性化推荐系,电子商务

Abstract

Data mining technology after decades of rapid development, not only achieved great progress in plant research in theory, but in many areas of retail, financial services, telecommunications, etc. have also been widely used. However, with respect to the data mining technique widely used in foreign countries, data mining technology in the country is still in the exploratory stage.

The concept of personalized recommendation system is the reference to foreign mature e-commerce business model proposed. In a variety of community-based websites in both applications, typically as news, music classes have more contact with all the electricity supplier class.

This paper introduces the concept of data mining and personalized recommendation related cases, in the form of a review of take you into personalized recommendation subject.

Key words: Data mining, personalized recommendation system, e-commerce

目录

摘要 . ............................................................................................................ 3

Abstract ....................................................................................................... 3

第一章 绪论............................................................................................... 1

1.1 问题的提出 ................................................................................... 1

1.2 本文主要内容 ............................................................................... 1

第二章 数据挖掘与个性化推荐概述 .................................................. 2

2.1 数据挖掘的概念 ........................................................................... 2

2.2 数据挖掘的相关技术 ................................................................... 2

2.2.1人工智能和机器学习 ........................................................... 2

2.3 个性化推荐 ................................................................................... 3

第三章 个性化推荐案例讨论和研究 ...................................................... 4

3.1 新闻类网站的个性化推荐 ........................................................... 4

3.1.1 今日头条 .............................................................................. 4

3.1.2 无觅网 .................................................................................. 5

3.2 音乐类个性化推荐 ....................................................................... 6

3.2.1 网易云音乐 .......................................................................... 6

3.3 电商类个性化推荐 ....................................................................... 7

摘要 . ............................................................................................................ 8

第一章 绪论

1.1 问题的提出

首先先来讨论一个问题:为什么要数据挖掘?

2003年5月10日,淘宝网成立,由阿里巴巴集团投资创办。10月推出第三方支付工具“支付宝”,以“担保交易模式”使消费者对淘宝网上的交易产生信任。2003年全年成交总额3400万元。2005年,淘宝网超越eBay 易趣,并且开始把竞争对手们远远抛在身后。5月,淘宝网超越日本雅虎,成为亚洲最大的网络购物平台。2005年成交额破80亿元,超越沃尔玛。2006年,淘宝网成为亚洲最大购物网站,就在这一年,淘宝网第一次在中国实现了一个可能——互联网不仅仅是作为一个应用工具存在,它将最终构成生活的基本要素,调查数据显示,每天有近900万人上淘宝网“逛街”。

淘宝只用了三年,就缔造了一个商业帝国。淘宝网是中国电子商务的先驱。广义上讲,电子商务一词源自于Electronic Business ,就是通过电子手段进行的商业事务活动。通过使用互联网等电子工具,使公司内部、供应商、客户和合作伙伴之间,利用电子业务共享信息,实现企业间业务流程的电子化,配合企业内部的电子化生产管理系统,提高企业的生产、库存、流通和资金等各个环节的效率。狭义上讲,电子商务 (Electronic Commerce,简称 EC )是指:通过使用互联网等电子工具(这些工具包括电报、电话、广播、电视、传真、计算机、计算机网络、移动通信等)在全球范围内进行的商务贸易活动。是以计算机网络为基础所进行的各种商务活动,包括商品和服务的提供者、广告商、消费者、中介商等有关各方行为的总和。人们一般理解的电子商务是指狭义上的电子商务[1]。

电子商务平台的功能和效益已经无需赘述,我们现在的工作室如何将电商的优势发挥到最大化。传统的广告中,我们无限制无目的的大范围传播信息,但是到了电商时代,这种方式势必得不到认可,所以,个性化推荐也就是“个性化广告”随之诞生。

1.2 本文主要内容

本文分为四个部分:

第一部分绪论,介绍了研究的相关背景;

第二部分,解释了数据挖掘和个性化推荐的相关概念;

第三部分,就具体的个性化推荐案例展开讨论。

第二章 数据挖掘与个性化推荐概述

2.1 数据挖掘的概念

想要个性化推荐,首先需要大量的数据,那么,将数据挖掘出来并处理是第一步。但是,当数据量达到TB 级别的时候,只是简单的计算平均数之类已经无法得到确切的数据特征了,这个时候,我们需要运用更多的数学和计算机知识来“挖掘”数据。

利用数据挖掘技术, 可以从数据库或数据仓库的相关数据集中提取所感兴趣的知识、规律或更高层次的信息, 并可以从不同的角度来分析它, 从而可以更有效的利用数据库或数据仓库中的大量数据。利用数据挖掘技术不仅可以描述过去数据的发展, 还能够进一步预测未来的趋势。

总之,数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标 [2] 。

2.2 数据挖掘的相关技术

2.2.1人工智能和机器学习

如果你去查阅有关个性化推荐的资料,那么你肯定会查到很多关于数据挖掘的资料,如果你继续查询数据挖掘,那么将会有一大堆专业词汇出现:机器学习、统计分析、神经网络、人工智能、模式识别。

数据挖掘是一种概念,从数据中挖掘到有意义的信息。很多人认为数据挖掘是新学科,是基于大数据,其实不然,如果给你一个数据说李嘉诚有100多亿美元,再给你一个数据是全国平均人均可支配收入水平是一万多元人民币,你能挖掘出一个信息叫,李嘉诚很有钱,这也是数据挖掘。只不过很简单而已。

模式识别是目的,识别出一种模式,比如两个眼睛一个鼻子的是人脸的模式。如果不通过电脑,手工的通过计算来识别模式,也属于模式识别。模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。计算机的模式识别在20世纪60年代初迅速发展并成为一门新学科。

机器学习是一门涉及自学习算法发展的科学。机器学习是一种方法,通常用

来进行模式识别,用机器去学习不直观的数据得到模式,这其中会需要用到各种各样的知识,比如统计分析的知识。定义为:机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能[3]。

而人工智能,这个概念就大了,这个概念是想要人工制造出和人类一样的智能,所以很多人就想出了机器人这么一个科幻产物,有人类的智能,并且依托于机器的强大运算能力。事实上,人工智能也不一定要和电脑挂钩的,只不过现在只有电脑有这么强大的计算能力,如果有一天生物科技能够突破,说不定也能实现。人工智能的核心是机器学习。

理清楚这些概念之后,我们在下一节介绍个性化推荐。

2.3 个性化推荐

个性化推荐技术是最具人文关怀的技术之一,它尊重个体,相信每个人都是与众不同的,在这个以‘人’为中心的社会化时代,它的兴起与发扬光大只是时间问题。

在传统的营销策略当中,商家主要关注在20%的商品上创造80%收益的客户群,往往会忽略了那些在80%的商品上创造20%收益的客户群。这就是典型的二八法则的应用,而长尾理论的提出,直接打破了传统的二八法则,这是网络时代兴起的一种新理论,最初由美国《连线》杂志(Wired )总编辑克里斯·安德森于04年首先发表:由于成本和效率的因素,当商品储存流通展示的场地和渠道足够宽广,商品生产成本急剧下降以至于个人都可以进行生产,并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品,只要有卖,都会有人买。 在互联网环境下,由于货架成本极端低廉,恰好符合长尾理论描述的应用场景,其中最有名的案例就是电子商务亚马逊公司的成功,那些需求和销量不高的冷门书产品所占据的共同市场份额,居然可以和热门书的市场份额相当,甚至更大。直接刺激了各大公司对长尾效应的深入挖掘。

推荐系统应该是目前互联网世界最常见的一种智能产品形式。它的技术基础直接源于一系列的人工智能学科的成果。从自动推理、认知建模、机器学习、神经元网络、自然语言处理、专家系统、智能机器人等各个方面。人工智能学科诞生于上世纪50年代,由于计算机的产生与发展,人们开始了具有真正意义的人工智能的研究。

第三章 个性化推荐案例讨论和研究

3.1 新闻类网站的个性化推荐

平时我们接触的最多的就是新闻类的个性化推荐,如每日头条,新浪新闻,腾讯新闻,无觅网等等。下面就两个案例每日头条和无觅网进行介绍。

3.1.1 今日头条

众所周知,今日头条是个个性化的新闻推荐引擎,在短短两年多的时间内拥有了2.2亿用户,每天有超过2000万用户在今日头条上阅读自己感兴趣的文章。因此,今日头条也变成了非常多企业、自媒体人、网络营销人聚集的地方,大家都想借着今日头条的海量流量分到一杯羹。

和传统新闻媒体不同的是,每日头条并不自己编辑新闻,他推送的大多数新闻来自网络,今日头条做的事情就是根据阅读量和兴趣给用户推荐当日最热的新闻,所以才叫“今日头条”。

一般来说,新闻推送的规则有:

基于相同城市的新闻,基于文章关键词的推荐,基于站内热门文章的普适性推荐,基于社交好友关系的阅读习惯推荐,基于用户长期兴趣关键词的推荐,基于相似用户阅读习惯的列表推荐,基于站点分布来源的内容推荐。

那么,今日新闻具体是如何工作的呢,来看如下具体的操作。

第一登录的时候,我们会发现这个页面,在这个页面可以选择我们感兴趣的领域。现在大多数的门户网站都有类似的功能,这是个性化推荐的第一步,在用户尚未实际操作的时候,主动了解用户的兴趣。如果你选择了几个领域,那么你会发现接下来会铺天盖地的出现类似的新闻,因为对于系统来说,现在只有这一个用户数据。比如说我们选择本地,那么接下来就会出现城市选择菜单(如果开始GPS 定位则会自动定位)。如果我们选择数码,那么就会出现一大堆数码产品的新闻。

接下来,经过几次的操作之后,后台将会分析你的行为。今日头条的个性化推荐算法原理就是基于投票的方法,其核心理念就是投票,每个用户一票,喜欢哪一篇文章就把票投给这篇文章,经过统计,最后得到结果很可能是在这个人群下最好的文章,并把这篇文章推荐给同人群用户过程就是个性化推荐,实际上个性化推荐并不是机器给用户推荐,而是用户之间在互相推荐,看起来似乎很简单,但实际上这需要基于海量的用户行为数据挖掘与分析。

推荐的另外一个核心是分析用户群。推荐不可能针对每一个人去优化算法,

只能针对一个大群体去推荐,那么分析用户群就变成了关键。人群特征可以是阅读姓名,年龄,地域,职业等等。同理,文章也是类似的,文章有提到哪些名人,文章发布的时间,文章所属的地区等等,也都有很多特性,这些都是可以去组合起来。判断一个人属于怎样的人群相对简单。比如地域,用户的手机在什么区域,就可以认为用户是什么地域的; 比如说用户兴趣,可以根据用户的阅读习惯去判断,用户会经常去看科技的文章,那就可以判断用户属于科技的人群; 再比如说用户的好友关系,用户在今日头条上面注册了,用户的好友都是娱乐圈的人,则该用户很有可能也是娱乐圈的人; 所以通过用户在今日头条上行为,以及用户客观的地理位置信息,就能判断用户到底属于一个什么样的人群。

图3-1 今日头条APP 截图

3.1.2 无觅网

无觅网是个老牌个性化阅读网站了,推广不够,但是功能强大,现在无觅网网页端已经快下线了,但是手机app 还是可以进入,并且推出了新的平台无迷。无觅的退出可能是因为版权问题,但是它本身的功能还是毋庸置疑的。

无觅网是一个个性化阅读社区。在无觅网用户可以挑选自己喜欢的话题,并得到关于这些话题的推荐内容;还可以关注你感兴趣的其他用户,了解其他用户的阅读动态。无觅网利用人工智能技术根据用户阅读和喜欢过的内容,向用户推荐更多可能会感兴趣的内容。

无觅网利用人工智能技术,通过算法学习用户的阅读兴趣,结合用户的阅读兴趣向用户推荐其可能会感兴趣的互联网信息,帮助用户过滤掉他不感兴趣的内容。随着用户对于推荐结果反馈的增加,以及机器学习的深入,用户得到的推荐也越来越精准,最终实现为用户定制最符合其需求的互联网资讯,

打造一个个性

化的互联网。

无觅网定位个性化阅读社区,通过语义分析以及个性化推荐技术为每位用户提供专属的信息过滤与发现平台。用户在这个平台上进行阅读、分享和互动的行为将会不断改善自己后续获得的个性化内容,因此推荐结果同样也会越来越符合你的阅读喜好。

在无觅网用户除了可以获得其关注的话题的最新资讯,得到为其量身定制的内容推荐外,还可以关注他感兴趣的其他用户。可以关注用户所关注领域的权威专家,或者了解身边同事,亦或者用户在其他社交平台上认识的朋友。

通过关注不同的好友,可以了解好友喜欢过、评论过、分享过的内容;了解用户所关注领域的其他用户正在关注的话题和新闻;了解该领域权威专家对某一新闻和突发事件的观点评论。

3.2 音乐类个性化推荐

3.2.1 网易云音乐

网易云音乐是一款专注于发现与分享的音乐产品,依托专业音乐人、DJ 、

好友推荐及社交功能,在线音乐服务主打歌单、社交、大牌推荐和音乐指纹,以

歌单、DJ 节目、社交、地理位置为核心要素,主打发现和分享。

图4-1 网易云音乐个性化推荐界面

四种个性化推荐的模式都有所不同:每日歌曲推荐这个基本就靠数据库分析了,比如今天听过哪些歌,提取歌手、歌曲类型、所属专辑这些尽可能全面的信息,对你可能感兴趣的歌曲进行猜测。而第二个与第三个模块则随机抽选你历史喜欢的某一首歌曲进行推荐,方法同上。最后,则是根据歌单生成,歌单与歌单之间的相似度进行匹配,随机为你推荐匹配程度较高的歌单。

之所以做到精准推荐,是因为网易云音乐背后强大的数据支撑,我想没有任何一款音乐软件会针对用户喜好用户偏好去进行仔细研究,而云音乐则将曲库与用户偏好进行了匹配,根据用户在APP 中留下的点滴行为去做判断,这需要强大的数据分析能力。

3.3 电商类个性化推荐

电商网站比较普遍,在此不做详细介绍。淘宝的个性化推荐主要是“你可能喜欢的商品”,还有一些窗边广告。他的推荐目的性非常明显,可能你刚买了零食,一刷新可能就是满屏的零食小广告,个人觉得这种形式过于单一,淘宝目前要做的是要综合用户的其他行为,不能只是单纯的分析购买的行为,用户在浏览其他网页的过程中,也可能暴露他的习惯和计划,单纯的通过购买行为强加推荐完全相同的产品,未免过于单一。事实上,很多人的网购行为都过于发散,很多个人隐私确实是很难发现了,毕竟购买的行为要比阅读和听歌复杂的多。如何获取用户行为的细节,成为电商个性化推荐的关键。

摘要

[1]电子商务好搜百科[Online ], http://baike.haosou.com/doc/5333306.html

[2]数据挖掘百度百科[Online ],http://baike.baidu.com/view/7893.htm

[3]机器学习百度百科[Online ],

[4]BP 神经网络百度百科[Online ],http://baike.baidu.com/view/1753676.htm

[5]朱慧云,数据挖掘在电子商务中的应用研究[J],2007

[6]辛菊琴,综合用户偏好模型和BP 神经网络的个性化推荐[J],2008

[7]无觅网百度百科[Online ]

[8]网易云音乐百度百科[Online ],

http://baike.baidu.com/view/10017380.htm

安徽农业大学研究生课程论文封面

教师填写:

本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的课程论文,是本人独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。

论文作者签名:

数据挖掘与个性化推荐研究

摘要

数据挖掘技术经过了几十年的迅速发展,不仅在理论研究方面取得厂巨大的进步,而且在零售业,金融业,电信业等众多的领域中也已经被广泛的应用。然而相对于数据挖掘技术在国外的普遍应用,数据挖掘技术在国内的应用仍然处于探索阶段。

个性化推荐系统的概念是参照国外成熟的电子商务企业的模式提出的。在各种社区性网站中均有应用,典型的像新闻类,音乐类还有大家接触较多的电商类。

本文介绍了数据挖掘的概念以及个性化推荐的相关案例,以综述的形式带大家走进个性化推荐的课题。

关键词:数据挖掘,个性化推荐系,电子商务

Abstract

Data mining technology after decades of rapid development, not only achieved great progress in plant research in theory, but in many areas of retail, financial services, telecommunications, etc. have also been widely used. However, with respect to the data mining technique widely used in foreign countries, data mining technology in the country is still in the exploratory stage.

The concept of personalized recommendation system is the reference to foreign mature e-commerce business model proposed. In a variety of community-based websites in both applications, typically as news, music classes have more contact with all the electricity supplier class.

This paper introduces the concept of data mining and personalized recommendation related cases, in the form of a review of take you into personalized recommendation subject.

Key words: Data mining, personalized recommendation system, e-commerce

目录

摘要 . ............................................................................................................ 3

Abstract ....................................................................................................... 3

第一章 绪论............................................................................................... 1

1.1 问题的提出 ................................................................................... 1

1.2 本文主要内容 ............................................................................... 1

第二章 数据挖掘与个性化推荐概述 .................................................. 2

2.1 数据挖掘的概念 ........................................................................... 2

2.2 数据挖掘的相关技术 ................................................................... 2

2.2.1人工智能和机器学习 ........................................................... 2

2.3 个性化推荐 ................................................................................... 3

第三章 个性化推荐案例讨论和研究 ...................................................... 4

3.1 新闻类网站的个性化推荐 ........................................................... 4

3.1.1 今日头条 .............................................................................. 4

3.1.2 无觅网 .................................................................................. 5

3.2 音乐类个性化推荐 ....................................................................... 6

3.2.1 网易云音乐 .......................................................................... 6

3.3 电商类个性化推荐 ....................................................................... 7

摘要 . ............................................................................................................ 8

第一章 绪论

1.1 问题的提出

首先先来讨论一个问题:为什么要数据挖掘?

2003年5月10日,淘宝网成立,由阿里巴巴集团投资创办。10月推出第三方支付工具“支付宝”,以“担保交易模式”使消费者对淘宝网上的交易产生信任。2003年全年成交总额3400万元。2005年,淘宝网超越eBay 易趣,并且开始把竞争对手们远远抛在身后。5月,淘宝网超越日本雅虎,成为亚洲最大的网络购物平台。2005年成交额破80亿元,超越沃尔玛。2006年,淘宝网成为亚洲最大购物网站,就在这一年,淘宝网第一次在中国实现了一个可能——互联网不仅仅是作为一个应用工具存在,它将最终构成生活的基本要素,调查数据显示,每天有近900万人上淘宝网“逛街”。

淘宝只用了三年,就缔造了一个商业帝国。淘宝网是中国电子商务的先驱。广义上讲,电子商务一词源自于Electronic Business ,就是通过电子手段进行的商业事务活动。通过使用互联网等电子工具,使公司内部、供应商、客户和合作伙伴之间,利用电子业务共享信息,实现企业间业务流程的电子化,配合企业内部的电子化生产管理系统,提高企业的生产、库存、流通和资金等各个环节的效率。狭义上讲,电子商务 (Electronic Commerce,简称 EC )是指:通过使用互联网等电子工具(这些工具包括电报、电话、广播、电视、传真、计算机、计算机网络、移动通信等)在全球范围内进行的商务贸易活动。是以计算机网络为基础所进行的各种商务活动,包括商品和服务的提供者、广告商、消费者、中介商等有关各方行为的总和。人们一般理解的电子商务是指狭义上的电子商务[1]。

电子商务平台的功能和效益已经无需赘述,我们现在的工作室如何将电商的优势发挥到最大化。传统的广告中,我们无限制无目的的大范围传播信息,但是到了电商时代,这种方式势必得不到认可,所以,个性化推荐也就是“个性化广告”随之诞生。

1.2 本文主要内容

本文分为四个部分:

第一部分绪论,介绍了研究的相关背景;

第二部分,解释了数据挖掘和个性化推荐的相关概念;

第三部分,就具体的个性化推荐案例展开讨论。

第二章 数据挖掘与个性化推荐概述

2.1 数据挖掘的概念

想要个性化推荐,首先需要大量的数据,那么,将数据挖掘出来并处理是第一步。但是,当数据量达到TB 级别的时候,只是简单的计算平均数之类已经无法得到确切的数据特征了,这个时候,我们需要运用更多的数学和计算机知识来“挖掘”数据。

利用数据挖掘技术, 可以从数据库或数据仓库的相关数据集中提取所感兴趣的知识、规律或更高层次的信息, 并可以从不同的角度来分析它, 从而可以更有效的利用数据库或数据仓库中的大量数据。利用数据挖掘技术不仅可以描述过去数据的发展, 还能够进一步预测未来的趋势。

总之,数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标 [2] 。

2.2 数据挖掘的相关技术

2.2.1人工智能和机器学习

如果你去查阅有关个性化推荐的资料,那么你肯定会查到很多关于数据挖掘的资料,如果你继续查询数据挖掘,那么将会有一大堆专业词汇出现:机器学习、统计分析、神经网络、人工智能、模式识别。

数据挖掘是一种概念,从数据中挖掘到有意义的信息。很多人认为数据挖掘是新学科,是基于大数据,其实不然,如果给你一个数据说李嘉诚有100多亿美元,再给你一个数据是全国平均人均可支配收入水平是一万多元人民币,你能挖掘出一个信息叫,李嘉诚很有钱,这也是数据挖掘。只不过很简单而已。

模式识别是目的,识别出一种模式,比如两个眼睛一个鼻子的是人脸的模式。如果不通过电脑,手工的通过计算来识别模式,也属于模式识别。模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。计算机的模式识别在20世纪60年代初迅速发展并成为一门新学科。

机器学习是一门涉及自学习算法发展的科学。机器学习是一种方法,通常用

来进行模式识别,用机器去学习不直观的数据得到模式,这其中会需要用到各种各样的知识,比如统计分析的知识。定义为:机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能[3]。

而人工智能,这个概念就大了,这个概念是想要人工制造出和人类一样的智能,所以很多人就想出了机器人这么一个科幻产物,有人类的智能,并且依托于机器的强大运算能力。事实上,人工智能也不一定要和电脑挂钩的,只不过现在只有电脑有这么强大的计算能力,如果有一天生物科技能够突破,说不定也能实现。人工智能的核心是机器学习。

理清楚这些概念之后,我们在下一节介绍个性化推荐。

2.3 个性化推荐

个性化推荐技术是最具人文关怀的技术之一,它尊重个体,相信每个人都是与众不同的,在这个以‘人’为中心的社会化时代,它的兴起与发扬光大只是时间问题。

在传统的营销策略当中,商家主要关注在20%的商品上创造80%收益的客户群,往往会忽略了那些在80%的商品上创造20%收益的客户群。这就是典型的二八法则的应用,而长尾理论的提出,直接打破了传统的二八法则,这是网络时代兴起的一种新理论,最初由美国《连线》杂志(Wired )总编辑克里斯·安德森于04年首先发表:由于成本和效率的因素,当商品储存流通展示的场地和渠道足够宽广,商品生产成本急剧下降以至于个人都可以进行生产,并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品,只要有卖,都会有人买。 在互联网环境下,由于货架成本极端低廉,恰好符合长尾理论描述的应用场景,其中最有名的案例就是电子商务亚马逊公司的成功,那些需求和销量不高的冷门书产品所占据的共同市场份额,居然可以和热门书的市场份额相当,甚至更大。直接刺激了各大公司对长尾效应的深入挖掘。

推荐系统应该是目前互联网世界最常见的一种智能产品形式。它的技术基础直接源于一系列的人工智能学科的成果。从自动推理、认知建模、机器学习、神经元网络、自然语言处理、专家系统、智能机器人等各个方面。人工智能学科诞生于上世纪50年代,由于计算机的产生与发展,人们开始了具有真正意义的人工智能的研究。

第三章 个性化推荐案例讨论和研究

3.1 新闻类网站的个性化推荐

平时我们接触的最多的就是新闻类的个性化推荐,如每日头条,新浪新闻,腾讯新闻,无觅网等等。下面就两个案例每日头条和无觅网进行介绍。

3.1.1 今日头条

众所周知,今日头条是个个性化的新闻推荐引擎,在短短两年多的时间内拥有了2.2亿用户,每天有超过2000万用户在今日头条上阅读自己感兴趣的文章。因此,今日头条也变成了非常多企业、自媒体人、网络营销人聚集的地方,大家都想借着今日头条的海量流量分到一杯羹。

和传统新闻媒体不同的是,每日头条并不自己编辑新闻,他推送的大多数新闻来自网络,今日头条做的事情就是根据阅读量和兴趣给用户推荐当日最热的新闻,所以才叫“今日头条”。

一般来说,新闻推送的规则有:

基于相同城市的新闻,基于文章关键词的推荐,基于站内热门文章的普适性推荐,基于社交好友关系的阅读习惯推荐,基于用户长期兴趣关键词的推荐,基于相似用户阅读习惯的列表推荐,基于站点分布来源的内容推荐。

那么,今日新闻具体是如何工作的呢,来看如下具体的操作。

第一登录的时候,我们会发现这个页面,在这个页面可以选择我们感兴趣的领域。现在大多数的门户网站都有类似的功能,这是个性化推荐的第一步,在用户尚未实际操作的时候,主动了解用户的兴趣。如果你选择了几个领域,那么你会发现接下来会铺天盖地的出现类似的新闻,因为对于系统来说,现在只有这一个用户数据。比如说我们选择本地,那么接下来就会出现城市选择菜单(如果开始GPS 定位则会自动定位)。如果我们选择数码,那么就会出现一大堆数码产品的新闻。

接下来,经过几次的操作之后,后台将会分析你的行为。今日头条的个性化推荐算法原理就是基于投票的方法,其核心理念就是投票,每个用户一票,喜欢哪一篇文章就把票投给这篇文章,经过统计,最后得到结果很可能是在这个人群下最好的文章,并把这篇文章推荐给同人群用户过程就是个性化推荐,实际上个性化推荐并不是机器给用户推荐,而是用户之间在互相推荐,看起来似乎很简单,但实际上这需要基于海量的用户行为数据挖掘与分析。

推荐的另外一个核心是分析用户群。推荐不可能针对每一个人去优化算法,

只能针对一个大群体去推荐,那么分析用户群就变成了关键。人群特征可以是阅读姓名,年龄,地域,职业等等。同理,文章也是类似的,文章有提到哪些名人,文章发布的时间,文章所属的地区等等,也都有很多特性,这些都是可以去组合起来。判断一个人属于怎样的人群相对简单。比如地域,用户的手机在什么区域,就可以认为用户是什么地域的; 比如说用户兴趣,可以根据用户的阅读习惯去判断,用户会经常去看科技的文章,那就可以判断用户属于科技的人群; 再比如说用户的好友关系,用户在今日头条上面注册了,用户的好友都是娱乐圈的人,则该用户很有可能也是娱乐圈的人; 所以通过用户在今日头条上行为,以及用户客观的地理位置信息,就能判断用户到底属于一个什么样的人群。

图3-1 今日头条APP 截图

3.1.2 无觅网

无觅网是个老牌个性化阅读网站了,推广不够,但是功能强大,现在无觅网网页端已经快下线了,但是手机app 还是可以进入,并且推出了新的平台无迷。无觅的退出可能是因为版权问题,但是它本身的功能还是毋庸置疑的。

无觅网是一个个性化阅读社区。在无觅网用户可以挑选自己喜欢的话题,并得到关于这些话题的推荐内容;还可以关注你感兴趣的其他用户,了解其他用户的阅读动态。无觅网利用人工智能技术根据用户阅读和喜欢过的内容,向用户推荐更多可能会感兴趣的内容。

无觅网利用人工智能技术,通过算法学习用户的阅读兴趣,结合用户的阅读兴趣向用户推荐其可能会感兴趣的互联网信息,帮助用户过滤掉他不感兴趣的内容。随着用户对于推荐结果反馈的增加,以及机器学习的深入,用户得到的推荐也越来越精准,最终实现为用户定制最符合其需求的互联网资讯,

打造一个个性

化的互联网。

无觅网定位个性化阅读社区,通过语义分析以及个性化推荐技术为每位用户提供专属的信息过滤与发现平台。用户在这个平台上进行阅读、分享和互动的行为将会不断改善自己后续获得的个性化内容,因此推荐结果同样也会越来越符合你的阅读喜好。

在无觅网用户除了可以获得其关注的话题的最新资讯,得到为其量身定制的内容推荐外,还可以关注他感兴趣的其他用户。可以关注用户所关注领域的权威专家,或者了解身边同事,亦或者用户在其他社交平台上认识的朋友。

通过关注不同的好友,可以了解好友喜欢过、评论过、分享过的内容;了解用户所关注领域的其他用户正在关注的话题和新闻;了解该领域权威专家对某一新闻和突发事件的观点评论。

3.2 音乐类个性化推荐

3.2.1 网易云音乐

网易云音乐是一款专注于发现与分享的音乐产品,依托专业音乐人、DJ 、

好友推荐及社交功能,在线音乐服务主打歌单、社交、大牌推荐和音乐指纹,以

歌单、DJ 节目、社交、地理位置为核心要素,主打发现和分享。

图4-1 网易云音乐个性化推荐界面

四种个性化推荐的模式都有所不同:每日歌曲推荐这个基本就靠数据库分析了,比如今天听过哪些歌,提取歌手、歌曲类型、所属专辑这些尽可能全面的信息,对你可能感兴趣的歌曲进行猜测。而第二个与第三个模块则随机抽选你历史喜欢的某一首歌曲进行推荐,方法同上。最后,则是根据歌单生成,歌单与歌单之间的相似度进行匹配,随机为你推荐匹配程度较高的歌单。

之所以做到精准推荐,是因为网易云音乐背后强大的数据支撑,我想没有任何一款音乐软件会针对用户喜好用户偏好去进行仔细研究,而云音乐则将曲库与用户偏好进行了匹配,根据用户在APP 中留下的点滴行为去做判断,这需要强大的数据分析能力。

3.3 电商类个性化推荐

电商网站比较普遍,在此不做详细介绍。淘宝的个性化推荐主要是“你可能喜欢的商品”,还有一些窗边广告。他的推荐目的性非常明显,可能你刚买了零食,一刷新可能就是满屏的零食小广告,个人觉得这种形式过于单一,淘宝目前要做的是要综合用户的其他行为,不能只是单纯的分析购买的行为,用户在浏览其他网页的过程中,也可能暴露他的习惯和计划,单纯的通过购买行为强加推荐完全相同的产品,未免过于单一。事实上,很多人的网购行为都过于发散,很多个人隐私确实是很难发现了,毕竟购买的行为要比阅读和听歌复杂的多。如何获取用户行为的细节,成为电商个性化推荐的关键。

摘要

[1]电子商务好搜百科[Online ], http://baike.haosou.com/doc/5333306.html

[2]数据挖掘百度百科[Online ],http://baike.baidu.com/view/7893.htm

[3]机器学习百度百科[Online ],

[4]BP 神经网络百度百科[Online ],http://baike.baidu.com/view/1753676.htm

[5]朱慧云,数据挖掘在电子商务中的应用研究[J],2007

[6]辛菊琴,综合用户偏好模型和BP 神经网络的个性化推荐[J],2008

[7]无觅网百度百科[Online ]

[8]网易云音乐百度百科[Online ],

http://baike.baidu.com/view/10017380.htm


相关文章

  • 商务921922班[电子商务专业毕业论文]大纲及指导书
  • Bu zhd 安徽职业技术学院 电子商务专业毕业论文大纲 总学时: 140学时 课程类别:职业能力专项训练 开课对象:经贸系电子商务专业学生 开课学期:6 学分: 5学分: 总学时:5周 教材或讲义:电子商务专业毕业环节指导书 一.实践的性 ...查看


  • 电子商务毕业设计指导书
  • 电子商务专业毕业设计指导书 课程编码:21093186 设计时间:9周(9学分)2012年3月5日-2012年5月8日 一.毕业设计目的和意义 毕业设计(论文) 是培养学生综合运用本专业基础理论,基本知识和基本技能分析解决实际问题能力的一个 ...查看


  • 山东师范大学硕士论文格式(权威版免费版)
  • 落飞文花园 附件2-3 山东师范大学博士硕士学位论文格式暂行规定 为规范我校博士.硕士学位论文格式,提高学位论文质量,根据国家和学校有关学位授予细则的规定,对我校博士硕士学位论文的基本格式作如下规定: 一.印刷本学位论文格式 (一)论文内容 ...查看


  • 电子商务毕业论文.电子政务论文6商业管理论文(范文)
  • 本科毕业论文答辩模板和问题(693人评价)|43735人阅读|3493次下载| 适用于本科生毕业论文答辩时~~ 一.毕业论文答辩应注意的几个问题 (一)答辩步骤 1.在毕业论文答辩时,答辩老师首先要求你简要叙述你的毕业论文的内容.叙述中要表 ...查看


  • 最新电子商务专业毕业论文答辩稿演讲自述范文
  • 最新电子商务专业毕业论文 答辩稿自述优秀范文 尊敬的各位老师: 您们好!(鞠躬致意) 首先,感谢您们在百忙之中抽出宝贵时间倾听我的毕业论文答辩.我叫××,是电子商务专业××班的学生,我的论文题目是×××(这里改成电子商务专业论文题目) ,论 ...查看


  • 2012级电子商务论文题目
  • 2012级电子商务(含2012级"3+2"电子商务)毕业论文安排 一.毕业论文的重要意义 毕业论文是重要的实践教学环节.学生通过对大学期间所学知识和技能的综合运用去解决实际问题,可以达到学以致用,教学相长的作用.同时,毕 ...查看


  • 论文答辩开场白和结束语1044107
  • 论文答辩开场白和结束语 毕业论文答辩的主要目的 是审查文章的真伪.审查写作者知识掌握的深度 审查文章是否符合体裁格式 以求进一步提高 学生通过答辩 让教师.专家进一步了解文章立论的依据 处理课题的实际能力 这是学生可以获得锻炼和提高的难得机 ...查看


  • 毕业设计(论文)范文格式
  • 毕业设计(论文) 题 目 姓 学 [毕业设计 (论文) (字数不超过 24 字) 标题 ] 名 号 [姓名] [学号] [专业班级] [所在学院] 专业班级 所在学院 指导教师(职称) [指导教师(职称)] 二○一[汉字小写数字] 年[汉字 ...查看


  • 论文相似性检测报告
  • 论文相似性检测报告 报告编号:301baab5-bd1b-401a-80e4-a3c001726053题 名:301baab5-bd1b-401a-80e4-a3c001726053报告编号: 作 者:46,441原文字数: 论文相似性检测 ...查看


  • 导师对申请者学位论文评价表
  • 导师对申请者学位论文 各相关学院: 为做好我校2011年6月份博士.硕士(含同等学力.硕士专业学位.高校教师在职申请硕士学位)研究生学位论文答辩工作,确保学位授予工作的顺利进行,现将2011年6月份博士.硕士(含同等学力.硕士专业学位)研究 ...查看


热门内容