您当前所在位置:首页软件下载应用工具国内的数据挖掘,大数据应用的案例有哪些?

国内的数据挖掘,大数据应用的案例有哪些?

更新:2024-08-06 14:09:26编辑:BOSS软件库归类:应用工具人气:48

文章目录:

  1. 国内的数据挖掘,大数据应用的案例有哪些?
  2. 数据挖掘 聚类算法概述

一、国内的数据挖掘,大数据应用的案例有哪些?

国内数据挖掘,大数据运用主要有以下几类:
1、电子商务的推荐系统。基本都是基于协同过滤的推荐系统:背后的算法是基于内容、基于用户行为、基于产品等。
2、另外一个可以就是对网络用户行为分析。来分析用户在网站的点击行为。从而为产品设计、改进产品提供指导。
3、当然目前很流行就是文本挖掘,因为以前都是点击流数据,对于用户评论的文字信息,提炼的很少,主要用Google、垂直搜索引擎会用到排序之类的。
如果说有一家科技公司准确定义了“大数据”概念的话,那一定是谷歌。根据搜索研究公司comScore的数据,仅2012年3月一个月的时间,谷歌处理的搜索词条数量就高达122亿条。谷歌的体量和规模,使它拥有比其他大多数企业更多的应用大数据的途径。

想要了解更多关于大数据挖掘的相关内容,推荐CDA数据分析师课程。课程内容兼顾培养解决数据挖掘流程问题的横向能力以及解决数据挖掘算法问题的纵向能力。真正理解商业思维,项目思维,能够遇到问题解决问题;要求学生在使用算法解决微观根因分析、预测分析的问题上,根据业务场景来综合判断,洞察数据规律,使用正确的数据清洗与特征工程方法,综合使用统计分析方法、统计模型、运筹学、机器学习、文本挖掘算法,而非单一的机器学习算法。

二、数据挖掘 聚类算法概述

文 | 宿痕

来源 | 知乎

本篇重点介绍聚类算法的原理,应用流程、使用技巧、评估方法、应用案例等。具体的算法细节可以多查阅相关的资料。聚类的主要用途就是客户分群。

1.聚类 VS 分类

分类是“监督学习”,事先知道有哪些类别可以分。

聚类是“无监督学习”,事先不知道将要分成哪些类。

举个例子,比如苹果、香蕉、猕猴桃、手机、电话机。

根据特征的不同,我们聚类会分为【苹果、香蕉、猕猴桃】为水果的一类,和【手机、电话机】为数码产品的一类。

而分类的话,就是我们在判断“草莓”的时候,把它归为“水果”一类。

所以通俗的解释就是:分类是从训练集学习对数据的判断能力,再去做未知数据的分类判断;而聚类就是把相似的东西分为一类,它不需要训练数据进行学习。

学术解释:分类是指分析数据库中的一组对象,找出其共同属性。然后根据分类模型,把它们划分为不同的类别。分类数据首先根据训练数据建立分类模型,然后根据这些分类描述分类数据库中的测试数据或产生更恰当的描述。

聚类是指数据库中的数据可以划分为一系列有意义的子集,即类。在同一类别中,个体之间的距离较小,而不同类别上的个体之间的距离偏大。聚类分析通常称为“无监督学习”。

2.聚类的常见应用

我们在实际情况的中的应用会有:

marketing:客户分群

insurance:寻找汽车保险高索赔客户群

urban planning:寻找相同类型的房产

比如你做买家分析、卖家分析时,一定会听到客户分群的概念,用标准分为高价值客户、一般价值客户和潜在用户等,对于不同价值的客户提供不同的营销方案;

还有像在保险公司,那些高索赔的客户是保险公司最care的问题,这个就是影响到保险公司的盈利问题;

还有在做房产的时候,根据房产的地理位置、价格、周边设施等情况聚类热房产区域和冷房产区域。

3.k-means

(1)假定K个clusters(2)目标:寻找紧致的聚类

a.随机初始化clusters

b.分配数据到最近的cluster

c.重复计算clusters

d.repeat直到收敛

优点:局部最优

缺点:对于非凸的cluster有问题

其中K=?

K<=sample size

取决于数据的分布和期望的resolution

AIC,DIC

层次聚类避免了这个问题

4.评估聚类

鲁棒性?

聚类如何,是否过度聚合?

很多时候是取决于聚合后要干什么。

5.case案例

case 1:卖家分群云图

作者:宿痕 授权转载

原文链接:http://zhuanlan.zhihu.com/dataman/20397891

到此,以上就是小编对于数据挖掘的应用案例的问题就介绍到这了,希望介绍关于数据挖掘的应用案例的2点解答对大家有用。

Amysql_youhua_articlehuaunyuan($article);
数据挖掘的应用案例
巴西女乒有独臂选手:如何比较范·巴斯滕、维耶里和罗纳尔多 开除员工称法无所谓:中元节就要到了,你们会用哪种方式祭祖
欧意国内注册 欧易国际注册 欧意交易所app官方下载

游客 回复需填写必要信息