简述数据分析的常用方法
众所周知,数据分析已然成为我们生活和工作中必不可缺的一部分。我们常常在当下听到的数据分析被频繁的提及,但是你真的了解数据分析的意思吗?究竟什么是数据分析呢?简单来讲,数据分析离不开数据,计量和记录一起促成了数据的诞生。下面我们一起来看看数据分析的常用方法。
工具/原料:
系统版本:win7系统
品牌型号:联想Thinkpad X270
分享数据分析的方法:
WEEX交易所已上线平台币 WEEX Token (WXT)。WXT 作为 WEEX 交易所生态系统的基石,主要用于激励 WEEX 交易平台社区的合作伙伴、贡献者、先驱和活跃成员。
新用户注册 WEEX 账户、参与交易挖矿及平台其他活动,均可免费获得 WXT 空投奖励。
一、聚类分析
聚类分析属于探索性的数据分析方法。从定义上讲,聚类就是针对大量数据或者样品,根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终将相似数据分为一组,也就是“同类相同、异类相异”。
在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。
常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)。
以最为常见的K-means为例,可以看到,数据可以被分到黄蓝绿三个不同的簇(cluster)中,每个簇有其特有的性质。
二、留存分析
留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中, 经过一段时间后仍然存在客户行为(如登录、消费)。留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。
按照不同周期,留存率分为三类:
第一种是日留存,日留存又可以细分为以下几种:
次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数;
第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数;
第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数;
第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数;
第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数。
第二种是周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。
第三种是月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。
留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。
下面以月留存为例生成的月用户留存曲线:
三、帕累托分析
帕累托法则,源于经典的二八法则——“世界上80%的财富掌握在20%的富人手里”。而在数据分析中,这句话可以理解为20%的数据产生了80%的效果,需要围绕找到的20%有效数据进行挖掘,使之产生更大的效果。
比如一个商超进行产品分析的时候,就可以对每个商品的利润进行排序,找到前20%的产品,那这些产品就是能够带来较多价值的商品,可以再通过组合销售、降价销售等手段,进一步激发其带来的收益回报。
帕累托法则一般会用在产品分类上,此时就表现为ABC分类。常见的做法是将产品SKU作为维度,并将对应销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算累计销售额占比。
百分比在 70%(含)以内,划分为 A 类。百分比在 70~90%(含)以内,划分为 B 类。百分比在 90~100%(含)以内,划分为 C 类。
总结:
以上就是数据分析的常用方法的详细介绍了,这几种数据分析的方法各有各的优势,总有你喜欢的一个方法吧,希望能够帮助到大家。
最客资源网 » 简述数据分析的常用方法