数据分析方法论

在进行数据分析时,可借助固定的分析方法快速、有效地分析数据,从数据中获取信息。

在进行数据分析时,可借助固定的分析方法快速、有效地分析数据,从数据中获取信息。本章主要讲解数据分析相关的方法,这些方法是由资深数据分析师总结提炼而成的,包括对比法、拆分法、排序法、分组法、交叉法、降维法、增维法、指标法和图形法。根据业务场景选择一种或一种以上的分析方法可以让分析工作更加高效。表 4-1 是数据分析方法及其使用场景。

 

v2-020bbb809a73993c3759592fb104406c-1

对比法

例如我们做搜索推广不同的关键词做的转化率,等的对比。

对比法是最基本的分析方法,也是数据分析的「先锋」。数据分析师在进行数据分析时首先使用对比法,可以快速发现问题。在进行商业数据分析时有三个必备的维度,分别是过去的自己、同期的对手和同期的行业。通过这三个维度的对比可以了解数据的含义,否则数据就是一座「孤岛」。

对比法分为横向对比和纵向对比。

横向对比是跨维度进行对比,用于分析不同事物的差异,比如在分析企业销售业绩时,将不同行业的企业销售数据进行对比,这样可以了解某家企业在整个市场中的情况。例如,中国的 500 强企业排行榜就是对不同行业的企业进行排序。

纵向对比是在同一个维度进行对比,用于不同阶段的对比,比如以时间为维度,将当天的销售业绩和前一天的销售业绩、上个月同一天的销售业绩进行对比,可以知道当天的销售情况。

例:小李是网店运营人员,刚接手一家新网店,想要确定该网店的主营品类,已知该网店经营 A、B、C、D 四个品类,其销售额如表 4-2 所示。

将表 4-2 的数据转换成柱形图,如图 4-1 所示,通过对比 A、B、C、D 四个品类的「天花板」,要做大市场规模可以选择「天花板」高的品类,要便于生存则选择「天花板」低的品类。

v2-503fb0e7ae2b2d6b277dc3273b452732

v2-a3c7d253e12d898b7513e63730756b11

拆分法

拆分法是常用的分析方法之一,在许多领域被应用,杜邦分析法就是拆分法的经典应用。拆分法将某个问题拆分成若干个子问题,通过研究若干个子问题,找到问题的症结并解决它。比如,在研究销售业绩下降的问题时,可以将销售业绩下降的问题拆分成转化率、客单价和访客数这三个指标,通过分析这三个指标来解决销售业绩下降的问题。例:某网店的销售额大幅下降,运营人员欲找出销售额下降的原因,网店数据如表 4-3 所示。

表 4-3

v2-cb582aceb45b6bba462f926d88bb9621

销售额下降的问题可以拆分成三个指标,分别是转化率、客单价和访客数,如图 4-2 所示。通过表 4-3 并结合对比法,发现主要是访客数的减少引起了销售额的大幅下降。再进一步拆分访客数,访客数分为付费访客数和免费访客数,对访客数变化的原因进行进一步剖析,直到找到问题的根源。

v2-eb861677b90d48d9cf2408b9857d65bd

图 4-2

拆分法可以分为完全拆分法和重点拆分法。

完全拆分法也被称为等额拆分法,将父问题 100% 地进行拆解,拆解出来的子问题的和或集合(算法)可 100% 解释父问题。例如,销售额 = 访客数 × 转化率 × 客单价,等式两边的数值完全相等。

重点拆分法也被称为非等额拆分法,只拆分出问题的重点,子问题只解释父问题的 80% 左右。例如,经营好网店 = 点击率 + 转化率 + 退款率。确实,经营好一家网店只要将点击率、转化率和退款率这三个指标保持好就够了,但做网店运营不能完全关注这三个指标。有时面对一些复杂的问题,可以采用重点拆分法,抓重要环节。

简单的来说就是将核心的指标进行拆分

排序法

排序法基于某一个度量值的大小,将观测值按递增或递减的顺序排列,每次排列只能基于某一个度量值。排序法是从对比法中衍生出的一种常用方法,百度搜索风云榜、淘宝网店排行榜等业内知名榜单都是采用排序法的。通过查看排序后的榜单,用户可以快速获取目标价值信息。

这个其实更好理解,结合power bi 其实就是rank函数,28定律的实际应用。掌控20%的核心业务

例:某运营人员收集了数个品类的数据,如表 4-4 所示,使用排序法列出品类榜单。

表 4-4

v2-c2b105bc72e91fd6f54e90e1ab8e8b2a

排序法只能基于某一个度量值进行排序,表 4-4 中有两个度量值,因此可以列出两个表单。

表 4-5 是基于交易指数列出的榜单,排名越靠前,代表该品类的市场规模越大。

v2-c485c26f4c9b772c1cab31f2caf4a4e3

表 4-6 是基于在线产品数列出的榜单,排名越靠前,代表该品类的市场竞争越激烈。

分组法来源于统计学中的统计分组法,是非常重要的分析方法,用于发现事物的特征。可以按类型、结构、时间段等维度进行分组,观察分组后维度的数据特征,从特征中洞察信息。

分组法

分组法来源于统计学中的统计分组法,是非常重要的分析方法,用于发现事物的特征。可以按类型、结构、时间段等维度进行分组,观察分组后维度的数据特征,从特征中洞察信息。

我们在进行分析的时候,例如关键词分析。我们可以将核心的关键词进行综合归类,分组进行大范围观察

例:基于表 4-7 的信息,分析裤子和职业套装的差异。

表 4-7

v2-a78dfb51f5d8997fb10456e9b5e7c3e2

基于题目可知需要对父类目进行统计分组,分组统计后的行业数据如表 4-8 所示。

表 4-8

v2-1e26b80006b686f9c0d2a456a61f0b9d

通过分组结果可知,裤子的市场份额远大于职业套装的市场份额。

本文由 简悦 SimpRead 转码, 原文地址 www.zhihu.com

交叉法是对比法和拆分法的结合,将有一定关联的两个或两个以上的维度和度量值排列在统计表内进行对比分析,在小于或等于三维的情况下可以灵活使用图表进行展示。

交叉法

交叉法是对比法和拆分法的结合,将有一定关联的两个或两个以上的维度和度量值排列在统计表内进行对比分析,在小于或等于三维的情况下可以灵活使用图表进行展示。当维度大于三维时选用统计表展示,此时称之为多维分析法。比如,在研究市场定价时,经常将产品特征和定价作为维度,将销售额作为度量值进行分析。

例:表 4-9 是不同性别的消费者在不同品类商品上的消费金额数据,利用交叉法分析不同性别的消费者的消费差异。

表 4-9

v2-ad4c1db5bf634c5fca08755566ad7d47

将表 4-9 转换成二维交叉表,如表 4-10 所示,可以直观地观察男性消费者和女性消费者在消费偏好上的差异,男性更愿意在耳机上消费,女性则更愿意在零食上消费。

表 4-10

v2-5588a854621d3949e9e2495c3833c37f

本文由 简悦 SimpRead 转码, 原文地址 www.zhihu.com

当数据集字段较多或分析干扰因素太多时,可以找到并分析核心指标来提高分析精度,或者通过主成分分析、因子分析等统计学方法将高维转换成低维。

 降维法

当数据集字段较多或分析干扰因素太多时,可以找到并分析核心指标来提高分析精度,或者通过主成分分析、因子分析等统计学方法将高维转换成低维。比如,在分析网店数据时,根据业务问题的核心提取 2~4 个主要指标进行分析。

其实就是将单一指标提升为更复杂的综合指标

例:根据表 4-11 所示的字段评估网店的综合情况。

表 4-11

v2-1347c0dee08d9d57d2d1fb43194a185f

对指标进行分类,把对店铺的评估分成产品运营能力、网店获客能力和网店服务能力的评估。

反映网店产品运营能力的指标如表 4-12 所示。

表 4-12

v2-f840532d4b85ed7e24eb8a92d6aec5d9

反映网店获客能力的指标如图 4-13 所示。

表 4-13

v2-e4e6cb8e6c8b0a7d35cfe29adb73315e

反映网店服务能力的指标如表 4-14 所示。

表 4-14

v2-c78ed059bdd1586d15878f81e7119d04

基于每个能力维度下的指标,可以综合评估每个能力的分数。

可以使用数据归一化方法或熵值法计算分数,达到综合评估的目的。

增维法

增维法是在数据集字段过少或信息量不足时,为了便于分析人员操作,通过计算衍生出更加直观的指标。比如,在分析关键词时,用搜索人气除商品数量,得到一个新的指标,将该指标定义为关键词的竞争指数。

例:如表 4-15 所示,计算关键词的竞争度,基于业务经验,竞争度 = 搜索人气 × 点击率 × 支付转化率 ÷ 在线商品数,得到的指标为正指标,数值越大越好。

v2-75b5aaf118f9297de905d9748e0c2b82

电商平台我们常常会新增RMF分析法

指标法

指标法是分析的基本方法之一,通过汇总值、平均值、标准差等一系列的统计指标研究分析数据。指标法适合分析多维的数据。

例:表 4-16 是在淘宝网搜索某关键词按人气排名前 5 的商品数据,使用指标法描述这个数据。

表 4-16

使用指标法描述数据后的结果如表 4-17 所示。

表 4-17

相关推荐

商业数据分析基本流程

面对海量的数据,很多分析师都不知道如何准备、如何开展、如何得出结论等。下面为大家介绍商业数据分析的基本流程。 ...

指标和维度

数据分析其实就是维度和指标的切换,了解维度和指标体系有助于我们理解分析的思路。电商的维度和指标体系分类如图 所 ...

电商业务框架

电商是一个将互联网技术与零售业结合的行业,传统的零售业并没有那么多的数据,但是随着互联网技术的发展和普及,现在 ...