400-811-8890
免费试用 {{ item.text }}
帆软X喜乐君 | 用交互可视化,讲有“灵魂”的数据故事
3 17 26
发布时间: 

8月6日,第三期FineWorkshop系列活动在上海环球港圆满结束,数据分析专家喜乐君与国内50+资深数据分析师共同参与了本期FineWorkshop活动,喜乐君分享了“站在业务角度”去理解数据分析的本质,干货十足。

内容概述

FineWorkshop活动为帆软主办,旨在为国内数据分析从业者提供一个交流学习的平台,分享数据分析的最新技术和趋势,探讨数据分析在不同行业中的应用,以及如何在职业生涯中实现更好的成长和发展。

以下为喜乐君先生的分享实录:

大家好,我是喜乐君,今天想跟大家聊聊我对于业务问题及数据分析核心的理解。

output.jpg

首先需要强调的是,我并不非数据科班专业或IT背景的分析师,我是在做董事长助理期间,因为工作需要而自学分析。有一段时间,我的主要工作就是组织公司高层会议,各个部门的领导常常为数据准确性而吵的不可开交,为了解决这个问题,我开始尝试做一些公司级别的分析,统一公司的部分数据结果,之后走向了创业和商业分析之路。

本次活动的主题是“讲‘有灵魂’的数据故事”如何才有灵魂?这就不得不强调说,数据分析的核心是交互”,它和传统 Report有明显的不同如果你只是做一个制作Report的“表哥/表姐”,业务价值是极其有限的;但真正有价值的是能够借助于交互分析,总结业务规律、发现业务改进线索,帮助领导解决真正的业务问题。

1280X1280-3.PNG

此外,值得一提的是其实每个人用什么工具不是最不重要的,重要的是你的想法。

我们首先是被自己的想法所限制住,其次才是被工具所限制住。这里要注意两点,其一是“Think Big”,无论是想制作报表还是完成交互可视化,都要先大处着眼。二是时刻提醒自己从业务出发,不是“为了业务服务”,而是时刻站在业务的角度看问题,真正有价值的分析一定从业务开始的。

大部分分析师现在是想法太多,实现的太少,委婉一些的说法是工具限制我们表达

传统分析工具是我们思考的天花板,最好的分析师也只能做到工具所能实现的层级,但受限于对工具的深度理解,受限于对方法论的理解,通常分析师只能达到工具最大价值的一半左右。

接下来,我想从三个角度依次介绍:如何理解业务要素及其与数据、分析的关系,如何把业务需求转换为标准问题,如何借助于交互实现探索分析。

、了解业务,及其与数据、分析的层次关系

每当我进入到一个新的行业,我都用一套标准的方法理解业务,并进而理解数据表和分析需求。

1、「业务-数据-分析框架」

业务理解是由三个部分构成的:业务对象、业务过程,业务规则。业务对象是在交易过程中能够看得见的东西,在数据中是用“字段”的方式表达出来的,比如客户、门店、产品等。当然还会有很多持续衡量业务过程的字段,通俗称之为“值”,在分析层级上叫“度量”(measure)。同行业的业务过程、业务对象基本是一样的,差异主要在于业务规则,业务规则对应管理活动。

1280X1280-4.PNG

分析师和业务用户的一个关键差异是,分析师站在数据角度、以抽象的视角自上而下看业务,而业务用户眼中更多是真实的业务对象、业务过程。如今是一个信息世界,我们八零后、九零后和六七十年代的领导不同的部分也在于,他们直接看见的是业务过程,而我们直接看见是业务数据。业务数据是对业务过程的反映,注意,“反映”只是“记录”,没有创造新东西。这就是我精心设计的“业务-数据-分析框架”最基础的两个层次。

从这个角度你去看所有行业,业务和数据的关系都是一样的。

1280X1280-5.PNG

新行业和老行业的一个关键差异是对业务的抽象化水平不同。以前我做零售的时候,很少做客户流失数据分析,因为觉得客户流失了就是流失了,很难把它记下来;但是我们去看新零售、消费金融业务就不一样了。比如你在银行办了一张信用卡,哪怕你这个卡现在是 0 元,它的余额依然每天滚动记录。

同样,做过新零售的人回过头再去看传统零售,就会感觉简单很多,因为“新零售”的抽象程度更高借助于互联网平台和数字化技术,它可以很快分析出来流失客户去哪里了,有哪些特征,然后我应该做什么调整,但传统零售分析的人都不会做。我做零售出身,当年合作的很多总监,到现在连商品“连带比率”都不会做。

分析是对数据的创造,是升华,这是我们分析的起点。“从业务到数据”是IT的工作,他们负责把现实世界发生的事情以数据的方式记录下来;我们分析师则借助于数据总结业务世界的规律、指导业务的改进。现在很多企业做不到,是因为它的数据太乱了,乱到你“不可忍受”。

说到这里,你就可以完整地理解上面的“业务-数据-分析框架”,这是分析师理解业务世界的基础。

2、穿过数据,理解业务的需求

有了上述的分析框架,我们再来看领导的各种需求。你要把客户的需求置于宏达的分析框架之中,看到领导需求背后的潜在需求。不能领导说最后做个表,你就真的只是给他一个表。现在的很多领导看似需要的是报表,其实因为不知道更高级的业务分析形态是什么。

1280X1280-6.PNG

如果领导要个报表,你就给他一个报表(Report),在领导眼里你就只是一个做报表的人。

报表只是简单的呈现,需要理解问题、展开分析,真正的分析应该超越显而易见的需求。

什么叫“显而易见的需求”?领导“显而易见的需求”是一个report,但其实最终他的需求是:为什么用户下降了,应该做什么措施?这一个部分是最难想明白的,所以很多人进了一个新行业,慢慢就变成了螺丝钉。

这里有两句经典名言。

第一句:穷查理宝典说的,它说手里拿着锤子的人看来,到处都是钉子所以如果你以前做Report,你就会觉得每一个领导都需要Report,这会阻碍分析师的进步。

第二句:“客户想要的不是一把‘锤子,客户想要的是一个’”很多做BI实施的供应商,包括部分BI厂家,普遍以为客户需要的是工具本身,或者需要更复杂的报表、更炫酷的大屏,其实不是的,客户真正需要的是能发现业务问题的“报表”,能发现业务机会的“交互仪表板”。

我们分析师也是一样,领导想要的不仅是一张报表,领导想要的是“能够指导业务决策的敏捷分析”也只有从这个角度出发,你才能讲好一个数据故事,故事才会有“灵魂”。否则技术最好、展现再炫酷,都只是“形式主义”的胜利,我们后续的讲解也都是无用功。

二、理解问题:从分析需求转换为标准化问题

在分析实践中,我发现很多分析师都难以理解业务领导的需求,或者看似理解了,但是实现方式各不相同。在长期的时间过程中,我尝试总结了很多方法,其中效果最为显著的是“问题的标准结构”。

output.png

可以说,所有问题必须由三个部分构成:在哪里分析?分析的对象是什么?分析的答案?这三个部分分别之为分析范围(筛选)、问题详细级别(维度)、问题答案(度量)

很多时候,分析出现偏差的首要原因,是领导的抽象问题,没有被具体到一个可以落地的问题上。

分析是对业务的抽象概况,是对数据的抽象处理,抽象处理的最基本方式是聚合。所以说分析的本质是聚合,没有聚合就没有分析。

举个例子,假如你是一家银行的资深数据分析师,你的领导交代你完成一份银行客户分析,从数据中发现贷款业绩下滑的问题点并寻找机会,这时你会想如何理解、转换、实现领导的需求?

output-2.png

首先我要揭示,或者说去衡量“业绩下滑”的程度有多少。其次,我们要看,业绩下滑是由客户数量的减少导致的?还是客户数量没有变?而是人均的产能下降了?再次,当已经知道用户下滑的影响最大,那我接下来要分析,是哪一类的客户下滑了,是普通卡还是个人银行?是金卡还是钻石?不同的等级它对企业的贡献是不一样。

基于这样的逻辑,我们就可以明确地整理分析的问题:

  • 各个开户年月的贷款金额、环比差异
  • 各个客户年月的客户数量、人均贷款金额
  • 各个客户年月、不同法人卡级别的 客户数量、人均贷款金额

在这个案例数据中,首先我们应该关注的是绝对值指标,之后逐渐分解为比率型指标——比率型指标更能业务的效率因素。

当然,上述的分析还是只是简单的概述性问题,一旦发现线索,分布分析、相关性分析就成为新的分析方法,典型问题如下:

  • 不同贷款金额区间的法人卡数量(注意,问题的维度包含了预先的聚合)
  • 不同行业的贷款金额总和、存款金额总和相关性(两个指标在离散字段上的相关)
  • 各个年月的客户数量增长趋势,是否与人均贷款金额趋势相一致(两个指标在连续字段上的相关)

随着分布、相关性问题的出现,分析就算进入中级阶段。它们要解释多个指标或者多个维度的结构性关系,是从基本问题走向高级问题分析的“桥梁”。

三、选择合适的可视化类型并赋予交互关系

用什么可视化类型来表达数据信息是有科学依据的,很多人说这个图表也行,那个也行,其实是缺乏方法论的表现。图表取决于人的视觉,所以最佳可视化是由普适性规范的。过于复杂的分类、枚举性质的可视化路线,只会让分析变得复杂。我们应该从问题出发,从问题中包含的业务对象之间关系出发,来选择合适的可视化类型。

这就是喜乐君推荐的“从问题到图形的可视化分析”,而不推荐“先选择图形再填充字段”的IT方式。

output-3.png

所以从这个意义上讲,我为什么特别反对做“炫酷图形”,因为炫酷的只是“图形”形式,增加了领导识别有效信息的负担。假设你做了个复杂图表,但会发现要先给领导讲 5 分钟如何查看这个图形,领导愣了半天,才能反映过来,这就是错误的方式。

我们如何用交互降低问题的复杂性呢?

对于复杂问题而言,我们可以拆解为更基本的问题,之后借助两个基本图形实现,用交互来表达它的关系。另外,分析的关键是筛选、变量传递,甚至高亮显示、跳转、导航等交互方式。

output-4.png

如果要问,交互是什么?交互是证实和证伪的过程。在交互过程中,业务领导才能建立假设、证实或证伪假设,最后辅助业务决策。所以有“灵魂”的数据故事,一定是有交互的数据故事。这就是“好图形”和“卓越图表”的差异,“卓越的可视化”让你更快地发现问题、走向决策。

对于分析而言,内容一定比形式重要。必要的交互是关键“内容”之一。

四、总结一下

简单总结我们这次的主题,叫有灵魂的数据故事,但实质是讲你要怎样表达你对业务的理解。

第一部分,怎样理解领导的需求?务必要从业务开始,要理解业务的对象、过程、规则是怎样的。

第二部分,怎样把一个抽象需求转变成可实践的具体问题?问题的结构是关键。

第三部分,交互是关键,是业务假设验证的过程。可视化应该减少“形式主义”,不管是复杂报表还是炫酷大屏。

最核心的,你要有层次概念,我们每一个人都是“现实世界”和“数字世界”的“使者”,或者说是“虚拟世界”的创造者。我们看见的业务世界是计算机帮我们虚拟化的,然后我们借助于敏捷BI工具进一步总结、抽象、升华业务理解,再反过来指导业务改进,改进后的业务系统生成新的数据和假设,能够实现这个循环的企业才是真正实现“数字化转型”的企业。