O" Z! t+ z/ @* a t, ? 大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。
9 y4 j- ?8 k/ c/ ]1 o 可以想象一本没有图片的教科书。没有图表、图形或是带有箭头和标签的插图或流程图,那么这门学科将变得更加难以理解。人类天生就是视觉动物,而视觉效果对于分析数据、传达实验结果甚至做出惊人的发现至关重要。
( ^& V4 Y4 n$ A X
工作中我们可能会接触到很多业务数据,需要在总结汇报中展示呈现,俗话说“字不如表,表不如图”,那么如何缩短数据与用户的距离?让用户一眼Get到重点?让老板赞同你的汇报方案呢?
( t& D: E X6 a+ i1 d7 B/ O 『《大西洋古抄本》是达芬奇的手稿集册中最大的一部,共 12 卷,1119 张,年代分布为 1478 年到 1519 年。每个方块代表一页手稿,上面的颜色代表涉及的主题,包括几何与代数、物理学与自然科学、工具和机器、建筑与应用艺术和人文科学。点开每一个小方块还可以看到每一页上面达芬奇写了什么,涉及了 36 个小话题,包括了马、食谱、绘画、灵魂、童话故事、笑话等很多有意思的小话题。』
0 X2 o- k# I* f; p0 H9 Y- r) V 
3 P4 D/ a- s: d9 T+ F 是这样的么?
8 u. E! ~8 N" g+ c) _. M: U5 t
这样炫酷的数据可视化,小编真的不会。开个玩笑,其实工作中我们并不需要作出很炫酷的视觉呈现,数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。因此在设计过程中,每一个选择,最终都应落脚于读者的体验,而非图表制作者个人。
# m- w. [- w: w, P 你不得不注意的图表制作小技巧
; P3 i& j: C5 q$ Q: X O 条形图的基线必须从零开始
* A2 `( G; t* U) Y S$ I
Y轴不从零开始,可以使数据看起来具有比实际存在的更大的差距。这使得可视化会误导传输信息。条形图的原理就是通过比较条块的长度来比较值的大小。当基线被改变了,视觉效果也就扭曲了。
. n8 z1 N/ w2 |7 u* p 
, x9 ^+ G- u7 |4 C
使用简单易读的字体
( l$ ^2 i. o) E( R$ {2 { 有些时候,排版可以提升视觉效果,增加额外的情感和洞察力。但数据可视化不包括在内。坚持使用简单的无衬线字体(通常是Excel等程序中的默认字体)。无衬线字体即是那些文字边缘没有小脚的字体。字体选择可以影响文本的易读性,增强或减损预期的含义。因此,最好避免艺术字体并坚持使用更基本的常用字体。
$ x8 F5 H! c& @, B6 m0 W- q
5 w+ m; }" C, |) ?
7 i/ ^/ A: M F$ t& m3 P( P
打开凤凰新闻,查看更多高清图片
* e* J; V+ |0 e: s. \
7 A6 i, ?2 X( Y) @4 d! q / ?6 m% k/ M/ a: v4 F( c
条状图宽度适度
, z) T) o' L8 A5 a
条形图之间的间隔应该是1/2栏宽度。
( n# x" y+ \# I ]

; M) l$ W) ]1 c# q
使用2D图形
/ D2 b9 L0 D9 Q* R
虽然他们看起来很酷,但是3d形状可以扭曲感知,因此扭曲数据。坚持2 次元,确保数据准确。
# _8 A: J: J; z% o

! J$ F4 E3 Y. M! b 使用表格数字字体
$ ?3 y8 t ? H+ [! _: z 表格间距赋予所有的数字相同的宽度,使它们排列时能彼此对齐,使比较更容易。大多数流行字体都内置了表格。不确定字体是否正确?就看小数点(或任何数字)是否对齐就行。
0 l; d8 M* K5 o5 t( f$ Q

* j3 O% A8 F1 s: e0 A 统一感
, G; Y8 i8 }) b* W0 R 统一感使我们更容易接收信息:颜色,图像,风格,来源……
% n$ m' W6 e: }& {- l 连贯的设计将有效融入背景,使用户能够轻松处理信息。最佳可视化帮助观众快速得出数据所呈现的结论
, _' d( `: z) G' @2 ~8 O0 ~1 z

4 u. [! d* m. y9 x
不要过分热衷于饼图
/ I, |# y ^9 e& P* t6 Z
展示多个区块比例大小,所有区块(圆弧)的加和等于 100%。但最好避免使用这个图表,因为肉眼对面积大小不敏感。
+ H# O$ b; y) W" s2 P ] 
; J& A: R' ^8 O0 Z' e) I 折线图中使用连贯的线条
. ?, e: Y& a+ n3 _
虚线,虚线容易分散注意力。相反,使用实线和颜色,反而容易区分彼此的区别。
, s2 M+ H# j* E2 O. l 
, ^, W% t( ?5 _. y* I$ ` 尊重部分所占整体的比例
4 G8 h% F( ^* ^- K3 u+ }! C9 a/ P 在人们多选的问题上就会出现比例的重叠,不同选项的百分比之和大于一。为了避免这种情况,不能直接把比例做成统计图。相较于呈现数值,有些图更着重于表现部分与整体的关系。
( J m$ D. _9 ^* ^- a1 d5 b* @1 L 
3 F; O) C3 B7 n& E
面积、尺寸可视化
6 i; W7 i, p* a6 h: W9 d( `" P 对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、高度或面积加以区别,来清晰的表达不同指标对应的指标值之间的对比。制作这类数据可视化图形时,要用数学公式计算,来表达准确的尺度和比例。
/ }* B7 X$ _/ h& E" F7 J

# l% Y5 r0 W$ v. e& L* F 使用大小来可视化值
! }' D4 s4 O7 k% R) L2 i- p
大小可以帮助强调重要信息并添加上下文提示,使用大小来表示值配合地图使用的效果也非常好。如果您的可视化中有多个大小相同的数据点,它们会混在一起,很难区分值。
" P m' c( ^" O+ \0 g& x 
U; `( o5 E# ?* f8 C 使用相同细节
/ p' z. x$ ~ y( C4 b
添加的细节(和数字)越多,大脑处理的时间就越长。想想你想要用你的数据传达什么,以及最有效的方式是什么。
4 l* }8 O& U9 I' L. Y+ } 使用基础图形
& j' ^; z$ Z% {4 g. C4 w7 {1 } 一个很好的经验法则是,如果你不能高效理解,你的读者或听众可能也难理解。因此,坚持使用基础图形:直方图、条形图、维恩图、散点图和线形图。
# _( ?% T. {. D/ g 
) b2 s p. ^7 j9 C' \
视图数量
$ `' B0 Q; O9 f1 o
将您的可视化中的视图数量限制为三到四个。如果您添加太多视图,大局会被详细信息所淹没。
$ G. V' A; J4 G5 {3 ]1 J ~+ [
关于图表配色,你可以参考的5条准则
" g* p3 C7 ^' I+ W: G* T 颜色深浅
: L% t Z* _% A( q7 c5 p: {) t 通过颜色的深浅来表达指标值的强弱和大小,是数据可视化设计的常用方法,用户一眼看上去便可整体的看出哪一部分指标的数据值更突出。
3 j# T& _' p" r$ ^2 d. c+ Z

' d& h7 E" @( w 使用同一色系
) V* {& Y2 C7 m9 k9 m. {: h9 _+ V
颜色用得太花,会给数据增加不可承受之重,相反,设计师应该采用同一色系,或者类比色。
. j/ U6 P' \1 b- _ 
# L( [" n. G5 ?. j8 e( S8 c
避免使用鲜艳的颜色
( Y5 t' T. ?3 G/ v* | 明亮鲜艳的颜色就像是把所有的字母都大写想要强调一样,你的听众感觉你在对他们大声推销。单调的颜色,反而能很好地用于数据可视化,因为它们可以让你的读者理解你的数据,而不至于被数据淹没。
4 h- F) i$ Y y' ~. U5 e. i- k
* I3 F2 k) {' s! `) t 标签使用不同颜色区分
! b0 u8 H4 U4 o
在某些情况下,在一段时间或一系列的值中,我们可能测量了不同种类的物体。例如,假设我们测量 6 个月以来狗和猫的体重。在实验结束时,我们想画出每只动物的体重,分别用蓝色和红色区分猫和狗。
' Y& T, @: Z. n' |' F8 i, s$ {' [
7 W! j* U2 s6 G. C! _2 l 颜色数量
$ @" g5 H. F$ s* {1 H& J 不要在一张图上使用6种以上的颜色。
" W$ H$ u0 m0 y$ K* e+ n9 C' x ; U% ^' r: G+ b9 `9 u
建议:
) o7 O+ W( A e& E( w
使用具有高对比度的颜色
8 C9 D1 R1 B4 M% z- e 使用带有图案或纹理的颜色来传达不同类型的信息
2 B5 y( C! }9 u9 u7 F9 Z2 o 使用文本或图标标记元素
4 o9 v5 n1 s; x1 p; S
标准的可视化图表一定有注释
" h3 o; b O9 R0 y" g1 u 解释编码
; O) p$ ^: W6 L# H9 Q1 _ e6 ?
通过一定的形状、颜色和几何图形的结合,将数据呈现出来。为了让读者能读清楚,图表设计者就要把这些图形解码回数据值。
( p- U! _$ u" f
轴标签
( F( S; |/ m$ \4 H5 B7 U
这可能看起来没有必要,或者不是很有帮助,但是你无法想象,如果你的图表有点混乱,或者看到数据的人对此不是很熟悉,你会被问多少次 x/y 轴代表的是什么。按照前面的两个绘图示例,如果要为轴设置特定名称。
3 Y# z: u! Q* T* O" c0 E+ B
标题
( L# {" L( t) E2 J
如果我们要将数据呈现给第三方,另一个基本但关键的要点是使用标题,它和之前的轴标记非常相似。
( ~. ?% f3 ]5 _, f A9 E9 r2 |' n, _# O
重点元素做注释
7 Q& ?7 j/ d! N" Q/ s) S- N2 j 通常情况下,仅仅在图表的左右两侧使用刻度本身并不是很清楚。在图上标注值对于解释图表非常有用。
: U# _7 }% `# h8 _) X
3 a" O" n2 C6 P& m
重要视图位置
; W( H5 r3 n* J) V( Y; U 将最重要的视图放置在顶部或左上角。眼睛通常会首先注意到该区域。
( {3 x" R& L0 [; e8 V+ \
3 \& V, g+ F# `! b 优秀的可视化图表,遵守的6条原则
1 k0 C/ E: b ^" C& a: W& G& T 数据排序有序
; `9 W3 c) Y5 R7 { 数据类别按字母顺序,大小顺序,或价值进行排序,以一种合乎逻辑的和直观的方式来引导读者了解数据。
9 }- D0 S6 r+ D+ u: w, {
0 I+ t8 R) i# Y: ]( P8 G 比较数据
U! G# \/ x v( n; T 比较是展示数据差异的好法子,但是如果你的读者不容易看出差别的话,那么你的比较就毫无意义。确保所有的数据都是呈现在读者面前,选择最合适的比较方法。
+ b" N! x# q8 Z$ s1 C* k
, c) [6 ~* B( q* X4 P7 T+ b
不可扭曲数据
9 Y5 s2 K$ C a) w4 S+ c% I
确保所有可视化方式是准确的。例如,气泡图大小应该根据区域扩展,而不是直径。
7 h# a9 T8 \; C+ d. `
. _# Z, E6 y( B& _) n" A
展示数据
& ^# r( \ N5 _) g
让读者看到数据,这是可视化的重点。确保没有数据丢失或被设计。例如,使用标准的面积图时,可以添加透明度,确保读者可以看到所有数据。
1 s( K; S4 K5 R( p$ I8 c* c4 A 删除变量
8 h, d. A; w4 Y/ B2 F
很多时候,太多的信息会影响读者的注意,从可视化中删除隐含信息是一个好主意,在这种情况下,我认为我们不需要在轴中包含变量的名称。
$ G, b" T- \! z' F7 J* k' ? 避免数据噪音
2 I, ^0 x* ?9 F9 }! i$ C% t1 x/ I 把不重要的东西减到最少或者去掉。这包括减弱或移除图形线,改变轴线、图形线的颜色,以及用浅灰色描绘电子表格行。使得“数据比率”可以达到一个很高的水平,听众会更容易明白其中的数据情况。
W1 g2 w1 n/ C' x9 a+ R7 f. z
+ U# u8 `9 D9 ^: k3 U1 [% Z1 \ 良好的数据可视化应该通过使用图形,清晰有效地传达数据信息。最佳可视化使您可以轻松地一目了然地理解数据。他们将复杂的信息以一种简单的方式分解,使目标受众能够理解并以此为基础做出决策。
2 y6 g, `, P4 H" u 正如Edward R. Tufte指出的那样,“设计的基本考验是它有助于理解内容,而不是它的时尚性。”数据可视化尤其应该坚持这一理念。目标是通过设计增强数据,而不是引起对设计本身的关注。
8 G) k7 I: h m9 w# ?8 s- B+ D
各平台同名“职坐标在线”
8 N% u5 m7 Q( P- U4 d* d1 u7 }