! T- q& o O7 T9 o) Y 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
# `% E4 k( Q* S) D
1. 字段信息统计
# @2 j$ m# a2 k1 q) K
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
$ w3 l! L8 E+ @7 B4 N
" A. W- Y9 v R! x! r
: m/ w& B7 b, W& V/ `9 o+ i 打开凤凰新闻,查看更多高清图片
+ v% d. {. }+ r9 J# f
( Z. [( t Z* t1 g
: _( v9 C( X2 A; Q7 _ 2. 筛选生成新表
4 P) g- {# \. h 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
8 V" _/ k( Z# l) J1 e: Z

' z4 b/ t7 F/ p$ @- ^& l" A 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
1 f7 x, ]9 g& B0 P3 C9 F 
/ b5 X* L4 u6 \0 _. w/ [ 3. 生成关联数据
F4 a8 O2 Q# `9 l2 u- }7 s% \/ e1 J
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
2 _0 e6 f% O1 ~+ k
1. 选择表做关联关系
, O! d$ ~9 a; S5 X& N' Y

9 {, |! J3 c8 ^/ Z. Y4 U% V 2. 设置关联关系类型及关联字段
& n$ S5 u. }9 M# c2 @: j 
% `( p1 |5 I' v a3 P9 Y: h 3. 选择最终生成关联新表数据需要的字段
2 x& J$ K4 ?2 c4 r$ e+ H5 x: S) U0 x 
! U; i; ~& P% U8 A
4. 主题表数据追加覆盖
" T3 f3 F' E4 { 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
# g7 G# ~* p+ o
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
* Y3 T) V) U3 t J' S( `6 E* N 
3 k& H5 x2 |/ l 2. 选择文件数据源中的文件,点击追加或覆盖
2 {, m7 F9 e+ b! z6 k 
( S# B% V3 j2 V( B( B2 K8 e) K
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
9 h% c2 ~/ n" ^1 q5 m: p2 x; P% \ F+ n 
2 q0 y& |3 I3 X) X0 ` 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
& r3 w1 C0 G# t7 ]% M7 |& j7 W

* {. H! x' f1 o3 e 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
! w. e9 N/ d# v) X! k |

3 h3 @" H" q! ~6 d 也可针对某一个字段自行选择设置字段对应关系
& Q0 N6 M- z- ^2 s2 i: c2 N1 U7 X/ f 
. Y3 i. {- C; G
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
5 _7 Z* r! E4 D& O0 h