$ w( n0 [+ o0 ?( b+ G M 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
0 Y9 \8 H* Q7 D6 T% m4 {
1. 字段信息统计
4 o/ e; j- X7 D) h* r/ v 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
6 {) i; @/ u! G( j/ f
/ u1 D+ c' `( g2 l1 k
. A4 z E" C" f 打开凤凰新闻,查看更多高清图片
: u" `, h$ D9 P; G' v
1 B' h5 m# X) H1 q # [7 l2 h- P; v% c3 [ y
2. 筛选生成新表
6 U/ K; I7 b& Y3 D
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
; Q n2 N/ k& E 
5 B. d) W# {4 w8 Q: C
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
8 O7 u9 i9 l8 z, z# h 
# I" d! K5 F5 E7 C5 Y
3. 生成关联数据
. Z7 p3 O& Q" e
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
( I: p5 x( g; c7 e* w) [# f
1. 选择表做关联关系
6 H1 E- w1 W# y5 v8 u- R, Q 
: E; ]) p; o2 k 2. 设置关联关系类型及关联字段
6 z* [% C1 {" U$ V1 }( U6 @ 
( ]1 w9 F! [) m. _: W: G) y1 u 3. 选择最终生成关联新表数据需要的字段
* L, y2 w3 K+ Y7 [

: i. C* ~ n4 x$ K& m8 Y4 H
4. 主题表数据追加覆盖
5 E5 G# v, o- \- P1 Q 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
I3 d e- m; C6 H" p' H; t" P" O6 U
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
, U1 S& z j. b G+ O

- v( Y$ \/ v7 j! S+ n( l) L, k5 f
2. 选择文件数据源中的文件,点击追加或覆盖
7 ~4 Z! w v, B! D 
' ]; y2 m8 s& k$ X 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
5 A* B' Z+ Z# Z7 U- n6 w

2 w1 P/ S' u. W* @: Y/ u1 c3 s' o 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
! J9 G8 E/ L4 L! l9 h4 | 
6 O; l5 n7 [: G- G/ P; i4 [
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
+ Q4 F) Z) D, R 
) p1 O0 \: a+ p. q3 `
也可针对某一个字段自行选择设置字段对应关系
" b+ {) V9 H. W* x3 v7 h7 u e: y" Q

4 W' Q3 q! n+ X' |7 ` 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
7 O1 G0 w6 w' t. p