9 x1 K* |2 \- ~: U5 r$ b' Y# s3 ?
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
& `" }( b1 [7 G4 \( Y6 f
1. 字段信息统计
) B7 Y0 ?' V3 C F! }* U$ {0 ? 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
+ B/ o+ I9 X7 K4 X+ ]- X1 u
9 z# P- S% ~: B( U. I% p
* e6 I$ x8 A. ?3 ?$ g 打开凤凰新闻,查看更多高清图片
$ N/ }! i' `, o' a. \5 K- P+ V
: h& ?: J7 |( s& g+ V5 p5 U & \* s1 s+ S: I/ k: o$ k1 O. z4 Z5 t
2. 筛选生成新表
5 f( g6 T6 C6 F 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
. i6 Y' V/ }" I, {7 G 
( }& T7 d$ T0 @, } 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
) h! ^8 U! N- G7 P* x- W. q/ y

3 |/ T8 }: K( g7 k! q" V$ U- u
3. 生成关联数据
: M0 h* l- H2 ]. p3 M3 [' A: t. x
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
( t$ i! ~6 `8 X) P \ d6 | 1. 选择表做关联关系
& h; r" r& B2 [7 _# N 
& k4 }3 h3 _% x4 F5 @! I6 f1 D
2. 设置关联关系类型及关联字段
6 h& ]% i8 O O3 n! I 
& T7 s3 V, X4 K) N% ^8 i( p7 z8 Q
3. 选择最终生成关联新表数据需要的字段
/ a0 U& R: n. k" x9 h

# e/ {: o2 z& k3 w. G 4. 主题表数据追加覆盖
) Q% Q7 ?/ Q' g 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
* X- ~, \5 ] z9 R ~ 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
1 ~8 C7 F, p9 t* l

% B! P4 ^: G( k& B0 P& G- j7 A6 q
2. 选择文件数据源中的文件,点击追加或覆盖
3 q' `! W( c# l; L, q4 ` 
5 k! V4 E- q$ I2 \ 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
. t6 ]! X* p; Z! N4 i 
0 y% z1 N% v; E; ~1 S4 V& ?
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
8 P* Q- i6 ~( H8 y

# [6 C7 j' Q. f! Y
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
+ H) ?7 W4 j8 A9 b1 k6 Y

" l! U' _0 i0 R6 C9 V5 p( F( W& P
也可针对某一个字段自行选择设置字段对应关系
7 q( X# d" V5 o" h# Z$ ^, m) r( V. c

! u) g% L; [; m# ]/ z
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
2 d* H/ a+ x4 X" T4 C D3 p