8 F, E2 ]9 I7 c9 ^
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
: |9 _ e5 k+ n
1. 字段信息统计
& {' j9 i, _2 n
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
3 X4 I: ^0 h$ h) ?+ `$ i* Y% K
- l) j( M$ S7 w2 l1 ^# t* W! n
4 n# u: W# t5 I& v! e+ L h$ c6 Y 打开凤凰新闻,查看更多高清图片
& z4 p( _8 B7 p3 F
[' M% ^1 `$ E o% y! X
: z, E- F+ `9 n5 c" f* _ 2. 筛选生成新表
! {" V7 @; w1 n9 l# U0 H6 Y, n
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
2 ~: w1 N7 D" Z2 s 
4 |; w* M* f; T* {, K+ U; r 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
( l: s" _$ x1 ^/ o 
- ^$ h9 f) T5 W' W 3. 生成关联数据
4 J9 a( S" b ^& x 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
( E' A B; h# I
1. 选择表做关联关系
- y# Z& E3 }: D6 E* a 
3 s8 s {& F3 |6 p8 r* {, F1 k9 g 2. 设置关联关系类型及关联字段
7 Q: L8 @* ]8 E

, H. E9 v- B8 I$ C9 M( M
3. 选择最终生成关联新表数据需要的字段
! p, M6 f* L( Q4 y+ n% J

' }, \) V- A2 i- e5 T 4. 主题表数据追加覆盖
. Y' y8 D" ]" C' S; _' [7 n: U 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
: _& W1 l1 z$ A; h
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
& c2 c" \- o0 M 
9 V; k8 Y ^/ G' U3 z/ |
2. 选择文件数据源中的文件,点击追加或覆盖
/ c$ ]+ I6 [" }' O: ^- \ 
& D& d) c, {+ y- B# f; w9 B
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
. G- g3 b/ o. }5 }$ x d6 {

# Q' p2 ?6 c% B2 m/ Y4 s3 K, q% G 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
9 }* n- r5 E5 \; g+ P6 W

$ P1 e" `& T+ y& m* v4 K( g6 ?
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
$ z5 q* X: q& e. m4 |- O# d

5 v( C" ]2 H6 R
也可针对某一个字段自行选择设置字段对应关系
: P3 `; i+ b1 f

3 L% b% R9 i5 X6 V4 F 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
) {- o3 z) {$ I( r) c3 J" X8 x6 U