$ T' X7 q$ J3 `( w6 k \
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
! J( k# t1 s0 Y2 C6 p- B 1. 字段信息统计
: F* u3 G# q; ?) n. M
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
6 I7 Z2 B. K, d5 A8 v" h g
- P) X* M* n& v$ n1 c: M
* v/ K! X7 @, e0 q# ?" g4 P 打开凤凰新闻,查看更多高清图片
& ?% E( P9 V5 r6 e
8 v# o/ K/ w3 `
3 e' V% g9 H8 B 2. 筛选生成新表
/ u6 l" m- A! \9 H 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
$ Z0 U+ b% o0 l# u1 x 
; R7 @4 M/ T* [$ D0 w 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
, J, J7 F1 V2 L) ?2 Q: r 
8 ~ H- S& ]0 I* l( }. s/ U x 3. 生成关联数据
# d' o' t) n7 x" x3 r/ j
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
3 _1 z p1 [; X# z# Z 1. 选择表做关联关系
' m, S- Q5 o# M$ X

0 b- L$ j- `4 B d5 r, E 2. 设置关联关系类型及关联字段
& U' `$ ~* F8 F( k 
3 C# x: a' v& c. Y 3. 选择最终生成关联新表数据需要的字段
) z$ o! Q7 w) y8 @$ e

- s* M+ A; g. D' I: H' c
4. 主题表数据追加覆盖
9 \" l/ ], _5 G9 R3 L$ Z/ b
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
}$ x# {. t/ w% x! L 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
$ q/ d. \2 a/ H( Q: t' ] 
% n5 _5 v% @4 N/ B 2. 选择文件数据源中的文件,点击追加或覆盖
2 {1 V. Y: w, b3 `) M2 w

" k1 ~. }4 [0 r5 h
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
6 P! F3 `8 h3 a. `. b 
1 D( z' H% g+ q! G- b$ [
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
, O6 C/ v% l) V# R8 R7 r 
5 q. n6 J) ^2 x
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
' j0 n3 A7 _) s/ ~) o

8 _7 J$ V+ F! {, k+ G5 p/ u 也可针对某一个字段自行选择设置字段对应关系
0 |# t5 d. S. ~8 a 
3 W( v8 l9 C$ \; D P7 s/ s 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
9 q, Y) p* L5 [7 W: p