, ]7 z4 Q! X6 o" w* O3 T9 U 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
; c# L2 s& U: {7 z! H! k 1. 字段信息统计
% K( o2 h9 E% K X; i 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
- N7 P/ g G, q" y
3 j; y3 _$ x1 d5 n6 R8 p& S5 ` . Q: E3 V! }2 p I" W& r+ h W
打开凤凰新闻,查看更多高清图片
) s, v, X- t4 B! v $ t! P0 U5 Y) T4 @ Z( z1 Z
* n& A5 T1 u+ T- D! G6 l4 R
2. 筛选生成新表
& x$ B! T e$ e& P6 n7 V 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
; N% w6 q8 o3 q7 `1 W 
( f4 v; u2 O; m, p 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
) d. A+ D; P1 u1 J! f

" t6 r) D+ F2 x5 R
3. 生成关联数据
6 d" k( r7 B6 G4 ?% C& C
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
* P. } e* B/ @3 @! a, {6 S/ y 1. 选择表做关联关系
$ A9 [6 a" { Z 
. N3 p' Q- J7 N$ ?, u. u2 N0 a4 b 2. 设置关联关系类型及关联字段
u6 ^" E; J7 G; ?

$ Z& _$ k' m1 C" z
3. 选择最终生成关联新表数据需要的字段
/ e: y% R8 J" ?* z; b$ H$ e 
/ O% j m' p# q" X 4. 主题表数据追加覆盖
2 X q5 Q" `3 [8 A: F4 B) ]
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
# j5 b- x- w. W; y" j' i) P
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
6 _3 o% l }, t# V# j3 F

* `' Q# S& _. y& V
2. 选择文件数据源中的文件,点击追加或覆盖
' G( L+ { [" {2 u- p O

4 X/ n5 R# G& C( y9 f4 j3 w 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
' s% w& \# n: j8 }7 f+ j" e6 \ 
- [; [/ a+ W. u. K# C& X
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
+ j- h4 p/ ~; [2 |5 [# @- q

/ t8 F+ C! V7 P 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
8 Q& p+ Y. v7 W! P 
9 U4 [+ Y& N6 p6 R, | 也可针对某一个字段自行选择设置字段对应关系
e$ f5 j- B$ t& O5 [! I! Q' b 
3 w& j# z( j7 ^, z1 Q9 R+ v" x 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
: z3 _! c: {8 e