, Z$ |' A0 L% o8 n$ K
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
; A7 B! n4 u/ Z( P7 j4 d* U+ j: V
1. 字段信息统计
) M: e8 ]* q' v$ K
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
|6 h" j; C$ F4 ]# V- r
# A$ k5 t7 G8 j' w( H 5 c4 ]% P2 q5 a& q% _
打开凤凰新闻,查看更多高清图片
5 u8 _- n2 S6 M9 |/ |
# N4 K, Z( h# L# G, ~# y# f
. T+ K# d) Q, E# w* g5 m9 ~6 @ 2. 筛选生成新表
/ X8 I' O% n! h: ?& R/ f/ x 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
0 P# |# b; h4 w, m5 l$ v: M e
: a, e) j8 X3 J 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
6 q4 [1 h# e* T# n( z% [3 R$ L
7 n# @" b# _( @ 3. 生成关联数据
, @) V$ {: z+ i
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
7 S! @8 N' N, h" |6 @$ ?
1. 选择表做关联关系
+ M) Q- b( Z6 _ E7 z7 [- Y
6 o' S7 B. a6 P5 f2 Q 2. 设置关联关系类型及关联字段
% x, M/ p0 J$ `5 _2 r & m! _) D: b' ]# L1 A9 q' W
3. 选择最终生成关联新表数据需要的字段
. B. Q* R2 O% A5 C. K& U
1 } p' j0 \9 o* S/ y
4. 主题表数据追加覆盖
$ J% s X1 W: `/ J2 ? 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
5 z3 O; _/ Q, B5 Z- P9 u4 q 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
6 y. A3 k3 M/ H1 r$ w3 P
2 i) f& X# X! O" {/ I1 _5 p 2. 选择文件数据源中的文件,点击追加或覆盖
7 j& A$ N9 U: ^) ^) d4 E0 L
! ?8 t. \' b1 i; m1 G3 u8 Y
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
/ A1 V0 B' t" ~
. b. _) X6 U4 P s 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
/ X& T# c* K. I d& S2 q, t! [5 j ; }6 n$ [6 e0 d9 T) X
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
: u* z. h! O; g% g2 a( K9 C. ` / A! ~5 F3 p% c6 z
也可针对某一个字段自行选择设置字段对应关系
. s4 h% o2 t: |5 f2 r
2 ^* k/ l- T! t 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
' @) q$ w+ h- Z2 `$ T# u( @( a