- o0 J6 `! V. h# C+ T. E* M. C) p& O
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
7 E8 ^. L' m$ A 1. 字段信息统计
* l3 s7 i* |& x; S" o4 X) y 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
y+ \0 ]8 {6 Y" p: a
, L& _! o& t/ ~- @) C* Q $ l% \5 z7 H; r. s. p- |9 b4 H
打开凤凰新闻,查看更多高清图片
# \0 n( h- e5 y# q
/ f9 Y9 u# ?; e! w
. w* \& F6 t( }) S. l; | 2. 筛选生成新表
. u4 I% d' U- M( U! |0 \ 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
2 h: L& `& K. t3 h 
0 q, {5 @! T/ Q5 L8 h
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
. @6 Y; b8 e3 n5 V! X/ G 
9 W/ u' Y: ]$ k. V, ~
3. 生成关联数据
* y" f6 \8 t \# t 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
) U! H) H. g& H4 v: X 1. 选择表做关联关系
% R) b$ |0 n3 B 
# i* ^1 [3 E, S; |) ?
2. 设置关联关系类型及关联字段
: L/ n, b6 X$ T) C) s 
5 i6 K. W% ?9 M T 3. 选择最终生成关联新表数据需要的字段
5 Z$ n( I' r" M4 ~3 k2 k3 f# R 
) b$ M$ ~0 I4 _, [+ L- }, l+ k, B 4. 主题表数据追加覆盖
( c- B3 G( {8 l' A' i) G1 g 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
% B* @/ I3 r7 L& b
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
- Z9 t% w; i, y- W$ y1 C

) ?+ }# x9 [2 Y3 l: A0 u3 ^ 2. 选择文件数据源中的文件,点击追加或覆盖
5 P3 i. z4 S: ^: S: W: \$ @4 F

' s" O2 n* N9 R8 ~1 W l8 j
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
7 Q5 Q( Z1 N3 R2 n 
" r, p! W2 h3 Z$ P3 n
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
* A6 y! o9 L, F8 M+ r- u

' g7 m6 K7 O+ ` 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
4 S; D5 k7 Z& r9 T

/ j1 Y/ Z6 j j( u1 C/ D; ?, j
也可针对某一个字段自行选择设置字段对应关系
8 g' k# i( C- g 
9 A7 H. S- x8 `- U, H 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
6 w9 P( f9 e: J" r% g, R( _" V