" F4 _- l% @3 P5 j O 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
* Z4 X7 ?* \$ @1 c/ {& S+ A 1. 字段信息统计
& y$ [% Z+ H- i5 l/ T. f
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
% O+ @5 M; q9 {1 J7 A% y) n8 y
. |! R/ V0 \! Z; G % [( c0 f; L* \
打开凤凰新闻,查看更多高清图片
" y6 G0 b6 M/ o' A) t: a
2 F: E. |7 f& p3 F % _5 A# \# A3 _$ b- ~$ y
2. 筛选生成新表
2 h! d$ Y5 [5 P7 y. X3 ^% u4 W6 J$ o4 v { 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
; p9 I, }+ |( S! z4 i6 b/ y

/ I3 S" _% R. E2 m. H! F6 K" A2 x% I! ~ 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
/ x7 }1 L4 q5 @, |1 z1 L( L 
. E: Q0 j2 ]* V! }( T+ x 3. 生成关联数据
) ^9 S6 a& q d$ m; N, e 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
" E' v! u% W( `: a1 Y$ M4 r- ]* k 1. 选择表做关联关系
" p# v7 x) @$ `) t! o) m& r" {' J 
: t' B: X9 _, ^8 i# h4 Z% T" Y 2. 设置关联关系类型及关联字段
: V% S4 D) ^7 F" X1 t* m3 o 
* P* j4 s! w3 Y N# X% u7 f. Z, j 3. 选择最终生成关联新表数据需要的字段
0 D, ]2 X& v. A7 C! \" ~! x2 |

9 y! X0 h) V' _; i' x
4. 主题表数据追加覆盖
* r2 G, J9 l" z% N% Z 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
' v! c7 n- f. @+ |" r 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
/ r5 I4 _* \: s2 [& c4 ~6 L

8 q1 N2 ?5 w& e- r
2. 选择文件数据源中的文件,点击追加或覆盖
& u/ x5 H s& r0 n) k3 I7 h; ]

9 ?2 V; ~) Y* b2 k
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
# J+ Q( D" A3 |$ n+ J, c

' p! t8 n1 p) Y' x( D$ r( g 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
6 b; S; I/ L+ i- l 
! o2 H( w- n1 W+ |$ L7 w 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
! ]9 ?9 z! f8 F* T3 Q, ?3 w8 g

@/ a5 o, q! T! G
也可针对某一个字段自行选择设置字段对应关系
; p& c8 V( `; P0 | 
+ a- D+ P( S" |! k/ _6 E+ C 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
' H4 ^: |/ i* k7 b( a* N$ v