% d i" ~! A6 p, J: ^' u/ S+ T
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
6 A" o# D: F: Y1 ^ 1. 字段信息统计
- o6 p$ W i4 ]3 h Y8 T 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
' w. g8 ~0 u3 m$ @" T
0 u( P& y3 J7 H2 O' d6 ~
' A4 }' N8 K- N0 M6 {/ `- y 打开凤凰新闻,查看更多高清图片
- P1 S$ l4 `! B$ c* E0 q! v; w
" F9 E( D6 e& `) q! a
+ v9 _# B$ [8 H4 M1 g 2. 筛选生成新表
4 _# a7 q/ ` Y; p/ I( j( s0 \ 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
1 y4 ^& ]5 N4 j V, G& `# ?' r1 H

- F+ c5 m s' M
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
/ L0 A+ ~+ l, m2 b% \ 
) X6 l# Y! x4 B% A
3. 生成关联数据
, W/ g- W" G3 F) w' j/ X9 h- V
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
$ v0 `# w' O: |9 o- Z: k
1. 选择表做关联关系
1 T0 j6 ?. {$ b( s7 c7 c 
y: H. J3 l* Q. c) w5 L, G 2. 设置关联关系类型及关联字段
2 G' F- y1 W; ^) U& w; y( J 
/ @, z9 r- [6 z' X! k
3. 选择最终生成关联新表数据需要的字段
: W* S; Q5 j& v/ v1 p+ G

8 d0 E; {$ ~& X* C 4. 主题表数据追加覆盖
2 T8 `( g5 P4 j& }/ L6 C5 J5 r3 o, ?) [" t
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
1 m8 I7 }# {, I2 y! k1 j
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
& _5 O& G4 C# ~/ p 
% e( D$ C/ r* F2 `' E$ M
2. 选择文件数据源中的文件,点击追加或覆盖
M2 y2 {! Z0 |# r5 M l 
! I; x# H o4 R0 B
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
4 r7 W- I4 ]& R7 \7 z1 f) J. \ 
, \$ M8 k( {5 o8 w
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
8 R2 C: _7 Z- x; {: |1 y+ s: e

' ]* s* a, \8 P3 c% c2 d+ z9 u2 W
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
/ e6 d: e7 i) O) P

+ Z4 b3 H/ _' G% L" a; V 也可针对某一个字段自行选择设置字段对应关系
/ W; X( L' K L1 [ 
1 o: ~5 {; X1 G) g, V7 l 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
) v7 `9 A* R# b) m