) W2 M+ p6 V [) w
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
7 v4 i l I# F9 W3 m* r& O 1. 字段信息统计
4 \- z# E P4 ?) u& x 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
# t" g: l: W" |4 Z7 d& i( d
2 |: Q. {2 c- ^9 x; A# B
6 H# [8 z3 X2 [- m$ y 打开凤凰新闻,查看更多高清图片
# c$ }2 q( e) u4 X# }
3 U* J7 Z( p% v6 k# j. W, b
1 @/ q6 L: a: N* ` 2. 筛选生成新表
4 N& V; _) E3 K8 e
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
$ o2 y3 l; @9 @$ Y8 i 
, c+ j& P+ X2 L+ s
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
' F) O4 m/ p, S, J+ k( g I$ f9 l 
. W( C* e- m) ^7 M- f
3. 生成关联数据
; U7 W) F" p- {3 L- @0 c
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
: R4 R; n# t' I1 S4 q8 O t3 D8 u# L- D 1. 选择表做关联关系
" B% N# A. d- u8 D& J/ [ 
3 d) X! [9 a% ^+ i: l7 N 2. 设置关联关系类型及关联字段
9 Q- { ^/ s, s- d) D E

5 L) `& q& Q7 `0 h6 _+ @ D
3. 选择最终生成关联新表数据需要的字段
; i1 J1 k% v' U6 C, I2 K

8 w7 ? u& F# P! Y g7 K 4. 主题表数据追加覆盖
1 }6 X! v. Y+ M4 C6 m 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
/ U2 R8 U5 [, L4 S1 a 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
+ Q/ v) b# t, v; r. C& d 
# |, l: k8 Q1 J- ~) Q2 V4 b3 q
2. 选择文件数据源中的文件,点击追加或覆盖
. J- z' S' [; p, p1 E

4 @* S/ W# J, }, i
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
- D& S; O8 ^ U* r- N- ~5 p

3 W0 g* y0 H* t$ u" o5 h 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
! h( _9 q+ h% F

3 m1 b8 J, p6 u- A 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
7 x; ?; r* x+ e/ `' k

. F3 G8 O6 C0 U- I% w y7 I
也可针对某一个字段自行选择设置字段对应关系
# Z1 E. r; J; X4 _ p* R" z0 s 
/ x* x; F; ~; P1 I4 }& U' s
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
1 ]7 ]7 S5 a4 q% J% u+ G) q0 \; b