8 [9 w' T/ v7 v
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
1 Z4 `: j" _! u( X1 Z 1. 字段信息统计
! Y. ^& h, Z+ k) u
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
+ l5 I6 V' |3 V
9 t+ M* r# D8 F- a 7 X( {7 N& d3 Y4 \+ M# N, x
打开凤凰新闻,查看更多高清图片
* e. z; L6 v9 H9 a
W1 N) T! ? U* s& T! X
( B# _% j0 |: Y4 | 2. 筛选生成新表
9 H' g9 G. Q' k 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
& [8 C& K% i9 o7 [% h 
5 \ t: V3 t" [' T 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
" r/ G" v3 A4 G6 {9 R' V' n; z

; [# W- a; a x 3. 生成关联数据
' R$ m+ t8 [4 r( n
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
/ K& K! q8 p, `! e8 g 1. 选择表做关联关系
: [" p% d' `0 x" e

. i) V6 T% v/ P( O5 _
2. 设置关联关系类型及关联字段
3 ]" a# T" K D

- ? s- H) _0 H" n* y 3. 选择最终生成关联新表数据需要的字段
5 I+ J# ~6 e4 c

& A+ w3 I( @( }$ I' B: N8 u 4. 主题表数据追加覆盖
4 q$ \! u/ z. d
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
+ [, L! b8 Y1 ]0 ^; F7 x
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
& Z) P/ J8 v$ t

9 k5 m5 B* I5 {$ h& Z 2. 选择文件数据源中的文件,点击追加或覆盖
; d6 \" a+ i- w$ J1 ^+ h

! h! r; V2 M' L" ?6 h 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
) C3 ?- `, l. @. ?. s% h 
, W6 V; J7 z) p! o* s6 X
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
3 W' e' Q$ {' ]4 H' F: w% Z) C z 
3 m' Y7 n8 l# g- u
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
# i" _; }; ]3 P: t# E w i! m0 Z 
% x. `! N, b% Q4 C* f6 e
也可针对某一个字段自行选择设置字段对应关系
2 o( ?* c8 g: l& Y6 I

b3 p' q, `6 I9 P, ]" U% N 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
9 _- {# A& i/ K# A" A9 e1 Z