8 C. [8 {/ R3 B, Y( I" A$ Q2 G 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
{& T* C+ ` u+ z/ y
1. 字段信息统计
' S6 T0 Q" g8 W `/ W
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
: ?6 e* W) s9 R! k, D" }0 N( ]) m
) {8 H- r( B- h
% e: ~: Y+ ^+ I6 e/ v+ [7 k7 k; Y5 j
打开凤凰新闻,查看更多高清图片
6 I' |9 N; Y' X
9 V+ V' i d- A' K) l* m# W
- |5 \" m x% t/ z$ Q. R 2. 筛选生成新表
% G9 I9 Z2 R" N3 k; k; \6 C& a 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
$ O) t' a c) j& ^9 k 
" Y6 j( M. x" e 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
5 Q b) q3 z* T/ [3 c 
" A' {5 m5 L# ^8 h$ ]) U( ~& B; k
3. 生成关联数据
' B( R" o- u U& n1 t
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
$ |) G6 ^2 ]# m+ M, O 1. 选择表做关联关系
/ Q& o% m [8 A8 ]6 S+ L 
6 m% z; W: B+ x, A E
2. 设置关联关系类型及关联字段
Y$ L, j/ N& l" F8 w

0 h" C3 `0 o7 }: M" h! K1 R 3. 选择最终生成关联新表数据需要的字段
- g/ s2 }7 |8 c% V% N

; Z+ _; { Z2 b; i1 [- e* x
4. 主题表数据追加覆盖
, G$ ]& y. W: f* P4 c
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
5 M7 X4 c2 ~$ P% g2 G" u" |1 ]
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
' N2 K; U+ O p- N; K0 P

. j0 E$ K- |, B% {( G7 ~* G7 O
2. 选择文件数据源中的文件,点击追加或覆盖
. r1 U7 o/ G+ e, s* q 
; Z" M) I" h/ @: W, b( h7 q 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
9 n9 _6 ]- H; }5 L! N* B3 k; e' r7 R 
+ `' l6 P1 c/ E0 C' D) j
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
$ _3 {8 Z! w6 Z) k8 S

2 q, t! T h+ F; K' e 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
' V( C! f/ k' {

( _6 Q$ Q! W" x6 t. v# Q2 r& k
也可针对某一个字段自行选择设置字段对应关系
& O; x; ^: _" h 
{( F& u" @- d) R; _ 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
6 k# _! x4 c9 V; b8 q+ \- m2 A; u