当前位置: 去除器 >> 去除器优势 >> PowerBI之清理不规范的数据
由于数据源的来源不同、多用户创建等问题,PowerBI连接到的数据源往往存在数据类型不准确、含有重复项和错误值、标题位置不对等一系列数据、格式不规范的情况,PowerQuery编辑器有快捷、方便地清理各种不规范数据的功能,可以帮用户进行数据清理。
更改数据类型有时,查询表中有很多不利于读取的数据类型,可能会对后续分析数据造成不必要的麻烦,此时,可以利用PowerQuery编辑器的“更改数据类型”功能和“转换”功能,快速处理不规范数据。
01更改数据类型1方法一:使用快捷菜单步骤1打开“更改数据类型”文件,单击选项卡区域内的按钮,打开PowerQuery编辑器,如图1所示。
图1进入编辑器
步骤2在需要更改数据类型的列标题上右击,在弹出的快捷菜单中依次单击→选项,在弹出的提示对话框中单击按钮,如图2所示。
图2更改数据类型为文本
该列的数据类型即可全部更改为文本,如图3所示。
图3数据类型已更改为文本
使用同样的方法,可以将不规范的日期的数据类型更改为日期,如图4所示。
图4更改数据类型为日期
2方法二:使用功能区选项卡选中需要更改数据类型的列后,依次单击→区域内的按钮,同样可以进行数据类型的更改,如图5所示。
图5选项卡
02转换字母大小写有以下两种等效操作,可以实现迅速转换字母大小写。
??按住Ctrl键,选中需要转换字母大小写格式的多列,在列标题上右击,在弹出的快捷菜单中依次单击→选项,如图6所示。
图6使用快捷菜单实现多列首字母转换
??选中需要转换字母大小写格式的列后,依次单击→区域内的按钮,在弹出的下拉列表中单击选项,如图7所示。
图7使用选项卡实现多列首字母转换
完成以上任一操作,即可将选中的列中的首字母转换为需要的格式。
此外,单击下拉列表中的或选项,可以将所有单词或字母都转换为大写或小写格式。
删除文本中的空格和不可见字符从数据库软件内导出,或从网页上复制下来的数据中,经常会夹杂着肉眼难以识别的非打印字符,也叫不可见字符,这些字符的存在,容易在引用、统计等对相关信息进行处理的过程中导致错误频出,使用PowerQuery编辑器的“修整”和“清除”功能,可以快速解决相关问题。
:删除所选列的每个单元格中的前导空格和尾随空格。
:清除所选列中的非打印字符。
如图8所示,选中要处理的文本列,依次单击→区域内的按钮,在弹出的下拉列表中单击或选项。
图8修整文本
其他数据在转换过程中出现错误时,也可以先使用“修整”或“清除”功能处理之后再转换。