引言
在上篇教程中,我们掌握了Power Query的基础操作,体验了它如何通过非破坏性操作保护原始数据安全,以及“后悔药”功能如何实现操作步骤的灵活修改。 Excel 小白救星:Power Query 数据清洗零基础入门实操指南!
本期我们将进一步解锁Power Query的“精准消杀能力”。在确保数据安全的前提下,彻底清除杂乱表格的三大顽疾:
1. 侵扰文本的空格
2. 破坏结构的换行符
3. 污染信息的特殊符号
请跟随莘祺,轻松终结数据污染!
想了解更多精彩内容,快来关注Excel莘祺带你学
一、表格示例
假设我们需要从销售系统中导出商品信息,但是,系统导出的信息转到Excel表格中却变了样子,如下图:
我们可以明显看到其中的错误和异常,如多余的空格、非必要的换行符、多余的特殊字符等。
二、启动Power Query
当你需要处理不规范的Excel表格时,“Power Query”功能就是你得力的好帮手啦!
首先,我们要将“Power Query”功能启动
操作步骤:
1. 选中表格中的任意单元格。
2. 切换到“数据”选项卡,点击“从表格/区域”。
3. 在弹出的对话框中,勾选“表包含标题”,然后点击“确定”。
此时,Excel会将表格加载到Power Query编辑器中,如下图:
三、清除空格
表格中“商品名称”和“商品描述”这两列存在N多个空格,我们要将它们清除。
操作步骤:
1. 按住Ctrl键不松开 → 点击“商品名称”和“商品描述”列标题
2. 点击顶部“转换”选项卡 →替换值
3. 在弹出的对话框中:
“要查找到值”:输入一个空格(直接按空格键一次)。
“替换为”:不输入任何内容,空白即可。
4. 点击“确定”。
表格清除空格后的效果如下图:
四、消灭换行符
在Excel中,非必要的换行符可能导致文本被割裂显示为多行,这在某些情况下可能会影响数据的可读性和后续处理,所以,我们需要将这些换行符去掉。
操作步骤:
1.按住Ctrl键不松开 → 点击“商品名称”和“商品描述”列标题
2.点击顶部“转换”选项卡 → 格式 → 清除
清除换行符后的效果如下图:
五、清除特殊字符
在文本数据中,特殊字符(如★、◆等)可能会导致数据处理时出现错误。为了清除这些特殊字符,我们需要使用Unicode编码。
注:Unicode编码是一种国际标准,用于表示各种字符和符号。通过指定字符的Unicode编码,我们可以精确地清除这些特殊字符。(文末会提供常见特殊字符的编码)
操作步骤:
1. 保持选中“商品描述”列。
2. 切换到“添加列”选项卡,点击“自定义列”。
3. 在弹出的对话框中,输入以下公式:=Text.Remove([商品描述], {Character.FromNumber(9670), Character.FromNumber(9733), Character.FromNumber(9679)})
公式解读:
Text.Remove = “删除符号” 指令[商品描述] = 指定要处理的列{} = 待删除符号清单(用逗号分隔)Character.FromNumber(9670) = “把9670转换成◆符号”
清除特殊字符后的效果如下图:
4. 鼠标右键点击原“商品描述”列 → 删除
5. 双击新列标题 → 重命名为“商品描述”
6. 鼠标左键点击在“商品描述”标题上,然后将“商品描述”列向左拖动到“价格”列的前面,与原表各列的位置保持一致。
六、导出与刷新
1. 在“主页”选项卡中,点击“关闭并上载”,将清洗后的数据存入新的工作表。此时,清洗后的数据会自动加载到一个新的工作表中,而原始数据仍然保持不变。
2. 如果你修改了原始数据,只需右键点击Power Query处理过的表格,选择“刷新”,即可自动更新清洗结果。
结语
Power Query作为文本清洗的终极方案,具有以下优势:
安全:原始数据始终受到保护,不用担心误操作导致数据丢失。复用:设置一次,即可终身一键刷新,大大提高工作效率。精准:具备Unicode级字符清除能力,能够精准处理各种特殊字符。灵活:清洗步骤可以自由调整,随时应对不同的需求变化。
宝子们,“下次遇到带有乱码的Excel数据,别再手动,别忘记启动Power Query哟!
希望这份教程能帮助你在工作中更高效地处理文本数据!
附:高频干扰符号编码表
什么是场外配资,炒股配资什么意思,正规炒股配资网站提示:文章来自网络,不代表本站观点。