今天和大家分享一下如何利用Power Query合并CSV文件。

主要知识点:

  • 从文件夹中导入数据

  • 添加自定义列

  • M函数Csv.DocumentTable.PromoteHeaders

首先,看一下案例文件,在《各城市销售》文件夹下有13个城市的销售数据,如下图所示:

接下来看一下如何将这些CSV文件合并到一起为之后的分析做准备。

  • 获取和清洗数据

第一步,新建一个Excel工作薄命名为"合并文件夹所有csv",在打开的工作薄中的【数据】选项卡下依次选择【获取数据】→【来自文件】→【从文件夹】来获取数据,

在弹出的对话框中找到文件夹位置,单击打开后在弹出的界面中选择转换数据,将文件导入Power Query编辑器。

这样就完成了数据的导入工作。

第二步,对数据进行清洗工作,已达到预期的格式。在Power Query编辑器中的【添加列】选项卡下选择【自定义列】功能,在弹出的【自定义列】对话框中的自定义列公式输入如下公式后,单击确定完成添加列。

=Table.PromoteHeaders(Csv.Document([Content],[Delimiter=",",Columns=8, Encoding=936, QuoteStyle=QuoteStyle.None]))

自定义列是一个Table列,每一个Tabel对应CSV文件中的工作表内容,如下图所示:

这里用到两个M函数,这里大家不用理解,之后的学习会对M函数有详细的介绍。

现在只需将多余的列删除,将自定义列展开即可,其操作如下:

  • 上载数据到Excel表

上面一节完成了数据的导入和清洗工作,这里只需将最终的结果上载到Excel表格即可,其操作如下:

最终结果数据如下:

举报/反馈

靶心学堂

111获赞 26粉丝
带你一起学习职场技能
关注
0
0
收藏
分享