今天和大家分享一下如何利用Power Query合并CSV文件。
主要知识点:
从文件夹中导入数据
添加自定义列
M函数Csv.Document和Table.PromoteHeaders
首先,看一下案例文件,在《各城市销售》文件夹下有13个城市的销售数据,如下图所示:
接下来看一下如何将这些CSV文件合并到一起为之后的分析做准备。
获取和清洗数据
第一步,新建一个Excel工作薄命名为"合并文件夹所有csv",在打开的工作薄中的【数据】选项卡下依次选择【获取数据】→【来自文件】→【从文件夹】来获取数据,
在弹出的对话框中找到文件夹位置,单击打开后在弹出的界面中选择转换数据,将文件导入Power Query编辑器。
这样就完成了数据的导入工作。
第二步,对数据进行清洗工作,已达到预期的格式。在Power Query编辑器中的【添加列】选项卡下选择【自定义列】功能,在弹出的【自定义列】对话框中的自定义列公式输入如下公式后,单击确定完成添加列。
自定义列是一个Table列,每一个Tabel对应CSV文件中的工作表内容,如下图所示:
这里用到两个M函数,这里大家不用理解,之后的学习会对M函数有详细的介绍。
现在只需将多余的列删除,将自定义列展开即可,其操作如下:
上载数据到Excel表
上面一节完成了数据的导入和清洗工作,这里只需将最终的结果上载到Excel表格即可,其操作如下:
最终结果数据如下: