1、选择JSON文件,文件名为chinacitylist.js。如果使用kettle读取JSON文件,则文件的后缀名需要改为js,让kettle把该文件作为一个JavaScript文件来读取。
2、在kettle的核心对象树中选择“Input” ,而不是“输入” 。从Input中,选中JSON Input对象,双击或者拖动到转化的编辑区域,根据读取的JSON文件的内容修改该对象名称为JSONInputChinaCity。
3、双击该对象,进行属性设置。在文件选项页中先浏览需要读取的文件,再选择增加,注意JSON文件的后缀名已经改为了js,如图5-6所示
先“浏览”找到需要抽取的JSON文件;
再“增加”把选中的文件添加到“选中的文件”列表中
4、在“字段”选项页中需要抽取的JSON文件的字段进行指派,这也是JSON文件抽取和之前提到的所有文件类型抽取的最大不同,JSON Input缺少自动获取JSON文件的字段,需要人工手动的进行输入,而且路径必须输入准确,并且对于JSON文件中需要抽取的内容,JSON Input也有一些特殊要求。如图5-7所示
JSON抽取字段设置:
每个JSON文件的字段内容均不相同,所以不同的JSON文件在抽取的时候都必须重新设置字段;字段的名字是在抽取后显示的列名,可以使用中文;字段的路径必须根据JSONPath规定的符号来设置,如图5-8所示
5、点击预览,查看抽取效果,如果5-9所示
6、从左侧“核心对象”选择“输出”,“Excel输出” ,拖动到工作区,把JSONInput的主输出指向该Excel输出,在Excel输出中指定需要保存的xls路径和文件名,点击执行,就可以通过kettle抽取JSON文件中指定了路径的数据键,把这些内容抽取并保存到Excel文件中。