数据清洗环境是指为进行数据清洗所提供的基本硬件设备和软件系统,特别是已得到广泛应用的开源软件和工具。
终端窗口和命令行界面,比如Mac OS X上的Terminal程序或Linux上的bash程序。
适合程序员使用的编辑器,如Mac上的Text Wrangler,Linux上的vi或emacs,或是Windows上的Notepad++、Sublime编辑器等。
Python客户端程序,如Enthought Canopy。另外,还需要足够的权限来安装一些程序包文件。
电子表格程序,如Microsoft Excel和Google Spreadsheets。数据呈现和可视化,以恰当的方式程序数据分析和挖掘的结果。
数据库软件,如MySQL数据库和Microsoft Access。