数据预处理与可视化分析:
数据预处理可以分为数据清洗、数据变换等。
数据清洗是对缺失值、异常值等处理,可采用插值方法,例如用平均值、中位数、众数、近邻数、回归方法进行补全或直接删除记录等。
数据变换是对数据进行函数变换、规范化处理。
数据的可视化分析能让数据变得通俗易懂和直接表达所传递的信息。在数据特征预处理后进行可视化分析,可以有效的帮助我们了解数据集的分布规律,对数据理解的越充分,越容易找到更好的特征,进行后续的机器学习建模。
如统计分布:直方图、饼图、散点图、树等。
用户访问量
注册用户数
在线视频观看人次
在线实验人次
数据预处理与可视化分析:
数据预处理可以分为数据清洗、数据变换等。
数据清洗是对缺失值、异常值等处理,可采用插值方法,例如用平均值、中位数、众数、近邻数、回归方法进行补全或直接删除记录等。
数据变换是对数据进行函数变换、规范化处理。
数据的可视化分析能让数据变得通俗易懂和直接表达所传递的信息。在数据特征预处理后进行可视化分析,可以有效的帮助我们了解数据集的分布规律,对数据理解的越充分,越容易找到更好的特征,进行后续的机器学习建模。
如统计分布:直方图、饼图、散点图、树等。
¥ 5999
·难
·20
¥ 9999
·难
·1
¥ 7999
·难
·8
¥ 199
·易
·31
¥ 899
·适中
·15
¥ 1688
·适中
·198
¥ 28000
·难
·169
¥ 199
·偏易
·3589
¥ 100000
·难
·171
¥ 998
·难
·9
¥ 1899
·难
·15
¥ 199
·易
·342
¥ 5999
·适中
·30
¥ 6999
·难
·18
¥ 5999
·难
·15
¥ 3999
·难
·15
¥ 2999
·难
·57