• 0

    用户访问量

  • 0

    注册用户数

  • 0

    在线视频观看人次

  • 0

    在线实验人次

数据集的划分方法

作者:云创智学|发布时间:2021-12-16 10:23:33.0|来源:云创智学

数据集的划分方法

机器学习需要大量的数据样本、这些样本即为数据集、针对特定领域解决某个问题,就需要特定领域的数据(自建,公开数据集、伪数据集)。

划分方法:训练集、开发集和测试集。具体方法:留出法,交叉验证法。

根据经验,数据集的划分在小的数据集上采用70/30或者60/20/20法则。但是数据集很大比如有100万的时候,98/1/1会更加合理。一般来讲要让验证和测试能反映真实的使用场景。

联系方式
企业微信