1、有监督的学习
有监督学习(有导师)算法要求同时给出输入和正确的输出,即事先已经能够确定的一个模型。
2、无监督学习
无监督学习(无导师)算法只需给出一组输入,网络能够逐渐演变到对输入的某种模式做出特定的反应,也即事先不给定标准样本,直接将网络 “置于”环境之中,学习(训练)阶段与应用(工作)阶段成为一体
3、强化学习
强化学习(reinforcement learning)介于上述两种情况之间,外部环境只给出评价(奖励或惩罚)而不是给出正确答案,学习系统通过强化那些受奖励的动作来改善自身的性能。强化学习算法并不是训练于一个固定的数据集上,它会和环境进行交互,所以学习系统和它的训练过程会有反馈回路