AI的学习能力是其“进化”的核心,从Supervised(监督)到Unsupervised(无监督),再到Reinforcement Learning(强化学习),学习机制的升级让AI从“被动执行”到“主动优化”。
1. Supervised Learning(监督学习):依赖Labeled Dataset(标注数据集),模型学习“输入→输出”的映射关系。核心任务包括Classification(分类,如识别猫狗)与Regression(回归,如预测房价),Loss Function(损失函数)衡量预测与真实值的差距,Gradient Descent(梯度下降)通过最小化损失实现模型优化。
2. Unsupervised Learning(无监督学习):无标注数据,模型自主挖掘数据的Hidden Structure(隐藏结构)。Clustering(聚类,如用户分群)通过Distance Metric(距离度量,如欧氏距离)将相似数据归为一类;Dimensionality Reduction(降维,如PCA)则压缩数据维度,保留核心信息,解决“维度灾难”问题。
3. Reinforcement Learning(强化学习,RL):智能体通过与Environment(环境)交互学习,核心要素包括Agent(智能体)、State(状态)、Action(行动)、Reward(奖励)。目标是最大化Cumulative Reward(累积奖励),Q-Learning通过Q-Table(Q表)存储状态-行动价值,Policy Gradient(策略梯度)直接优化行动策略,适合Sequential Decision-Making(序列决策,如游戏AI、机器人控制)。
4. Self-Supervised Learning(自监督学习):无人工标注,通过数据自身生成Pseudo-Labels(伪标签)训练模型,例如用句子中缺失的词预测上下文,是大模型预训练的核心,让AI从海量无标注数据中学习通用特征。
学习机制的升级,本质是让AI摆脱对人工标注的依赖,实现“从数据中自主学习规律”,这是AI能适配复杂多变现实场景的关键。