机器学习方法大全

bajiu

青年大学习

2025-08-12 19:02:00

机器学习方法大全

学习类型
常用算法
数学公式 / 优化方法
使用场景

1. 监督学习（Supervised Learning）

目标：已知输入 $x$ 与标签 $y$，学习映射 $f: x \to y$。

1.1 回归（Regression）

方法	类型	公式 / 优化目标	使用场景
线性回归	线性	$\min_w \|y - Xw\|^2$	数值预测
岭回归	线性	$\min_w \|y - Xw\|^2 + \lambda \|w\|^2$	多重共线性
Lasso 回归	线性	$\min_w \|y - Xw\|^2 + \lambda \|w\|_1$	特征选择
弹性网络	线性	L1+L2 正则	特征多且相关
多项式回归	非线性	特征映射+线性回归	非线性关系
SVR	核方法	$\min \frac12\|w\|^2$ s.t. $\|y_i - w^T\phi(x_i)\|<\epsilon$	非线性回归
GBDT 回归	集成	$F_m=F_{m-1}+\nu h_m$	高精度回归
随机森林回归	集成	多棵树均值输出	鲁棒性好
神经网络回归	深度学习	MSE 损失	大规模非线性预测

1.2 分类（Classification）

方法	类型	公式 / 损失函数	使用场景
逻辑回归	线性	$P(y=1	x) = \sigma(w^Tx)$
Softmax 回归	线性	$P(y=k) = \frac{e^{w_k^T x}}{\sum_j e^{w_j^T x}}$	多分类
LDA	线性	$w=S_W^{-1}(\mu_1-\mu_2)$	高斯分布假设
朴素贝叶斯	概率	$P(y	x)\propto P(y)\prod_j P(x_j
KNN	距离	最近 K 邻居投票	小数据
决策树	树模型	基尼/信息增益	可解释性
随机森林	集成	多树投票	泛化好
GBDT / XGBoost	集成	Boosting 提升	高精度
SVM	核方法	最大间隔优化	高维小样本
MLP	深度学习	交叉熵损失	泛化强
CNN	深度学习	卷积+池化	图像分类
RNN/LSTM/GRU	深度学习	序列建模	NLP、时间序列
Transformer 分类器	深度学习	自注意力	NLP/多模态
GCN/GraphSAGE/GAT	GNN	聚合邻居特征	图数据分类

1.3 排序（Ranking）

方法	类型	核心思想	场景
Pointwise	回归方法排序分数	搜索、推荐
Pairwise (RankNet)	样本对顺序优化	搜索排序
Listwise (LambdaMART)	全列表优化	搜索/广告排序

1.4 多标签分类（Multi-label）

方法	类型	场景
Binary Relevance	每标签独立二分类	多主题标签
Classifier Chains	标签依赖建模	标签相关性强
神经网络多输出	多任务学习	多标签输出

2. 无监督学习（Unsupervised Learning）

目标：无标签，发现数据结构。

2.1 聚类（Clustering）

方法	核心公式	场景
K-Means	$\min \sum_i \|x_i - \mu_{c_i}\|^2$	快速聚类
K-Medoids	中心点为真实样本	噪声鲁棒
GMM	$p(x)=\sum_k \pi_k \mathcal{N}(x	\mu_k,\Sigma_k)$
DBSCAN	密度阈值聚类	非球形簇
谱聚类	拉普拉斯矩阵特征分解	非凸簇

2.2 降维（Dimensionality Reduction）

方法	核心公式	场景
PCA	最大化投影方差	可视化、压缩
t-SNE	KL 散度最小化	高维可视化
UMAP	保持局部邻域结构	可视化
LDA（主题模型）	文档主题分布	文本分析

2.3 异常检测

方法	核心思想	场景
One-Class SVM	学习正类边界	欺诈检测
孤立森林	随机切分隔离异常	工业异常
自编码器	高重构误差 → 异常	图像/时序

3. 半监督学习（Semi-supervised）

方法	核心思想	场景
自训练（Self-training）	用模型预测伪标签再训练	标签稀缺
一致性正则化（MixMatch/FixMatch）	增强后预测一致性	图像/NLP

4. 自监督学习（Self-supervised）

方法	核心思想	场景
对比学习（SimCLR/MoCo）	最大化正样本相似	表征学习
掩码建模（BERT/MAE）	预测被遮蔽部分	NLP/视觉
生成式预训练（GPT）	自回归建模序列	NLP、多模态

5. 强化学习（Reinforcement Learning, RL）

方法	核心公式	场景
Q-Learning	$Q(s,a) \leftarrow Q + \alpha(r+\gamma\max_a Q’-Q)$	离散动作
DQN	Q-Learning + 深度网络	Atari 游戏
策略梯度（REINFORCE）	$\nabla_\theta J = \mathbb{E}[\nabla_\theta \log \pi_\theta(a	s)R]$
Actor-Critic	策略+价值函数结合	稳定收敛
PPO/A3C	改进 Actor-Critic	大规模训练

6. 在线学习（Online Learning）

方法	核心思想	场景
Online Gradient Descent	流式数据增量更新	实时预测
FTRL	稀疏特征在线优化	广告 CTR 预估

7. 多任务学习（Multi-task Learning）

方法	核心思想	场景
硬共享参数	前几层共享	相关任务
软共享参数	参数正则约束	异质任务
MMOE	多专家路由任务输出	推荐系统

8. 元学习（Meta Learning）

方法	核心思想	场景
MAML	学习初始参数快速适应	Few-shot
ProtoNet	类原型度量	小样本分类
Matching Networks	支持集匹配	Few-shot NLP

9. 生成模型（Generative Models）

方法	核心思想	场景
HMM	隐状态马尔可夫链	序列建模
贝叶斯网络	条件概率图	因果推断
PixelCNN/WaveNet	自回归生成	图像/音频
VAE	潜变量 + 重构损失	生成+推断
GAN	对抗训练生成器	图像生成
扩散模型（DDPM/Stable Diffusion）	逐步去噪生成	文生图/视频

10. 其它任务类型

推荐系统：协同过滤、矩阵分解、DeepFM、DIN
图学习：节点分类、链路预测、图生成
多模态学习：CLIP、BLIP、VideoBERT

模型筛选决策流程

PyCharm 配置 windows ssh 并加载