模型
计算机视觉领域
神经网络
极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解
名称 | 机制 | 优点 | 缺点 | 适用场景 |
MLP(多层神经网络/多层感知机/人工神经网络) | 各层神经元全连接 | 非线性映射、并行性高、全局优化 | 泛化能力差、处理多维数据差 | 可以处理回归任务,应用于模式识别、优化计算,不建立做复杂问题 |
BP | 梯度下降局部优化 | 非线性映射、自适应能力 | 易出现局部最优、预测精度低、收敛慢 | 结合粒子群、退火算法等优化算法应用于模式识别控制、数据建模 |
CNN(卷积神经网络) | 卷积核特征提取,降采样保留信息 | 稀疏连接、权值共享 | 计算量大,输入图像尺寸固定 | 适合用于空间数据,应用与图像语义分割等 |
RNN(循环神经网络) | 隐藏层节点输出取决于当前节点输入和上个节点值 | 提取时序特征能力强、泛化能力相对好 | 输入输出序列不同、处理长期依赖精度下降 | 用于处理时序数据,具有记忆功能,应用于语音识别、自然语言理解 |
LSTM(RNN的拓展),长短时记忆网络 | 细胞状态(类似传送带),只有少量的线性交互 | 在序列建模问题上有一定优势,具有长时记忆功能。 | 并行处理上存在劣势。与一些最新的网络相对效果一般。 | 适用于学习时间序列 |
Diffusion
VAR 自回归超越扩散
SOTA 模型Diffusion模型TransformCNNCV其他概论生成网络(GAN/VAE/Flow/Diffusion)模型能力评估模型任务SoraSNNLoading...