模型

计算机视觉领域

神经网络
notion image
极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解
名称
机制
优点
缺点
适用场景
MLP(多层神经网络/多层感知机/人工神经网络)
各层神经元全连接
非线性映射、并行性高、全局优化
泛化能力差、处理多维数据差
可以处理回归任务,应用于模式识别、优化计算,不建立做复杂问题
BP
梯度下降局部优化
非线性映射、自适应能力
易出现局部最优、预测精度低、收敛慢
结合粒子群、退火算法等优化算法应用于模式识别控制、数据建模
CNN(卷积神经网络)
卷积核特征提取,降采样保留信息
稀疏连接、权值共享
计算量大,输入图像尺寸固定
适合用于空间数据,应用与图像语义分割等
RNN(循环神经网络)
隐藏层节点输出取决于当前节点输入和上个节点值
提取时序特征能力强、泛化能力相对好
输入输出序列不同、处理长期依赖精度下降
用于处理时序数据,具有记忆功能,应用于语音识别、自然语言理解
LSTM(RNN的拓展),长短时记忆网络
细胞状态(类似传送带),只有少量的线性交互
在序列建模问题上有一定优势,具有长时记忆功能。
并行处理上存在劣势。与一些最新的网络相对效果一般。
适用于学习时间序列

Diffusion

VAR 自回归超越扩散

SOTA 模型
Diffusion模型
Transform
CNN
CV
其他
概论生成网络(GAN/VAE/Flow/Diffusion)
模型能力评估
模型任务
Sora
SNN
Loading...
目录
文章列表
王小扬博客
产品
Think
Git
软件开发
计算机网络
CI
DB
设计
缓存
Docker
Node
操作系统
Java
大前端
Nestjs
其他
PHP