深度学习图像标记原理（深度学习图像目标检测必须掌握的基本概念与知识）

机场的列车 2022-10-19 07:58:22

收藏赞分享

传统目标检测方法手动设计特征，下面我们就来说一说关于深度学习图像标记原理?我们一起去了解并探讨一下这个问题吧!

深度学习图像标记原理

传统目标检测方法

手动设计特征

滑动窗口

使用传统分类器

多步骤实现

准确度和实时性差

深度学习目标检测方法

深度网络学习特征

Proposal或者直接回归

深度网络分类

端到端

准确度高且实时性好

目标检测算法分类

主要分为One stage和Two stage两大类：

One stage：

步骤：特征提取->分类->定位/回归。

成员：YOLOv1、SSD、YOLOv2、RetinaNet、YOLOv3

特点：准确度低，速度快。

Two stage：

步骤：特征提取->生成RP->分类->定位/回归

成员：Fast R-CNN、Faster R-CNN

特点：准确度高，速度慢。

Selective Search

即选择性搜索。

使用具有不同不变性质的各种颜色空间

使用不同的相似性度量

使用不同的初始化区域

Bounding-Box regression

边框回归。生成的proposal与groundtruth的两个框不一致，我们想通过某种方法使得产生的另个一个框介于两者之间，更接近与真值。一般遇到的bbox,即指Bounding-Box。

ROI

region of interest，感兴趣区域。通俗的可以理解为使用LabelImg标注的区域。

IoU

Intersection-over-Union，交并比。产生的候选框和原标记框的交叠率，即面积的交集和并集的比值。完美情况为1。是一个评价函数。

NMS

Non-maximum suppression, 非极大值抑制算法。本质是搜索局部极大值，抑制非极大值元素，在目标检测中通过选取邻域里分数最高的窗口，同时抑制分数低的窗口去消除多余的框，找到最佳的物体检测位置。现在一般使用Soft-NMS。

Anchors

对于该图像的每一个位置，考虑9个可能的候选窗口：三种面积三种比例。这些候选窗口称为anchors。下图示出51*39个anchor中心，以及9种anchor示例。

RPN

Region Proposal Network ，如同一个黑盒子，输入一个任意尺度的图片，输出一系列的矩形object proposals。区域生成网络，在Faster-RNN中使用。

RPN网络结构

步骤：

将图片输入到VGG或ZF的可共享的卷积层中，得到最后可共享的卷积层的feature map。

小网络继续卷积feature map；；获得原图的锚点（anchor）

将卷积的结果和锚点分别输入到两个小的1*1的网络中reg（回归，求目标框的位置）和cls（分类，确定该框中是不是目标）

训练集标记好了每个框的位置，和reg输出的框的位置比较，用梯度下降来训练网络。

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

猜您喜欢

魔兽世界怀旧服tbc 开启（魔兽世界TBC怀旧服开荒SW）

懒仔仔
dnf手游打团怎么进图（踩蘑菇攻略组DNF手游公会详解）

处对象加
倩女幽魂手游帮会联赛怎么玩（倩女幽魂手游怎么才能够从帮会中退出）

情不尽
手游天涯明月刀帮派管理办法（天涯明月刀手游帮派退出方法）

招人嫌
魔兽世界脱离公会指令（魔兽世界退出公会的命令是什么）

项伪人
魔兽世界tbc怎么退出竞技场战队（魔兽世界tbc怎么操作退出公会）

南城的清晨
晨跑一小时好还是空腹跑好（早上空腹跑步合适吗）

话不会变

秒懂生活

深度学习图像标记原理（深度学习图像目标检测必须掌握的基本概念与知识）

猜您喜欢

魔兽世界怀旧服tbc 开启（魔兽世界TBC怀旧服开荒SW）

dnf手游打团怎么进图（踩蘑菇攻略组DNF手游公会详解）

倩女幽魂手游帮会联赛怎么玩（倩女幽魂手游怎么才能够从帮会中退出）

手游天涯明月刀帮派管理办法（天涯明月刀手游帮派退出方法）

魔兽世界脱离公会指令（魔兽世界退出公会的命令是什么）

魔兽世界tbc怎么退出竞技场战队（魔兽世界tbc怎么操作退出公会）

晨跑一小时好还是空腹跑好（早上空腹跑步合适吗）

热门推荐

排行榜