1. 模型类别
常用的计算机视觉场景1
| 问题基础分类 | 场景 | 说明 |
| ------------ | ---------- | --------------------------------------------------------------------------------------------------------------------------------------------------- |
| 分类 | 分类 | 图像分类是一种有监督的机器学习技术,用来学习和预测给定图像的类别。 |
| 未知 | 相似性判定 | 基于图像相似度是计算给定一对图像的相似度的一种方法。给定一个图像,它允许您识别给定数据集中最相似的图像。 |
| 回归 | 边框检测 | 目标边框检测是一种技术,允许您检测图像中对象的边界框。 |
| 回归 | 关键点检测 | Keypoint detection可用于检测对象上的特定点。提出了一种预训练的人体关节检测模型,用于人体姿态估计。 |
| 未知 | 图像分割 | 基础图像分割为图像中的每个像素指定一个类别。 |
| 位置 | 动作识别 | 基础动作识别,用于在视频/网络摄像头画面中识别执行的动作(例如“跑步”、“开瓶”)以及各自的开始/结束时间。我们还实现了动作识别的i3d实现,可以在下找到。 |
| 时序,概率图 | 追踪 | 基跟踪允许在一段时间内检测和跟踪视频序列中的多个对象。 |
| 未知 | 人群统计 | 用于计算低人群密度(例如少于10人)和高人群密度(例如数千人)情景下的人数。 |
2. 模型指标
2.1. 又好(准确性)
2.1.1. IOU
2.1.2. 精度
2.1.3. 召回
2.1.4. PR: 精度-召回率曲线
Precision-RecallPrecision−Recall 曲线
这条曲线的两个变量程负相关,精度越高,召回率越低;召回率越高,精度越低。
如果将所有对象都预测为正类,没有被错误预测成负类的正类(FN为0)那么召回率将为100%;如果将所有对象的预测都为负,没有被错误预测成正的样本,那么精度就将为100%,这两个指标间存在着此消彼长的关系,理想的曲线是向右上方凸出的、包围面积大的曲线。
2.1.5. AP 平均精度
AP均匀精度Average Precision: PR曲线下所围成的面积,面积越大越好;这里的average指的是针对不同recall的平均精度。
2.1.6. mAP 均值平均精度
均值平均精度(Mean Average Precision, mAP)
2.2. 又快(实时性)
2.2.1. 每秒处理帧数
每秒处理帧数(Frame per seconds,fps)