This repository has been archived by the owner on Sep 5, 2020. It is now read-only.

Day11学习小结

学习内容

计算机视觉简介

人的视觉处理系统：眼睛

计算机视觉应用

从图像或者视频中抽取信息

机器视觉

模拟人的视觉行为

计算机视觉任务

分类、定位、检测、场景解析与标记

Opencv介绍

简介

开源

BSD协议，跨平台

应用：多点触摸、摄像头互动、体感交互、人脸识别

使用实例

深度学习框架：Tensorflow-OD（对象检测）

计算机视觉识别指标

精确率预测为正的样本有多少是真正的正样本

召回率样本中的正的有多少被预测准确了

准确率预测对的/总预测

平均精确率均值 mAP：识别准确率的指标之一

目标检测方法介绍 R-CNN

R-CNN简介

定位目标物和图像分割

标注数据比较稀疏时，性能较好

用ImageNet上训练好的模型

实现过程

1. 输入图像，提取提炼区域

2. 用选择性搜索算法搜索可能的图像区域

R-CNN缺点

训练时间和空间开销大

测试时间开销大

Faster R-CNN

每个网络可以独立或者联合训练

可以简单地看作RPN+fast R-CNN

包含两个模块：RPN、fast R-CNN 池化层

学习收获

对Computer Vision有了更深的了解。