从图像或者视频中抽取信息
机器视觉
模拟人的视觉行为
分类、定位、检测、场景解析与标记
开源
BSD协议,跨平台
应用:多点触摸、摄像头互动、体感交互、人脸识别
精确率 预测为正的样本有多少是真正的正样本
召回率 样本中的正的有多少被预测准确了
准确率 预测对的/总预测
定位目标物和图像分割
标注数据比较稀疏时,性能较好
用ImageNet上训练好的模型
训练时间和空间开销大
测试时间开销大
每个网络可以独立或者联合训练
可以简单地看作RPN+fast R-CNN
包含两个模块:RPN、fast R-CNN 池化层
对Computer Vision有了更深的了解。