更新日期:2018年10月11日
以下资源全部手工验证,欢迎提供数据补充。- 10k 美国人脸数据库
- 2GB 猫的图片
- 为性别和年龄分类任务而建的未经滤波处理的人脸数据集
- 情感分类图像数据集
- 具备属性标记的50种动物图像
- 加州理工行人检测数据集(需科学上网)
- 自然图像中的字符识别数据集
- 人脸检测数据库
- 采集自Flickr的数十种商标图像
- GDXray 近2w幅X光透视影像
- 大名鼎鼎的斯坦福 ImageNet 数据库
- 室内场景识别图像
- 弗罗里达大学提供经规范评分标记的用于情感刺激和心理认知研究的图像
- 近百万样本的 MNIST 手写数字数据库
- MIT提供室内室外各种场景下的环境光照变化图像
- 斯坦福提供的120个品种超过2w样本犬类图像
- 用于动作检测和行为识别的视频图像库
- 牛津大学37类宠物图像
- 人群中异常行为检测视频数据集
- Visual genome 由斯坦福大学人工智能实验室李飞飞教授等建立的结构化描述图像数据库
- YouTube 视频人脸数据集(用于非受控场景下人脸识别研究)
- 多种类型的分类和回归数据集
- Discogs每月更新的音乐作品信息数据
- 免费的音乐信息数据库
- 每日更新的IMDb数据库
- 分类、回归、时间序列等机器学习任务测试基准数据库
- LFW野外标注人脸数据库(用于非受控条件下的人脸识别研究)
- 分年度真实贷款申请和被拒数据
- 哥伦比亚大学提供百万级歌曲数据(需科学上网)
- 电影评分和推荐数据
- 对《纽约客》杂志标题的评分数据
- 旧金山地区餐厅卫生评分数据
- 加州大学尔湾分校提供用于机器学习任务的多种类别数据集
- 来自Yahoo! 的多种分类和评分数据
- 高质量的YouTube视频目标边界标注数据(需科学上网)
- Youtube 8m:高质量机器标注Youtube视频数据(需科学上网)
- 2012年度eBay在线拍卖数据
- 自动关键词提取数据
- 2004年英文博客语料库
- Google抓取的英文网页语料库
- Flickr个人分类数据
- 多语种Google Books Ngrams数据集 (2.2TB)
- Google MC-AFP - 机器理解数据集
- Gutenberg项目提供的电子书
- 第36届加拿大议会的会议记录
- 微软机器理解数据库
- 欧洲语言间机器翻译用平行语料库
- 多领域公众情绪数据集
- 开源多语种Wordnet
- 英文垃圾短信数据集
- Stanford问答数据集
- 2005~2011英语新闻语料库
- 多语种新闻语料库
- 维基百科语料数据
- 维基百科链接数据(需科学上网)
- WordNet大规模英文语义数据库
- 玻森中文语料数据