学习笔记TF067:TensorFlow Serving、Flod、计算加速，机器学习评测体系，公开数据集 - Python

TOP

学习笔记TF067:TensorFlow Serving、Flod、计算加速，机器学习评测体系，公开数据集(二)

2017-11-15 09:15:17 【大中小】浏览:317次

Tags：学习笔记 TF067:TensorFlow Serving Flod 计算加速机器评测体系公开数据

方法。
BLEU(bilingual eva luation understudy)方法，2002年，IBM沃森研究中心提出。机器翻译语句与人类专业翻译语句越接近越好。下人工评价高度相关。正确句子作参考译文(reference)、正确句子(golden sentence)，测试句子作候选译文(candidate)。适用测试语料具有多个参考译文。比较参考译文与候选译文相同片段数量，参考译文连续出现N元组(N个单词或字)与候选译文N元组比较，n单位片段(n-gram)比较。计算完全匹配N元组个数与参考译文N元组总个数比例。与位置无关。匹配片段数越多，候选译文质量越好。
METEOR，不仅要求候选译文在整个句子上，在句子分段级别上，都要与参考译文更接近。https://en.wikipedia.org/wiki/METEOR#Algorithm 。在待评价字符串与参考文符串间创建平面图。待评价翻译每个一元组必须映射到参考翻译1个或0个一元组。选择映射交叉数据较少的。

常用通用评价指标。
准确率、召回率、F值、ROC、AUC、AP、mAP。
ROC(Receiver Operating Characteristic,受试者工作特征曲线)、AUC(Area Under roc Curve,曲线下面积)，评价分类器指标。ROC曲线横坐标FPR(False positive rate)，纵坐标TPR(True positive rate)。ROC曲线越接近左上角，分类器性能越好。AUC，ROC曲线下方面积大小。ROC曲线处于y=x直线上方，AUC值介于0.5~1.0。AUC值越大表示性能越好。专门AUC计算工具 http://mark.goadrich.com/programs/AUC/ 。
AP(average precision,平均准确性)、mAP(mean average precision,平均准确性平均)。计算机视觉，分类问题，AP模型分类能力重要指标。只用P(precision rate, 准确率)和R(recall rate,召回率)评价，组成PR曲线趋势召回率越高准确率越低。AP曲线下面积，等于对召回率做积分。mAP对所有类别取平均，每个类作一次二分类任务。图像分类论文基本用mAP标准。

公开数据集。

图片数据集。
ImageNet http://www.image-net.org/ 。世界最大图像识别数据集，14197122张图像，斯坦福大学视觉实验室终身教授李飞飞创立。每年ImageNet大赛是国际计算机视觉顶级赛事。
COCO http://mscoco.org/ 。微软创立，分割、加字幕标注数据集。目标分割，通过上下文进行识别，每个图像包含多个目标对象，超过300000图像，超过2000000实例，80种对象，每个图像包含5个字幕，包含100000个人关键点。
CIFAR(Canada Institude For Advanced Research) https://www.cifar.ca/ 。加拿大先进技术研究院收集。8000万小图片数据集。包含CIFAR-10?CIFAR-100两个数据集。CIFAR-10，60000张32x32 RGB彩色图片，共10个类别，50000张训练，10000张测试(交叉验证)。CIFAR-100，60000张图像，100个类别，每个类别600张图像，500张训练，100张测试。20个大类，每个图像包含小类别、大类别两个标记。

人脸数据集。
AFLW(Annotated Facial Landmarks in the Wild) http://lrs.icg.tugraz.at/research/aflw/ ，从Flickr收集带标注面部图像大规模wyskwgk，各种姿态、表情、光照、种族、性别、年龄因素影响图片，25000万手工标注人脸图片，每个人脸标注21个特征点，大多数彩色，59%女性，41%男性。非常适合人脸识别、人脸检测、人脸对齐。
LFW(Labeled Faces in the Wild Home) http://vis-www.cs.umass.edu/lfw/ 。美国马萨诸塞大学阿姆斯特分校计算机视觉实验室整理。13233张图片，5749人，4096人只有一张图片，1680个多于一张。用于研究非受限情形人脸识别问题。人脸外形不稳定，面部表情、观察角度、光照条件、室内室外、遮盖物(口罩、眼镜、帽子)、年龄影响。为学术界评价识别性能标准(benchmark)。
GENKI http://mplab.ucsd.edu ，加利福尼亚大学收集。包含GENKI-R2009a、GENKI-4K、GENKI-SZSL。GENKI-R2009a，11159图片。GENKI-4K，4000图片，笑与不笑两类，每个图片人脸姿势、头转动标注角度，专用笑脸识别。GENKI-SZSL，3500图像，广泛背景、光照条件、地理位置、个人身份、种族。
VGG Face http://www.robots.ox.ac.uk/~vgg/data/vgg_face/ 。2622个不同人，每个人1000张图片，训练人脸识别大数据集。
CelebA(Large-scale CelebFaces Atributes,大规模名人人脸标注数据集) http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html 。10177个名人，202599张名人图像，每张图像40个属性标注。

视频数据集。
YouTube-8M https://research.google.com/youtube8m/ 。800万个YouTube视频URL，50万小时长度视频，带有视频标注。

问答数据集。
MS MARCO(Microsoft Machine Reading Comprehension) http://www.msmarco.org 。微软发布，10万个问题和答案数据集。创建像人类一样阅读、回答问题系统。基于匿名真实数据构建。
康奈尔大学电影对白数据集 https://www.cs.cornell.edu/~cristian/Cornell_Movie-Dialogs_Corpus.html 。600部好莱坞电影对白。

自动驾驶数据集。
法国国家信息与自动化研究所行人数据集(INRIA Person Dataset) http://pascal.inrialpes.fr/data/human/ 。作为图像和视频中直立人检测研究工作一部分收集。图片两种格式，一具有对应注释文件原始图像，二具有原始图像经过正规化处理64x128像素正像。图片分只有车、只有人、有车有人、无车无人4个类别。
KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute) http://www.cvlibs.net/datasets/kitti/ 。车辆数据集，7481个训练图片、7518个测试图片。标注车辆类型、是否截断、遮挡情况、角度值、二维和三维框、位置、旋转角度。

年龄、性别数据集。
Adience 数据集 http://www.openu.ac.il/home/hassner/Adience/data.html 。来源Flickr相册。用户用智能手机设备拍摄，2284类别，2658

首页上一页 1 2 3 下一页尾页 2/3/3
【大中小】【打印】【繁体】【投稿】【收藏】【推荐】【举报】【评论】【关闭】【返回顶部】

上一篇：71、django之Ajax续	下一篇：重学Python - Day 07 - python基..