返回字段
输出参数 |
描述 |
name |
结果模块名:其中”tag”为标签结果,所有标签按照统一格式输出;”asr”为语音结果;“ocr”为文本识别结果。 |
result |
产品级结果列表,目前只包含内容分析产品 |
content |
产品级结果结构体 |
data |
具体算法结果列表 |
下面分name的值来说明字段:
name = ‘tag’ //融合标签结果
输出参数 |
描述 |
labelLevel1 |
一级标签分类,如视频分类、节目、人脸、标识、人物角色、地域、场景、动作事件、组织机构、关键词等 |
labelLevel2 |
二级标签分类,其中人脸的二级标签类分组为:政治人物、敏感人物、名人、未知人脸、自定义,多种类型以’,’隔开 |
label |
细粒度的标签 |
appearanceProbability |
标签的出场率,表示标签在视频中时间占比 |
isWhite |
表示该标签是否命中了用户定义的白名单 |
detailInfo |
该结构存储了标签出现的时间区间、score、区域、来源等详细信息 |
score |
是标签的置信度信息,部分标签置信度会不存在,不存在置信度时统一设置为-1. 比如挖掘出来的未知人脸的score分数为-1 |
bboxes |
标签区域位置信息,(将废弃,不建议使用),区域格式为[x1,y1,x2,y2],左上顶点,右下顶点,后续逐渐废弃,信息迁移到trackData中 |
trackData |
在该时间段内等间隔记录在视频时刻上的算法结果,包含bbox、score、attributes、landmark、timestamp几个字段记录算法结果 |
score |
trackData下的score,代表当前时刻的算法置信度,其中人脸算法为人脸检测的score |
bbox |
trackData下的bbox,标签区域位置信息,格式为[x1,y1,x2,y2],左上顶点,右下顶点。 |
landmark |
trackData下的landmark,标签区域关键像素信息 |
attributes |
trackData下的attributes,有property、value、score字段,分别为该时刻的属性类、属性值、属性分数,表示标签在该帧的属性信息,如人脸的表情信息等 |
timestamp |
trackData下的timestamp,标记当前时刻 |
source |
标签来源:’vision’为视觉来源、’audio’为音频来源、’text’为文本来源 |
subSource |
为算法模型层次的来源,用户可不用关心 |
metaData |
记载了标签的非统一信息,不同类型的标签会有所差别,可通过判断某个字段是否为空来确定该标签是否具备该字段信息,具体子字段如下 |
sampleUrl |
标签的代表图,如人脸识别中预测人物和该图是一致的,也是我们定义标签的标准 |
group |
标签的分组,如人脸识别中的人物库信息 |
name = ‘asr’//语音识别结果
输出参数 |
描述 |
startTime |
时间段开始时间 |
endTime |
时间段结束时间 |
text |
asr文本 |
name = ‘ocr’//OCR文本识别结果
输出参数 |
描述 |
startTime |
时间段开始时间 |
endTime |
时间段结束时间 |
detailInfo |
具体的OCR识别结果,是一个列表,表示不同区域的OCR结果 |
score |
OCR识别的置信度 |
text |
OCR的文本 |
bbox |
标签区域位置信息,依次为区域[x1,y1,x2,y2],左上顶点,右下顶点。 |
返回结果示例:
[
{
"name": "tag",//结果分类,分为tag、ocr和asr。分别对应标签结果、OCR结果和语音结果
"result": [//结果值
{
"content": {
"data": [
{
"labelLevel1": "人脸",//标签一级分类
"labelLevel2": "政治人物",//标签二级分类
"label": "习近平",//标签值
"appearanceProbability":0.3547,//出场率
"isWhite":true, //是否命中白名单
"detailInfo": [//标签详细信息
{
"score": 0.85797792673110962,//标签置信度,部分标签置信度会不存在,不存在置信度时统一设置为-1. 比如挖掘出来的未知人脸的score分数为-1
"bboxes": {//标签位置信息,将废弃不建议使用,可使用trackData中的bbox属性
"35.333000": [//时间点
205.0,
95.0,
318.0,
247.0
],
"35.466000": [//时间点
201.0,
95.0,
314.0,
247.0
]
},
"trackData": [
{
"score": 0.91240006685256958,
"bbox": [205.0, 95.0, 318.0, 247.0],
"attributes": [
{
"property":"表情",
"value":"笑",
"score": 0.8765
}
],
"landmark": [205.0, 95.0, 318.0, 247.0, 205.0, 95.0, 318.0, 247.0, 435.0, 435.0],
"timestamp": 35.333000//时间点
},
{
"score": 0.91240006685256958,
"bbox": [201.0, 95.0, 314.0, 247.0],
"attributes": [
{
"property":"表情",
"value":"笑",
"score": 0.8765
}
],
"landmark": [205.0, 95.0, 318.0, 247.0, 205.0, 95.0, 318.0, 247.0, 435.0, 435.0],
"timestamp": 35.466000
}
],
"startTime": 35.0,//片段开始时间
"endTime": 35.465999603271484,//片段结束时间
"source": "vision",//标签来源,分为vision:视觉, text:文字,audio:语音
"subSource": "facemot",//标签子来源
"metaData": {//标签meta信息,不同的标签meta内容不同。
"sampleUrl": "",//人像的图片地址
"group": "politicians"//人像的图库名称
}
},
{
"score": 0.85797792673110962,
"bboxes": {
"35.333000": [
205.0,
95.0,
318.0,
247.0
],
"35.466000": [
201.0,
95.0,
314.0,
247.0
]
},
"trackData": [
{
"score": 0.91240006685256958,
"bbox": [205.0, 95.0, 318.0, 247.0],
"attributes": [
{
"property":"表情",
"value":"笑",
"score": 0.8765
}
],
"landmark": [205.0, 95.0, 318.0, 247.0, 205.0, 95.0, 318.0, 247.0, 435.0, 435.0],
"timestamp": 35.333000
},
{
"score": 0.91240006685256958,
"bbox": [201.0, 95.0, 314.0, 247.0],
"attributes": [
{
"property":"表情",
"value":"笑",
"score": 0.8765
}
],
"landmark": [205.0, 95.0, 318.0, 247.0, 205.0, 95.0, 318.0, 247.0, 435.0, 435.0],
"timestamp": 35.466000
}
],
"startTime": 35.0,
"endTime": 35.465999603271484,
"source": "text",
"subSource": "ocr_nlp",
"metaData": {
"sampleUrl": "",
"group": ""
}
}
]
},
{
"labelLevel1": "视频分类",
"labelLevel2": "资讯",
"label": "时政资讯",
"detailInfo": [
{
"score": 0.85797792673110962,
"bboxes": {},
"trackData": [],
"startTime": 0,
"endTime": 35.465999603271484,
"source": "vision",
"subSource": "cate",
"metaData": {
"sampleUrl": "",
"group": ""
}
},
{
"score": 0.85797792673110962,
"bboxes": {},
"trackData": [],
"startTime": 0,
"endTime": 35.465999603271484,
"source": "text",
"subSource": "ocr_nlp",
"metaData": {
"sampleUrl": "",
"group": ""
}
}
]
}
]
}
}
]
},
{
"name": "ocr",//OCR结果
"result": [
{
"content": {
"data": [
{
"detailInfo": [
{
"score": 99,//OCR置信度
"bbox": [//OCR文本位置信息
434,
31,
464,
43
],
"text": "今天"//文本信息
}
],
"startTime": 0.0,//文本出现的帧的开始时间
"endTime": 0.0 //文本出现的帧的结束时间
}
]
}
}
]
},
{
"name": "asr",//语音结果
"result": [
{
"content": {
"data": [
{
"text": "这个时候",//语音文本
"startTime": 108.7699966430664, //语音文本开始时间
"endTime": 110.79000091552734 //语音文本结束时间
},
{
"text": "你不要着急。",//语音文本
"startTime": 108.7699966430664,//语音文本开始时间
"endTime": 110.79000091552734 //语音文本结束时间
}
]
}
}
]
}
]
标签分类信息说明和举例:
标签一级分类 |
标签二级分类 |
标签值举例和说明 |
视频分类 |
生活 |
以生活举例,下面细分为:健康、家居、女性、休闲、美食、聚会、宠物、居家、婚恋、潮品、记录、生活达人 |
视频分类 |
动漫 |
|
视频分类 |
汽车 |
|
视频分类 |
生活 |
|
视频分类 |
科技 |
|
视频分类 |
自拍 |
|
视频分类 |
少儿 |
|
视频分类 |
亲子 |
仅短视频场景有该分类 |
视频分类 |
文化 |
|
视频分类 |
纪录片或纪实 |
通用场景为纪录片,短视频场景为纪实 |
视频分类 |
艺术 |
仅短视频场景有该分类 |
视频分类 |
美食 |
仅短视频场景有该分类 |
视频分类 |
情感 |
仅短视频场景有该分类 |
视频分类 |
综艺 |
|
视频分类 |
娱乐 |
|
视频分类 |
教育 |
|
视频分类 |
时尚 |
|
视频分类 |
亲子 |
|
视频分类 |
搞笑 |
|
视频分类 |
音乐 |
|
视频分类 |
电影或影视 |
通用场景为电影,短视频场景为影视 |
视频分类 |
电视剧 |
|
视频分类 |
体育 |
|
视频分类 |
游戏 |
|
视频分类 |
军事 |
短视频场景无该分类 |
视频分类 |
历史 |
短视频场景无该分类 |
视频分类 |
法制 |
短视频场景无该分类 |
节目 |
|
比如:爸爸去哪儿、欢乐喜剧人等 |
人脸 |
政治人物 |
|
人脸 |
名人 |
比如:马云、成龙 |
人脸 |
敏感人物 |
|
人脸 |
未知人脸 |
挖掘出的未知人脸 |
人脸 |
自定义 |
用户自定义的人脸 |
人物角色 |
|
比如:医生、护士、教师等 |
物体 |
|
比如:钢琴、水杯、桌子、西红柿炒鸡蛋、小汽车、化妆品等 |
标识 |
台标 |
比如CCTV1、CCTV2、优酷、东方卫视等 |
标识 |
品牌 |
比如:耐克、李宁 |
动作事件 |
|
正向标签举例:跳舞、接吻、拥抱、会晤、唱歌、打电话、骑马、打斗等负向标签举例:性感、低俗、色情、女性全裸、女性胸部(露点)、女性阴部(露点)、男性阴部(露点)、肛门(露点)、性用具及性玩具、多人性行为 、单人性行为、男性大面积裸露(不露点)、女性性感、血腥等 |
地域 |
|
比如:北京天安门、自由女神像、乐山大佛、中国、美国等 |
场景 |
|
比如:卧室、地铁站、梯田、海滩、沙漠等 |
表情 |
|
比如:生气、厌恶、恐惧、快乐、悲伤、惊讶、平静等 |
组织机构 |
|
比如:中国生动物保护协会、中央广播电视总台等 |
关键词 |
|
|
|