视频类加工算子介绍
数据加工算子为用户提供了多种数据操作能力,包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息,并进行深度加工,以生成高质量的训练数据。
平台支持视频类数据集的加工操作,分为数据提取、数据过滤、数据打标三类,视频类加工算子能力清单见表1。
算子分类 |
算子名称 |
算子描述 |
---|---|---|
数据提取 |
根据视频中的镜头场景变化将长视频拆分为短视频片段,如果某个镜头片段的长度超过设定的时间阈值,该镜头片段将按时长进行进一步拆分。 |
|
数据转换 |
视频裁剪是裁剪掉视频中不必要的元素,比如字幕、Logo、水印、边框和密集文字,同时过滤掉那些裁剪后面积比例超出预设阈值的视频文件;使用前需要先执行字幕、logo、水印、边框、密集文字识别算子。 |
|
数据过滤 |
根据视频元数据(帧率、分辨率和视频时长)进行过滤,仅保留符合选定条件的视频。注:电影标准帧率为24或30FPS。 |
|
根据视频的宽高比进行过滤。宽高比是指视频图像的宽度和高度之间的比率。 |
||
数据打标 |
给色情视频内容打标签。 |
|
给暴恐视频内容打标签。 |
||
给涉政视频内容打标签。 |
||
通过计算每个像素在每一帧中的移动范围进行评分,识别运动幅度过快(如>100光流)或过慢(如≤2光流)的视频,数值越大表示运动越快。 |
||
对视频的基础质量(清晰度、亮度、模糊、画面抖动重影、低光过曝、花屏等)进行评分。分值范围(0, 1),数值越高质量越好,评分>0.05可认为是视频美感较高的视频。 |
||
从内容(吸引人,清晰度)、构图(目标物位置良好)、颜色(有活力,令人愉悦)、光线(光线明显有对比度)、轨迹(连续、稳定)等维度评价视频美感得分。分值范围(0, 1),数值越高美感越好,评分>0.95可视为视频基础质量较高的视频。 |
||
识别视频中是否包含水印。 |
||
识别视频中是否包含字幕。 |
||
识别视频中是否包含Logo。 |
||
识别视频中是否包含黑边。 |
||
识别视频中是否包含密集文字,超出密集文字面积占比阈值的视频可视为密集文字视频,一般默认密集文字面积占比阈值为1%。 |
||
通过算子返回视频的标签分类,L1存在7类,L4存在700类。 |
||
通过对视频进行抽帧,通过模型推理生成简短的视频摘要描述。 |
||
通过对视频进行抽帧,通过模型推理生成详细的视频摘要描述。 |
||
通过对视频抽8帧,模型分别对图片进行标记关键点,输出任务bbox框和关键点坐标,通过对坐标的计算判断视频中是否存在人物。 |
||
模型通过对视频进行抽帧进行光流计算与推理,输出视频的镜头类型。 |
色情视频检测算子
- 适用的文件格式:“视频>mp4 / avi”。
- 算子说明:给色情视频内容打标签。
- 参数配置样例:
- 检测样例:
检测结果以video_anti_porn对象存储在标注文件中:
suggestion:对文件检测是否通过的结果,pass代表审核通过无相应的问题;review代表需要人工复核,您可以按照您的审核策略选择放通还是拦截;block代表待审文件存在问题。
confidence:模型结果检测的置信度(注意这里的置信度代表模型给出建议的置信度)。如果suggestion为pass,则为零;如果suggestion为review/block,则为0-1。
label:模型检测出的具体色情标签,如果未检测出则为空。
暴恐视频检测算子
- 适用的文件格式:“视频>mp4 / avi”。
- 算子说明:给暴恐视频内容打标签。
- 参数配置样例:
- 检测样例:检测结果以video_anti_terrorism对象存储在标注文件中:
suggestion:对文件检测是否通过的结果,pass代表审核通过无相应的问题;review代表需要人工复核,您可以按照您的审核策略选择放通还是拦截;block代表待审文件存在问题。
confidence:模型结果检测的置信度(注意这里的置信度代表模型给出建议的置信度)。如果suggestion为pass,则为零;如果suggestion为review/block,则为0-1。
label:模型检测出的具体暴恐标签,如果未检测出则为空。
视频涉政评分算子
- 检测样例:
检测结果以video_anti_politics对象存储在标注文件中:
suggestion:对文件检测是否通过的结果,pass代表审核通过无相应的问题;review代表需要人工复核,您可以按照您的审核策略选择放通还是拦截;block代表待审文件存在问题。
result:模型对文件检测的具体返回内容,包含suggestion、confidence、label三个子标签;可以一条或多条。
confidence:模型结果检测的置信度(注意这里的置信度代表模型给出建议的置信度)。如果suggestion为pass,则为零;如果suggestion为review/block,则为0-1。
label:模型检测出的具体涉政标签,如果未检测出则为空。