视频类加工算子能力清单
数据加工算子为用户提供了多种数据操作能力,包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息,并进行深度加工,以生成高质量的训练数据。
平台支持视频类数据集的加工操作,分为数据提取、数据过滤、数据打标三类,视频类加工算子能力清单见表1。
算子分类 |
算子名称 |
算子描述 |
---|---|---|
数据提取 |
镜头拆分 |
根据视频中的镜头场景变化将长视频拆分为短视频片段,如果某个镜头片段的长度超过设定的时间阈值,该镜头片段将按时长进行进一步拆分。 |
数据过滤 |
视频裁剪 |
裁剪视频中字幕/Logo/水印/黑框等无用信息,生成新视频。 |
视频元数据过滤 |
基于视频元数据进行过滤,包括帧率、分辨率和视频时长。注:电影标准帧率为24或30FPS。 |
|
宽高比过滤 |
根据视频的宽高比进行过滤。 |
|
数据打标 |
视频鉴黄评分 |
对视频的涉黄程度进行评分,分数越高越危险。评分范围(0, 100),评分≥50分的视频可视为涉黄视频。 |
视频暴恐评分 |
对视频的暴恐程度进行评分,分数越高越危险。评分范围(0, 100),评分≥50分的视频可视为暴恐视频。 |
|
视频涉政评分 |
对视频的涉政程度进行评分,分数越高越危险。评分范围(0, 100),评分≥90分的视频可视为涉政视频。 |
|
运动幅度评分 |
通过计算每个像素在每一帧中的移动范围进行评分,识别运动幅度过快(如>100光流)或过慢(如≤2光流)的视频,数值越大表示运动过快。 |
|
质量基础评分 |
对视频的基础质量(清晰度、亮度、模糊、画面抖动重影、低光过曝、花屏等)进行评分。分值范围(0, 1),数值越高质量越好,评分>0.05可认为是视频基础质量较高的视频。 |
|
美学评分 |
从内容(吸引人,清晰度)、构图(目标物位置良好)、颜色(有活力,令人愉悦)、光线(光线明显有对比度)、轨迹(连续、稳定)等维度评价视频美感得分。分值范围(0, 1),数值越高美感越好,评分>0.95可视为视频基础质量较高的视频。 |
|
水印识别 |
识别视频中是否包含水印。 |
|
字幕识别 |
识别视频中是否包含字幕。 |
|
Logo识别 |
识别视频中是否包含Logo。 |
|
视频黑边识别 |
识别视频中是否包含黑边。 |
|
密集文字识别 |
识别视频中是否包含密集文字,达到密集文字面积占比的视频则为含密集文字视频,一般裁剪面积占比≥7%为密集文字视频。 |