更新时间:2024-12-02 GMT+08:00
分享

视频类加工算子能力清单

数据加工算子为用户提供了多种数据操作能力,包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息,并进行深度加工,以生成高质量的训练数据。

平台支持视频类数据集的加工操作,分为数据提取、数据过滤、数据打标三类,视频类加工算子能力清单见表1

表1 视频类加工算子能力清单

算子分类

算子名称

算子描述

数据提取

镜头拆分

根据视频中的镜头场景变化将长视频拆分为短视频片段,如果某个镜头片段的长度超过设定的时间阈值,该镜头片段将按时长进行进一步拆分。

数据过滤

视频裁剪

裁剪视频中字幕/Logo/水印/黑框等无用信息,生成新视频。

视频元数据过滤

基于视频元数据进行过滤,包括帧率、分辨率和视频时长。注:电影标准帧率为24或30FPS。

宽高比过滤

根据视频的宽高比进行过滤。

数据打标

视频鉴黄评分

对视频的涉黄程度进行评分,分数越高越危险。评分范围(0, 100),评分≥50分的视频可视为涉黄视频。

视频暴恐评分

对视频的暴恐程度进行评分,分数越高越危险。评分范围(0, 100),评分≥50分的视频可视为暴恐视频。

视频涉政评分

对视频的涉政程度进行评分,分数越高越危险。评分范围(0, 100),评分≥90分的视频可视为涉政视频。

运动幅度评分

通过计算每个像素在每一帧中的移动范围进行评分,识别运动幅度过快(如>100光流)或过慢(如≤2光流)的视频,数值越大表示运动过快。

质量基础评分

对视频的基础质量(清晰度、亮度、模糊、画面抖动重影、低光过曝、花屏等)进行评分。分值范围(0, 1),数值越高质量越好,评分>0.05可认为是视频基础质量较高的视频。

美学评分

从内容(吸引人,清晰度)、构图(目标物位置良好)、颜色(有活力,令人愉悦)、光线(光线明显有对比度)、轨迹(连续、稳定)等维度评价视频美感得分。分值范围(0, 1),数值越高美感越好,评分>0.95可视为视频基础质量较高的视频。

水印识别

识别视频中是否包含水印。

字幕识别

识别视频中是否包含字幕。

Logo识别

识别视频中是否包含Logo。

视频黑边识别

识别视频中是否包含黑边。

密集文字识别

识别视频中是否包含密集文字,达到密集文字面积占比的视频则为含密集文字视频,一般裁剪面积占比≥7%为密集文字视频。

相关文档