更新时间:2025-12-27 GMT+08:00
分享

图片类加工算子介绍

平台提供了图文类、图片类加工算子,算子能力清单见表1

表1 图片类加工算子能力清单

算子分类

算子名称

算子描述

数据提取

图文提取

提取图文压缩包中的JSON文本和图片,并对图片进行结构化解析(BASE64编码),方便图文加工算子使用。

数据过滤

数据过滤

根据条件对数据进行过滤。

图片元数据过滤

基于图片宽高、文件大小、宽高比阈值进行图片/图文数据清洗。

图文文本长度过滤

过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母,文本长度均计数为1。

图文文本语言过滤

通过语种识别模型得到图文对的文本语种类型,“待保留语种”之外的图文对数据将被过滤。注:语种识别模型有小概率的误判可能性。

图文去重

  • 基于结构化图片去重图文。
  • 判断相同文本对应不同的图片数据是否超过“单文本最大图片数阈值”阈值,如果超过则随机删除多余图片,仅保留阈值以内的图文数量。

图片去重

通过把图片结构化处理后,过滤重复的图片/图文对数据。

数据打标

色情图像检测

给图像算子打标签

危情图像检测

给危情图片内容打标签

暴恐图像检测

过滤暴恐图像

数据标注

标注物视觉prompt物体检测

使用数据工程的交互式视觉AI辅助检测功能,人工给参考图片中的目标物体给出参考框,将该标注数据作为“视觉prompt”,生成参考数据集。使用视觉交互辅助标注算子,利用视觉prompt大模型在待处理图像中自动检测并输出所有同类视觉特征目标的边界框。(前置依赖数据工程 > 数据标注中的交互式视觉AI辅助检测功能生成参考数据集)。注:目前算子不支持多并发,加工数据量过大时,算子执行时长会相对增长。

标注物名称prompt物体检测

使用数据工程的交互式自定义AI辅助检测功能,人工给参考图片中的目标物体给出文本标签,将该文本数据作为“文本prompt”,生成参考数据集。使用文本交互辅助标注算子,利用文本prompt大模型在待处理图像中自动检测并输出所有同类文本标签目标的边界框。(前置依赖数据工程 > 数据标注中的交互式自定义AI辅助检测功能生成参考数据集)。注:目前算子不支持多并发,加工数据量过大时,算子执行时长会相对增长。

数据转换

图文异常字符过滤

将文本数据中携带的异常字符替换为空值,数据条目不变。

  • 不可见字符,例如U+0000-U+001F
  • 表情符六
  • 网页标签符号<p>
  • 特殊符号,比如● █ ◆
  • 乱码和无意义的字符�����

数据过滤

  • 适用的文件格式:

    jpg、jpeg、png、bmp。

    tar:所有图片保存为tar包。tar包含图片支持:jpg、jpeg、png、bmp图片类型。

  • 算子功能描述:同时满足所有过滤条件的视频会被过滤掉。
  • 参数配置样例:

图文提取

  • 适用的文件格式:

    tar+jsonl;所有图片保存为tar包。图片格式支持:jpg、jpeg、png、bmp。图片文本保存为一份jsonl文件,jsonl文件中图片名称必须要与tar包中的图片名称一致。

  • 各参数说明:

    待提取内容类型:提取图文压缩包中的JSON文本和图片;并对图片进行结构化解析。

  • 参数配置样例:

    不需要配置参数。

  • 提取样例:

    加工前:

    加工后:

图片元数据过滤

  • 适用的文件格式:

    jpg、jpeg、png、bmp。

    tar:所有图片保存为tar包。tar包含图片支持:jpg、jpeg、png、bmp图片类型。

  • 各参数说明:

    待过滤内容类型:

    最小宽高:宽或高任意一边低于此设置值,图片会被过滤。

    最小文件大小:文件大小低于该文件大小会被过滤,单位为B。

  • 参数配置样例:

  • 过滤样例:

    原数据集:

    过滤后:有一边低于1224的图片被过滤。

图文文本长度过滤

  • 适用的文件格式:

    tar+jsonl:所有图片保存为tar包。图片支持:jpg、jpeg、png、bmp图片类型。

    图片文本保存为一份jsonl文件,jsonl文件中图片名称必须要与tar包中的图片名称一致。

  • 各参数说明:

    待过滤内容类型:过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母,文本长度统计为1。

  • 参数配置样例:

  • 过滤样例:
    图1 加工前
    图2 参数配置
    图3 加工后

图文文本语言过滤

  • 适用的文件格式:

    tar+jsonl:所有图片保存为tar包。图片支持:jpg、jpeg、png、bmp图片类型。

    图片文本保存为一份jsonl文件,jsonl文件中图片名称必须要与tar包中的图片名称一致。

  • 各参数说明:

    待过滤内容类型:提取图文压缩包中的JSON文本和图片,并对图片进行结构化解析(BASE64编码),方便图文加工算子使用。

  • 参数配置样例:

  • 去重样例:
    图4 加工前
    图5 参数配置
    图6 加工后

图文去重

  • 适用的文件格式:

    tar+jsonl:所有图片保存为tar包。图片支持:jpg、jpeg、png、bmp图片类型。

    图片文本保存为一份jsonl文件,jsonl文件中图片名称必须要与tar包中的图片名称一致。

  • 各参数说明:

    待过滤内容类型:

    1. 基于结构化图片去重图文。
    2. 判断相同文本对应不同的图片数据是否超过单文本最大图片数阈值,如果超过则随机删除多余图片, 仅保留阈值以内的图文数量。
  • 参数配置样例:

  • 去重样例:

    图7 加工前
    图8 参数配置
    图9 加工后

图片去重

  • 适用的文件格式:

    jpg、jpeg、png、bmp。

    tar:所有图片保存为tar包。tar包含图片支持:jpg、jpeg、png、bmp图片类型。

  • 各参数说明:

    待过滤内容类型:通过把图片结构化处理后,过滤重复的图片/图文对数据。

  • 参数配置样例:

    不需要配置参数。

  • 过滤样例:
    图10 加工前
    图11 加工后

色情图像检测

  • 适用的文件格式:

    jpg、jpeg、png、bmp。

    tar:所有图片保存为tar包。tar包含图片支持:jpg、jpeg、png、bmp图片类型。

  • 各参数说明:

    待打标内容类型:对图片的涉黄程度进行评分, 分数越高越危险。 评分范围(0. 100), 默认评分≥50分的视频可视为涉黄视频。

  • 参数配置样例:

    不需要配置参数。

  • 检测样例:

    检测结果以image_porn对象存储在标注文件中:

    suggestion:对文件检测是否通过的结果,pass代表审核通过无相应的问题;review代表需要人工复核,您可以按照您的审核策略选择放通还是拦截;block代表待审文件存在问题。

    confidence:模型结果检测的置信度(注意这里的置信度代表模型给出建议的置信度)。如果suggestion为pass,则为零;如果suggestion为review/block,则为0-1。

    label:模型检测出的具体色情标签,如果未检测出则为空。

危情图像检测

  • 适用的文件格式:

    jpg、jpeg、png、bmp。

    tar:所有图片保存为tar包。tar包含图片支持:jpg、jpeg、png、bmp图片类型。

  • 各参数说明:

    待打标内容类型:给危情图片内容打标签。

  • 参数配置样例:

    不需要配置参数。

  • 检测样例:检测结果以image_danger对象存储在标注文件中:

    suggestion:对文件检测是否通过的结果,pass代表审核通过无相应的问题;review代表需要人工复核,您可以按照您的审核策略选择放通还是拦截;block代表待审文件存在问题。

    confidence:模型结果检测的置信度(注意这里的置信度代表模型给出建议的置信度)。如果suggestion为pass,则为零;如果suggestion为review/block,则为0-1。

    label:模型检测出的具体危情标签,如果未检测出则为空。

暴恐图像检测

  • 适用的文件格式:

    jpg、jpeg、png、bmp。

    tar:所有图片保存为tar包。tar包含图片支持:jpg、jpeg、png、bmp图片类型。

  • 各参数说明:

    待打标内容类型:过滤暴恐图像。

  • 参数配置样例:

    不需要配置参数

  • 检测样例:检测结果以image_terrorism对象存储在标注文件中:

    suggestion:对文件检测是否通过的结果,pass代表审核通过无相应的问题;review代表需要人工复核,您可以按照您的审核策略选择放通还是拦截;block代表待审文件存在问题。

    confidence:模型结果检测的置信度(注意这里的置信度代表模型给出建议的置信度)。如果suggestion为pass,则为零;如果suggestion为review/block,则为0-1。

    label:模型检测出的具体暴恐标签,如果未检测出则为空。

标注物视觉prompt物体检测

  • 适用的文件格式:

    jpg、jpeg、png、bmp。

  • 算子功能描述:使用参考数据集作为视觉prompt,对待标注图片进行标注。
  • 前置条件:

    需提前部署视觉交互检测模型(Pangu-CV-视觉交互检测-V3)。

    使用该算子时需要使用2个数据集:参考数据集、待标注数据集。参考数据集需要提前在“数据工程 > 数据标注”中完成标注。标注参考数据集时,标注类型需要选择“交互式视觉AI辅助标注”,标注数量建议1张图片。

  • 各参数说明:
    • 模型选择:选择预先部署好的视觉交互检测模型(Pangu-CV-视觉交互检测-V3)。
    • 参考数据集:该数据集由数据工程的标注模块生成,用于作为视觉prompt,对待加工数据集进行推理。
    • 标注优先方式:该参数用于在待加工样本已具备人工标注的情况下,系统对比模型预测框与人工标注框的重叠度(IoU)进行判断,并决定最终使用哪一方结果。阈值可设定于 0~1;当 IoU ≥ 阈值时若设置为“已有标注优先”,则保留人工标记框;若设置为“模型标注优先”,则以模型预测框为准。阈值越低,表示只要稍有重叠即可触发决定;阈值越高,则要求两框高度一致才生效。
    • IOU阈值:对IOU进行配置,该值即为人工标注框和模型框重叠度的阈值,作用如上所述。

标注物名称prompt物体检测

  • 适用的文件格式:

    jpg、jpeg、png、bmp。

  • 算子功能描述:使用参考数据集作为文本prompt,对待标注图片进行标注。
  • 前置条件:

    需提前部署万物检测模型(Pangu-CV-万物检测-V2)。

    使用该算子时需要使用2个数据集:参考数据集、待标注数据集。参考数据集需要提前在“数据工程 > 数据标注”中完成标注。标注参考数据集时,标注类型需要选择“交互式自定义AI辅助检测”,标注数量建议1张图片。

  • 各参数说明:
    • 模型选择:选择预先部署好的万物检测模型(Pangu-CV-万物分割-V2)。
    • 参考数据集:选择参考数据集,该数据集来源于数据工程的标注模块生成,用于作为文本prompt,对待加工数据集进行推理。
    • 标注优先方式:选该参数用于在待加工样本已具备人工标注的情况下,系统对比模型预测框与人工标注框的重叠度(IoU)进行判断,并决定最终使用哪一方结果。阈值可设定于 0~1;当 IoU ≥ 阈值时若设置为“已有标注优先”,则保留人工标记框;若设置为“模型标注优先”,则以模型预测框为准。阈值越低,表示只要稍有重叠即可触发决定;阈值越高,则要求两框高度一致才生效。
    • IOU阈值:对IOU进行配置,该值即为人工标注框和模型框重叠度的阈值,作用如上所述。

图文异常字符过滤

  • 适用的文件格式:

    tar+jsonl:所有图片保存为tar包。图片支持:jpg、jpeg、png、bmp图片类型。

    图片文本保存为一份jsonl文件,jsonl文件中图片名称必须要与tar包中的图片名称一致。

  • 各参数说明:

    待转换内容类型:将文本数据中携带的异常字符替换为空值,数据条目不变。 1)不可见字符,比如U+0000-U+001F 2)表情符?? 3)网页标签符号<p> 4)特殊符号,比如● █ ◆ 5)乱码和无意义的字符�����。

  • 参数配置样例:

    不需要配置参数。

  • 过滤样例:
    图12 加工前
    图13 加工后

相关文档