内容审核
内容审核连接器用于对接华为云内容审核云服务。
内容审核(Content Moderation),基于图像、文本、视频审核技术,可自动进行涉黄、广告、涉暴等内容检测,帮助客户降低业务违规风险。
创建内容审核连接
- 登录新版ROMA Connect控制台。
- 在左侧导航栏选择“连接器”,在连接器页面单击“新建连接”。
- 选择“内容审核“连接器。
- 在弹窗中配置连接信息,完成后单击“确定“。
支持的动作
- 语音内容审核
- 任务提交
- 任务列表查询
- 处理结果查询
- 图像内容审核
- 文本内容审核
配置参数
参数 |
说明 |
---|---|
project_id |
项目ID,用于资源隔离。 |
region_id |
区域ID。 |
data |
与url参数二选一。 语音文件Base64编码字符串。要求base64编码后大小不超过4M。语音时长不超过1分钟。 |
url |
与data参数二选一。 语音的URL路径,目前支持对服务授权访问华为云上OBS的URL,华为云上OBS提供的临时授权访问的URL和匿名公开授权的URL。 OBS服务的访问权限设置请参见配置OBS访问权限。 出于安全的考虑,当前服务不支持从公网上任意URL读取数据。 |
config |
语音文件配置信息。 |
format |
支持的语音格式。
|
property |
所使用的模型特征串。通常是 “语种_采样率_领域”的形式。 采样率需要与音频采样率保持一致。 当前支持如下模型特征串: chinese_8k_common chinese_16k_common。 |
categories |
审核场景。 当前支持的场景有默认场景和用户自定义场景:
|
参数 |
说明 |
---|---|
project_id |
项目ID,用于资源隔离。 |
region_id |
区域ID。 |
urls |
图片的URL路径,目前支持:
图片的URL路径列表最多支持500个URL地址。接口响应时间依赖图片的下载时间,如果图片下载时间过长,会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠,建议您使用华为云OBS存储。 |
categories |
检测场景。
可通过配置上述场景,来完成对应场景元素的检测。 为空或无此参数时默认检测politics和terrorism(不包含porn)。 |
moderation_rule |
图像审核规则名称,默认使用default规则。 |
ad_categories |
图文审核检测场景。当categories包含ad时,该参数生效。 当前支持的场景有系统场景和用户自定义场景:
|
show_ocr_text |
是否返回ocr识别的结果。
|
参数 |
说明 |
---|---|
project_id |
项目ID,用于资源隔离。 |
region_id |
区域ID。 |
status |
图像内容审核任务处理状态如下:
|
offset |
偏移量, 默认为0。 |
limit |
指定每一页返回的最大条目数,默认为符合查询条件的总任务数量。 |
参数 |
说明 |
---|---|
project_id |
项目ID,用于资源隔离。 |
region_id |
区域ID。 |
job_id |
任务标识。 |
参数 |
说明 |
---|---|
project_id |
项目ID,用于资源隔离。 |
region_id |
区域ID。 |
urls |
与image参数二选一。 图片的URL路径,目前支持:
接口响应时间依赖图片的下载时间,如果图片下载时间过长,会返回接口调用失败。请保证被检测图片所在的存储服务稳定可靠,建议您使用华为云OBS存储。 |
image |
与url参数二选一。 图片文件Base64编码字符串。要求base64编码后大小不超过10M。 政治人物检测人脸部分不小于50*50像素。 支持JPEG/PNG/BMP/WEBP/GIF格式。 |
moderation_rule |
图像审核规则名称,默认使用default规则。 |
categories |
检测场景:
可通过配置上述场景,来完对应场景元素的检测。 为空或无此参数表示politics和terrorism都检测,但不包含porn场景。 每个检测场景的检测次数会分类统计。 |
ad_categories |
图文审核检测场景。当categories包含ad时,该参数生效。 当前支持的场景有系统场景和用户自定义场景:
|
threshold |
|
show_ocr_text |
是否返回ocr识别的结果,默认为false。
|
参数 |
说明 |
---|---|
project_id |
项目ID,用于资源隔离。 |
region_id |
区域ID。 |
categories |
检测场景。 当前支持的场景有默认场景和用户自定义场景:
|
white_glossaries |
启用的白名单列表。当前白名单使用规则为:
|
items |
待检测的文本列表,目前暂时每次只支持传一个item。 |
text |
待检测文本,编码格式为“utf-8”,限定5000个字符以内,文本长度超过5000个字符时,只检测前5000个字符。 |
type |
文本类型,默认为“content”,即正文内容,当前只支持“content”类型,未来会扩大支持类型范围。 |