更新时间:2022-12-21 GMT+08:00
分享

语音内容审核(V1)

功能介绍

分析并识别用户上传的语音内容是否有敏感内容,并将识别结果返回给用户。

URI

URI格式

POST /v1.0/moderation/voice

请求消息

请求参数请参见表 请求参数说明

表1 请求参数说明

名称

是否必选

类型

说明

data

与url二选一

String

语音文件Base64编码字符串。要求base64编码后大小不超过4M。

语音时长不超过1分钟。

url

与data二选一

String

语音的URL路径,目前支持对服务授权访问华为云上OBS的URL,华为云上OBS提供的临时授权访问的URL和匿名公开授权的URL。

出于安全的考虑,当前服务不支持从公网上任意URL读取数据。

config

Object

语音文件配置信息,请参见表2

categories

Array

审核场景。

当前支持的场景有默认场景和用户自定义场景:

  • 默认场景为:
    • porn:涉黄
    • ad:广告
    • abuse:辱骂
    • contraband:违禁品
  • 用户自定义场景为:自定义词库。
    说明:

    自定义词库的创建和使用请参见配置自定义词库

表2 config数据结构

名称

是否必选

类型

说明

format

String

支持的语音格式,请参见表3

property

String

所使用的模型特征串。通常是 “语种_采样率_领域”的形式。

采样率需要与音频采样率保持一致。

当前支持如下模型特征串:

chinese_8k_common

chinese_16k_common

表3 format取值范围

format取值

说明

pcm16k16bit

16k16bit单通道录音数据。

pcm8k16bit

8k16bit单通道录音数据。

ulaw16k8bit

16k8bit ulaw单通道录音数据。

ulaw8k8bit

8k8bit ulaw单通道录音数据。

alaw16k8bit

16k8bit alaw单通道录音数据。

alaw8k8bit

8k8bit alaw单通道录音数据。

mp3

mp3格式音频。目前仅支持单通道的音频。

aac

aac格式音频。目前仅支持单通道的音频。

wav

带wav封装头的格式,从封装头中自动确定格式,目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。

amr

AMR窄带(8k) 压缩录音数据。目前仅支持单通道的音频。

amrwb

AMR 宽带(16k) 压缩录音数据。目前仅支持单通道的音频。

响应消息

响应参数请参见表 响应参数说明

表4 响应参数说明

名称

类型

说明

result

Object

调用成功时表示调用结果。

调用失败时无此字段。

detail

Object

审核结果列表,text为语音转文本后审核结果,audio为音频审核结果。

text

Object

返回的语音转文本后审核结果详细信息:

  • porn:涉黄敏感词列表。
  • ad:广告敏感词列表。
  • abuse:辱骂敏感词列表。
  • contraband:违禁品感词列表

audio

Object

返回的音频审核结果列表,porn为涉黄场景审核结果;当前仅支持porn场景。

label

String

当前支持label列表如下:

normal:正常

porn:色情

confidence

Number

置信度,取值范围 0-1。

suggestion

String

检测结果是否通过。

block:包含敏感信息,不通过。

pass:不包含敏感信息,通过。

review:需要人工复查。

error_code

String

调用失败时的错误码,具体请参见错误码

调用成功时无此字段。

error_msg

String

调用失败时的错误信息。

调用成功时无此字段。

示例

  • 请求示例(方式一,使用语音的BASE64编码)
    POST https://moderation.cn-north-1.myhuaweicloud.com/v1.0/moderation/voice
        
    Request Header:      
    Content-Type:application/json
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...   
    Request Body:
    {
        "categories": ["ad",  "abuse", "porn", "contraband"],
        "data": "/+MgxAAUeHpMAUkQAANhuRACAIAgKHKQmRisVo0aNAgQIIQyCgGBiwfB8H4IAgCAJg+D4Ph+IAQBBywfB8HwQDGAwfB8HwfBA5gM/L...",
        "config": {
            "format": "aac",
            "property": "chinese_16k_common"
        }
    }
  • 请求示例(方式二,使用语音的URL)
    POST https://moderation.cn-north-1.myhuaweicloud.com/v1.0/moderation/voice
        
    Request Header:      
    Content-Type:application/json
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...   
    Request Body:
    {
        "categories":["ad","abuse","porn","contraband"],
        "url":"https://BucketName.obs.myhuaweicloud.com/ObjectName",
        "config": {
            "format": "aac",
            "property": "chinese_16k_common"
        }
    }
  • 成功响应示例
    {
        "result": {
            "detail": {
                "text": {
                    "abuse": ["fuck"],
                    "ad": ["六位qq"],
                    "contraband": ["亚砷酸",
                    "亚砷酸钾"],
                    "porn": ["luo聊"]
                },
                "audio": {
                    "porn": [{
                        "confidence": 0.9925,
                        "label": "normal"
                    },
                    {
                        "confidence": 0.0075,
                        "label": "porn"
                    }]
                }
            },
            "suggestion": "block"
        }
    }
  • 失败响应示例
    {
        "error_code": "AIS.0005",
        "error_msg": "The service does not exist."
    }

状态码

  • 正常

    200

  • 失败

    返回值

    说明

    400

    • 语义有误,当前请求无法被服务器解析。除非进行修改,否则客户端不应重复提交这个请求。
    • 请求参数有误。

    401

    当前请求需要用户验证。

    403

    没有操作权限。

    404

    请求失败,在服务器上未找到请求所希望得到的资源。

    500

    服务器遇到了一个未曾预料的状况,导致无法完成对请求的处理。

分享:

    相关文档

    相关产品