更新时间:2024-11-05 GMT+08:00
开始使用
安全组规则修改(可选)
- 该解决方案使用22端口用来以SSH方式远程登录云服务器,若需远程登录云服务器,请参考修改安全组规则,配置IP地址白名单,以便能正常访问服务。
安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。
如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。
- 访问容器镜像服务控制台,按下图所示,单击“镜像名称”进入镜像详情页,获取镜像地址(一键部署(制作镜像)模板部署完成后约10分钟,镜像制作完成)仅复制镜像地址不需要docker pull 命令。
图1 容器镜像服务
图2 获取镜像地址
部署模型
- 进入函数工作流控制台选择此方案创建的函数,单击函数名称进入函数主页。
图3 进入函数主页
- 单击“测试”在弹出窗口中选择“空白模板”单击“创建”配置测试事件
图4 函数主页
图5 配置测试事件
- 在函数主页,单击“测试”调用函数,通过SDK获取token,创建modelarts委托,配置授权、创建AI应用,部署在线服务。(若出现右侧提示,为函数执行时间较长,调用正常,请继续执行下面的步骤。)
图6 调用函数
- 在函数主页,依次单击“监控”,“日志”,请求日志,查看Modelarts资源创建相关日志信息,无红色字体错误信息,显示如下图,则表示资源创建完成。
图7 日志信息
- 访问AI开发平台ModelArts在线服务控制台单击在线服务名称,进入在线服务管理页面,单击“预测”。
图8 ModelArts在线服务控制台
图9 在线服务管理页面 - 在在线服务预测界面中,输入请求路径“generate”预测代码中填写 {"prompt": "你好", "temperature":0, "max_tokens":20},单击"预测"即可获取返回结果。(若以openai接口启动服务,请求路径:“/v1/completions”,输入预测代码“{"prompt": "你是谁","model": "${model_path}","max_tokens": 50,"temperature":0}”,单击“预测”既可看到预测结果。model_path为表2中model_path的值)
图10 预测
- 按下图所示,在调用指南中获取API接口公网地址,参考右侧调用指南,实现通过API接口调用在线服务。
图11 调用指南
父主题: 实施步骤