当前位置：主页 > 人工智能

人工智能自动推理-红米note智能人工语音

发布时间：2023-03-11 21:06 浏览次数：次作者：佚名

多框架模型统一管理

支持Tensorflow、Pytorch、Caffe、MXnet等主流框架模型，支持ONNX格式模型

支持自定义镜像，通过页面配置快速部署，以及云原生方式进行自定义编排

支持模型导入、查询、删除等操作

支持个人模型、组模型的权限管控

智能人工黑箱法则_人工智能自动推理_红米note智能人工语音

人工智能自动推理_智能人工黑箱法则_红米note智能人工语音

应用服务全周期管理

支持Tensor Serving、Torch Serving、Triton推理引擎

支持离线测试，方便开发人员在模型发布前验证模型准确性

支持A/B测试与滚动发布进行模型迭代升级

支持服务弹性伸缩，根据流量自动调整服务实例数量

提供周期部署与定时部署的服务调度策略，解决不同时段的业务算力需求

智能人工黑箱法则_红米note智能人工语音_人工智能自动推理

支持流量调节、批量处理、业务下线等操作

支持边缘场景下的推理服务部署，状态查看及管理操作

红米note智能人工语音_智能人工黑箱法则_人工智能自动推理

应用请求快速响应

优化网络模型，减少网络代理延迟

深度调优网络参数人工智能自动推理，减少网络延迟

人工智能自动推理_红米note智能人工语音_智能人工黑箱法则

服务延迟1ms，业内领先水平

人工智能自动推理_智能人工黑箱法则_红米note智能人工语音

资源性能监控

简洁直观的集群监控界面，核心参数一目了然

强大的扩展能力，支持用户自定义页面

丰富的日志检索能力，支持检索模版

智能人工黑箱法则_红米note智能人工语音_人工智能自动推理

日志分析能力出众，支持分析结果可视化

红米note智能人工语音_智能人工黑箱法则_人工智能自动推理

产品优势

轻松部署推理服务，提速AI生产交付

提供自动快捷的模型部署方式及服务调用方式，一键实现滚动发布、A/B测试、服务回滚等高级服务部署功能，模型部署上线从2-3天缩短到几分钟；

灵活开放人工智能自动推理，ISV应用统一适配

智能人工黑箱法则_人工智能自动推理_红米note智能人工语音

支持TensorFlow、Pytorch等主流深度学习框架，同时兼容用户自定义框架，无缝对接企业自研或外购AI模型，满足企业多样化的应用场景；

计算资源统一管理，敏捷高效调配

支持英伟达、寒武纪、昆仑芯、高通等6家国际国内厂商的12款AI和GPU芯片的多元算力支持，针对不同AI应用的计算特点按需动态调配计算资源，支持GPU单卡算力细粒度切分，集群资源利用率从40% 提高到 80%；

低延迟高吞吐，秒级响应线上业务

高并发高吞吐，服务响应平均延迟低于1ms；服务资源弹性扩缩，应对突发场景可在几分钟内自动完成服务扩容，提升整体性能；

智能容错，保障业务平稳运行

支持平台服务的健康监控及容错，自动感知服务资源异常情况，并为线上服务选取可用计算资源进行主动迁移。