模型推理服务概览
部署和管理您的模型推理服务
在线服务
运行中服务
5
今日调用
API 调用次数
128.5K
平均延迟
响应时间
45ms
今日消费
推理费用
¥286
在线推理服务
查看全部| 服务名称 | 状态 | 模型 | 实例数 | 性能指标 | 操作 |
|---|---|---|---|---|---|
Qwen2.5-72B-生产环境ID: svc-20240308-001 |
运行中 | Qwen2.5-72B-微调版 | 2 |
QPS: 1,234
延迟: 45ms
|
|
GLM-4-医疗助手ID: svc-20240308-002 |
运行中 | GLM-4-医疗助手 | 1 |
QPS: 856
延迟: 32ms
|