在线服务

运行中服务 5

今日调用

API 调用次数 128.5K

平均延迟

响应时间 45ms

今日消费

推理费用 ¥286

在线推理服务

查看全部
服务名称 状态 模型 实例数 性能指标 操作

Qwen2.5-72B-生产环境

ID: svc-20240308-001

运行中 Qwen2.5-72B-微调版 2
QPS: 1,234
延迟: 45ms

GLM-4-医疗助手

ID: svc-20240308-002

运行中 GLM-4-医疗助手 1
QPS: 856
延迟: 32ms