公共模型库 - 国信数算控制台

Q

通义千问/Qwen2.5-72B-Instruct

vLLM SGLang 文本生成 70b~600b NVIDIA

Qwen2.5是通义千问系列的大语言模型，支持多语言、多模态理解和复杂推理任务。

D

深度求索/DeepSeek-R1-Distill-Qwen-32B

vLLM 深度推理 31b～70b NVIDIA

DeepSeek-R1是深度求索推出的推理模型，通过强化学习提升推理能力，支持复杂数学和代码任务。

G

智谱/GLM-4-9B-Chat

vLLM 文本生成 0b~9b NVIDIA

GLM-4是智谱AI推出的新一代大语言模型，支持多轮对话、工具调用和代码生成。

L

Meta/Llama-3.1-70B-Instruct

vLLM 文本生成 31b～70b NVIDIA

Llama 3.1是Meta推出的开源大语言模型，支持128K上下文，具备强大的多语言理解和生成能力。

R

深度求索/DeepSeek-V3

vLLM SGLang 文本生成 600b以上

DeepSeek-V3是深度求索推出的超大规模MoE模型，总参数量达671B，每次前向传播激活37B参数。

Q

通义千问/Qwen2-VL-7B-Instruct

vLLM 视觉理解 0b~9b NVIDIA

Qwen2-VL是通义千问系列的多模态视觉语言模型，支持图像理解、视频分析和视觉问答任务。