Java調(diào)用QwQ實(shí)戰(zhàn),32B模型對(duì)標(biāo)DeepSeek R1滿血版
QwQ-32B: 高效推理大模型
概述
QwQ-32B 是阿里巴巴 Qwen 團(tuán)隊(duì)基于 Qwen2.5 架構(gòu)研發(fā)的先進(jìn)大語言模型,專為高性能推理任務(wù)設(shè)計(jì)。本文檔介紹 QwQ-32B 的性能優(yōu)勢(shì)及應(yīng)用實(shí)踐,幫助開發(fā)者快速了解并應(yīng)用這一前沿模型。
性能表現(xiàn)
QwQ-32B 性能對(duì)比圖
根據(jù)阿里巴巴官方自己的基準(zhǔn)測(cè)試數(shù)據(jù)(X平臺(tái)及技術(shù)白皮書),QwQ-32B 在多項(xiàng)核心能力指標(biāo)上均展現(xiàn)領(lǐng)先優(yōu)勢(shì):
能力維度 | 評(píng)測(cè)基準(zhǔn) | QwQ-32B | DeepSeek-R1 | 性能優(yōu)勢(shì) |
數(shù)學(xué)推理 | AIME24 | 79.74 | 79.13 | +0.61 |
代碼生成 | LiveCodeBench | 73.54 | 72.91 | +0.63 |
綜合推理 | LiveBench | 82.1 | 81.3 | +0.8 |
指令跟隨 | IFEval | 85.6 | 84.9 | +0.7 |
安全合規(guī) | BFCI | 92.4 | 91.8 | +0.6 |
資源效率突破
QwQ-32B 在保持高性能的同時(shí),實(shí)現(xiàn)了顯著的資源效率突破:
- DeepSeek-R1:需要超過 1,500 GB 的 vRAM 才能運(yùn)行(16 塊 Nvidia A100 GPU)
- QwQ-32B:僅需 24 GB 的 vRAM,可在單 GPU(如 Nvidia H100)上運(yùn)行
這一突破性進(jìn)展使 QwQ-32B 能夠在消費(fèi)級(jí)硬件上高效部署,大幅降低了應(yīng)用門檻和運(yùn)營成本。
快速上手指南
Ollama 環(huán)境部署
QwQ-32B 模型已正式登陸 Ollama 模型庫,開發(fā)者可通過以下步驟快速體驗(yàn):
# 查看可用模型列表
$ ollama ls
NAME ID SIZE MODIFIED
qwq:latest cc1091b0e276 19 GB 17 minutes ago
# 啟動(dòng)模型交互
$ ollama run qwq:latest
>>> 請(qǐng)用java實(shí)現(xiàn)快速排序算法
Java 應(yīng)用集成
通過兼容 QwQ 的 deepseek4j 庫,可輕松將模型能力集成到 Java 應(yīng)用中:
Maven 依賴配置
<dependency>
<groupId>io.github.pig-mesh.ai</groupId>
<artifactId>deepseek-spring-boot-starter</artifactId>
<version>1.4.5</version>
</dependency>
應(yīng)用配置
deepseek:
base-url: http://127.0.0.1:11434/v1
model: qwq:latest
api-key: local-key
基礎(chǔ)調(diào)用示例
@Autowired
private DeepSeekClient deepSeekClient;
@GetMapping(value = "/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<ChatCompletionResponse> chat(String prompt) {
return deepSeekClient.chatFluxCompletion(prompt);
}
Java 集成效果
函數(shù)調(diào)用能力
QwQ-32B 作為專注推理的大模型,令人振奮地支持 Function Calling 能力(該特性在 DeepSeek-R1 中尚未實(shí)現(xiàn))。這使模型能夠主動(dòng)調(diào)用外部工具進(jìn)行邏輯推演,大幅拓展了 AI 推理的應(yīng)用邊界。
Function Calling 示例
天氣查詢示例
以下代碼演示了如何讓 QwQ-32B 模型調(diào)用天氣查詢工具函數(shù):
@GetMapping(value = "/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public Flux<ChatCompletionResponse> chat(String prompt) {
// 定義天氣查詢函數(shù)
Function WEATHER_FUNCTION = Function.builder()
.name("get_current_weather")
.description("Get the current weather in a given location")
.parameters(JsonObjectSchema.builder()
.properties(new LinkedHashMap<String, JsonSchemaElement>() {{
put("location", JsonStringSchema.builder()
.description("The city name")
.build());
}})
.required(asList("location", "unit"))
.build())
.build();
// 將 Function 轉(zhuǎn)換為 Tool
Tool WEATHER_TOOL = Tool.from(WEATHER_FUNCTION);
// 創(chuàng)建請(qǐng)求
ChatCompletionRequest request = ChatCompletionRequest.builder()
.model("Qwen/QwQ-32B") // 指定模型
.addUserMessage(prompt)
.tools(WEATHER_TOOL) // 添加工具函數(shù)
.build();
// 發(fā)送請(qǐng)求并獲取響應(yīng)
ChatCompletionResponse response = deepSeekClient.chatCompletion(request).execute();
// 獲取工具調(diào)用信息
AssistantMessage assistantMessage = response.choices().get(0).message();
ToolCall toolCall = assistantMessage.toolCalls().get(0);
// 解析函數(shù)調(diào)用參數(shù)
FunctionCall functionCall = toolCall.function();
String arguments = functionCall.arguments(); // 例如: {"location": "北京"}
// 執(zhí)行函數(shù)獲取結(jié)果
Map map = Json.fromJson(arguments, Map.class);
String weatherResult = map.get("location") + "氣溫 20°";
// 創(chuàng)建工具消息
ToolMessage toolMessage = ToolMessage.from(toolCall.id(), weatherResult);
// 繼續(xù)對(duì)話
ChatCompletionRequest followUpRequest = ChatCompletionRequest.builder()
.model("Qwen/QwQ-32B")
.messages(
UserMessage.from(prompt),
assistantMessage,
toolMessage // 添加工具消息
)
.build();
return deepSeekClient.chatFluxCompletion(followUpRequest);
}
總結(jié)
QwQ-32B 作為阿里巴巴 Qwen 團(tuán)隊(duì)的最新推理型大模型,在多項(xiàng)關(guān)鍵指標(biāo)上全面超越 DeepSeek R1 的 671 能力基準(zhǔn)。同時(shí),QwQ-32B 創(chuàng)新性地支持 Function Calling 能力,將模型從單純的語言生成工具提升為可與外部系統(tǒng)交互的智能助手,為開發(fā)者提供了構(gòu)建復(fù)雜 AI 應(yīng)用的強(qiáng)大基礎(chǔ)。
您現(xiàn)在可以通過 PIG AI 的深度推理模塊快速體驗(yàn) QwQ-32B 模型。PIG AI 讓您無需復(fù)雜配置即可體驗(yàn) QwQ-32B 的強(qiáng)大能力。QwQ 模型的推理速度非常出色,響應(yīng)幾乎實(shí)時(shí),快 快 快 !!
1741270591