DeepSeek-V2.5：开源可联网的AI模型

AI变革指南

2024-12-13 06:40发布于辽宁

模型的不断进化和优化是推动技术前沿的重要动力。今天，我们将介绍一款备受瞩目的新模型——DeepSeek-V2.5

DeepSeek-V2.5是国内私募公司幻方量化旗下的深度求索，自主研发的开源AI大模型！支持问答写作等多种任务！

DeepSeek-V2.5是DeepSeek团队在其前两个版本基础上的重大升级。时的它在多项评测中表现出色，中文综合能力与GPT-4-Turbo、文心4.0等闭源模型处于同一梯队，英文综合能力则与最强的开源模型LLaMA3-70B处于同一梯队

目前最新的开源版本已支持联网搜索功能！

性能跃升：多维度突破

数学能力进阶

在 MATH - 500 基准测试中，成绩从 74.8% 跃升至 82.8%，这意味着其处理复杂数学问题的精度与效率显著提升，为科研、金融等对数学计算要求严苛的领域带来更精准可靠的智能辅助。

编码能力增强

于 LiveCodebench（08.01 - 12.01）基准测试里，准确率从 29.2% 攀升至 34.38%。这一提升为程序员群体提供更得力的编码助手，从基础代码编写到复杂程序架构优化，都能精准协助，加速开发进程、提升代码质量。

写作推理优化

在内部测试数据集上，写作与推理能力显著优化。无论是撰写观点鲜明的论述文章，还是剖析复杂逻辑谜题，模型皆能展现出更强的文本理解、生成与逻辑推导实力，满足内容创作、学术研究、智能问答等多场景需求。

如何使用DeepSeek-V2.5？

使用DeepSeek-V2.5非常简单。用户可以通过Hugging Face的Transformers库进行模型推理。以下是一个简单的示例代码：

import torchfrom transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig
model_name = "deepseek-ai/DeepSeek-V2.5"tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True, device_map="sequential", torch_dtype=torch.bfloat16)
messages = [{"role": "user", "content": "Write a piece of quicksort code in C++"}]input_tensor = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")outputs = model.generate(input_tensor.to(model.device), max_new_tokens=100)result = tokenizer.decode(outputs[0][input_tensor.shape[1]:], skip_special_tokens=True)print(result)

模型地址：

https://huggingface.co/deepseek-ai/DeepSeek-V2.5-1210

好了，今天的内容就分享到这里希望你们喜欢！欢迎关注、点赞和分享！