在VS Code的CC插件以及终端CC中接入DeepSeek-V4-Pro

Claude Code(以下简称CC)是Anthropic推出的命令行AI编程助手,原生使用Claude系列模型。但Anthropic官方API的价格较贵,且在中国大陆充值需要耗费一些精力(后续会出充值教程),而DeepSeek提供了官方的Anthropic兼容API端点,可以以极低的成本将DeepSeek模型接入CC。本文将记录在终端CC和VSCode CC插件中接入DeepSeek-V4-Pro的完整配置过程。
参考链接:Deepseek接入CC的官方文档
VsCode中的CC插件使用教程
B站视频教程:在VsCode-Claude-Code插件中接入DeepSeek教程


前置准备

开始之前,需要准备好以下内容:

  • DeepSeek API Key:在 DeepSeek 开放平台 注册并获取,可以先充值10元试一试,目前是2.5折优惠。
  • Claude Code 已安装:终端CC和VSCode CC插件安装,此处不进行过多介绍。

一:终端 CC 接入

终端 CC 通过读取 shell 环境变量来决定使用哪个模型后端。直接在你的shell配置文件中添加以下环境变量即可。

对于 macOS / zsh 用户,编辑 ~/.zshrc

1
2
3
4
5
6
7
8
export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_AUTH_TOKEN=<你的 DeepSeek API Key>
export ANTHROPIC_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_OPUS_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_SONNET_MODEL=deepseek-v4-pro[1m]
export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash
export CLAUDE_CODE_SUBAGENT_MODEL=deepseek-v4-flash
export CLAUDE_CODE_EFFORT_LEVEL=max

💡 说明:CC 内部会根据任务复杂度自动选择 Opus/Sonnet/Haiku 级别的模型。通过 ANTHROPIC_DEFAULT_* 变量可以将这些级别分别映射到 DeepSeek 的不同模型。如果你希望所有任务都走同一个模型,全部填 deepseek-v4-pro 即可。

配置完成后,重新加载 shell 配置:

1
source ~/.zshrc

随后在终端中启动 claude,CC 便会通过 DeepSeek API 运行。

二:VSCode CC 插件接入

VSCode 的CC插件同样依赖环境变量,但需要通过VSCode的终端环境变量设置来注入。

打开 VS Code 设置(Cmd + ,),搜索 terminal.integrated.env.osx(Windows 用户搜索 terminal.integrated.env.windows),点击 Edit in settings.json,添加以下内容:

1
2
3
4
5
6
7
8
9
10
{
"terminal.integrated.env.osx": {
"ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic",
"ANTHROPIC_AUTH_TOKEN": "sk-your-deepseek-api-key",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "deepseek-v4-pro",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash",
"CLAUDE_CODE_SUBAGENT_MODEL": "deepseek-v4-pro"
}
}

配置完成后,完全退出并重启 VS Code,再打开集成的 CC 插件,环境变量便会生效。


推荐的额外配置

为了获得更好的使用体验,建议一并配置以下变量:

1
2
3
4
5
6
7
# 超时时长(ms):max effort 推理耗时较长,建议设长一些
export API_TIMEOUT_MS="600000"

# 关闭非必要流量(遥测、成本警告等)
export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1
export DISABLE_COST_WARNINGS=1
export DISABLE_TELEMETRY=1

模型映射关系

配置生效后,CC 内部分配的 Claude 模型会被自动映射到 DeepSeek 模型:

Claude 原生模型 映射到的 DeepSeek 模型
claude-opus-* deepseek-v4-pro
claude-sonnet-* deepseek-v4-pro(或 deepseek-v4-flash
claude-haiku-* deepseek-v4-flash

V4-Pro 拥有 1M token 上下文窗口,足以塞入整个代码仓库,配合 CC 的代码搜索和多文件编辑能力,体验相当顺畅。


功能兼容性一览

DeepSeek 的 Anthropic 兼容端点是目前第三方供应商中支持最完整的,但仍有几个重要差距需要了解:

✅ 完全支持

功能 说明
文本对话与流式输出 日常编码问答完全正常
Tool Use / 函数调用 文件读写、命令执行、工具链调用均稳定
Subagent(子代理) ✅ DeepSeek 原生支持,Agent 级任务可正常调度
System Prompt 系统指令完全兼容
128K~1M 上下文 V4-Pro 支持 1M tokens,远超 Claude 的 200K

⚠️ 部分支持 / 被忽略

功能 说明
thinking(推理模式) V4-Pro 自身具备推理能力,但 Anthropic API 的 budget_tokens 参数会被忽略
disable_parallel_tool_use 被忽略,DeepSeek 的并行工具调用策略与 Claude 不同
cache_control 不支持 Anthropic 的 prompt caching 机制

❌ 不支持

功能 说明
图片 / 多模态 最大短板。V4-Pro 当前是纯文本模型,截图、UI 设计稿、终端截图等无法被识别——只会收到占位符 [Image #1]
文档上传 不支持直接上传 PDF、图片等文件作为输入
MCP 工具类型 不支持 server_tool_usemcp_tool_result 等 MCP 原生工具调用类型

实际使用中需要注意的问题

1. 图片不可用是硬伤

虽然 V4-Pro 有 1M 上下文——"能塞进去整个代码仓库,但塞不进去一张 PNG。"遇到以下场景时需要临时切回 Anthropic 原生 API

  • CC 自动截取终端截图进行 debug
  • 需要基于 UI 设计稿生成前端代码
  • 分析报错截图或日志截屏

切换方法:在终端中取消 ANTHROPIC_BASE_URL 环境变量即可回退:

1
2
unset ANTHROPIC_BASE_URL
# 或者重新打开一个未配置 ANTHROPIC_BASE_URL 的终端窗口

2. 速度与成本的权衡

DeepSeek V4-Pro 在 max effort 模式下推理时间较长(可能超过 1 分钟),这也是建议将 API_TIMEOUT_MS 设为 600000 的原因。但相比原生 Claude API 约 90%+ 的成本节省,这点等待完全值得。

3. 不同订阅方案的区别

如果同时持有 Anthropic 的付费订阅(Max 计划),注意环境变量的配置会覆盖订阅的原生模型路由。建议为 DeepSeek 接入专门准备一个终端配置别名,方便在不同后端之间快速切换。


个人使用体验

成本:真的便宜

最近 DeepSeek 的 Token 价格打 2.5 折,我往账户里充了 10 块钱。到目前为止,用它完成了:

  • 两个深度学习论文的复现工作(涉及大量代码编写和调试)
  • 几篇博客文章(包括本文)的撰写与 Hexo 自动部署脚本调试

总共花掉了大约 3.5 元。也就是说 10 块钱的额度还剩下近三分之二。这个价格放在任何同类工具面前都是降维打击。

与 Cursor Pro 的对比

在此之前,我一直在用 Cursor 的 Pro 订阅,20 美元一个月。说实话,体验算不上差,但有一个致命问题——Opus 的额度太少,高强度用不了几天就没了。额度耗尽之后只能降级用 Cursor 自研的 Composer 2.5(底层其实是 Kimi 2.5 套壳),虽然也不至于难用,但模型能力明显掉了一个档次。GPT 的额度同样少得可怜。

20 美元一个月,大部分时间用的只是一个二线模型——性价比实在太低了。

相比之下,DeepSeek V4-Pro 按量计费、单价极低,而且不限制调用频率,不用担心"额度用完"这件事。花多少钱用多少量,完全在自己掌控范围内。

实际能力感受

讲实话,DeepSeek V4-Pro 的代码能力和中文能力都不错。代码方面,在两个复现项目中处理了训练脚本、数据预处理、配置文件的编写和调试,基本没有遇到模型能力不足导致的阻塞性问题。中文方面,写博客、整理技术文档时的语言表达自然流畅,比大多数纯英文训练的模型接地气得多。

当然,前面提到的图片不支持确实时有碰到——比如想让 CC 看看终端报错截图或者模型输出的可视化结果,这时候只能临时切回原生 API。但纯文本场景下,V4-Pro 完全够用。


总结

DeepSeek V4-Pro + Claude Code 的组合在纯文本编码场景下体验几乎无差异——Tool Use 和 Subagent 均原生可用,配合极低的 API 成本和 1M 超长上下文,是日常开发中极具性价比的选择。唯一的软肋是图片/多模态不支持,遇到需要视觉理解的场景时需要切回 Anthropic 原生 API。

📌 适用场景:后端开发、脚本编写、代码重构、项目搭建、文档生成

📌 不适用场景:前端 UI 开发(需要看图)、截图 Debug、多模态分析


参考资料