Claude Code(以下简称CC)是Anthropic推出的命令行AI编程助手,原生使用Claude系列模型。但Anthropic官方API的价格较贵,且在中国大陆充值需要耗费一些精力(后续会出充值教程),而DeepSeek提供了官方的Anthropic兼容API端点,可以以极低的成本将DeepSeek模型接入CC。本文将记录在终端CC和VSCode CC插件中接入DeepSeek-V4-Pro的完整配置过程。
参考链接:Deepseek接入CC的官方文档
VsCode中的CC插件使用教程
B站视频教程:在VsCode-Claude-Code插件中接入DeepSeek教程

阅读全文 »

最近花了将近一周的时间,把一篇 WACV 2026 论文(AusSmoke meets MultiNatSmoke)中基于 HuggingFace 的 SegFormer 基线,完整迁移到了 MMSegmentation 1.x 框架上,并试图逐项对齐其训练与评估口径。这个过程踩了不少坑——论文和代码不一致、框架默认值陷阱、评测口径分歧……这里把全流程记录下来,方便日后回顾,也希望能帮到有类似需求的同学。

阅读全文 »

实验管理与评测脚本说明(mmseg 自定义工具链)

本文介绍在本项目(基于 MMSegmentation 1.x)里自建的一套实验管理 + 评测工具,
用于解决"多次跑同一模型不同超参会互相覆盖"“结果难以横向对比”“评测要分尺寸/分子集”
等问题。全部改动只在 my_configs/paths.pytools/*.py不触碰 mmseg 内核
训练/评测的数值与官方 tools/train.py / tools/test.py 完全一致。

涉及文件:

  • my_configs/paths.py:路径与台账核心逻辑(tools/experiment_paths.py 转出供脚本用)
  • tools/train.py:训练(带运行隔离 + 台账)
  • tools/smoke_test.py:单次测试(指标 + 可视化 + 台账)
  • tools/smoke_test_multiscale.py:分划分一键测试(自动发现,数据集无关)
阅读全文 »

结合最近一段时间的科研实践(主要是论文复现)以及 Datawhale 的公众号经验贴,这里整理一些使用 CodeX / Claude Code 这类编程 Agent 辅助科研开发的经验。

核心思路可以概括为一句话:模型能力固然重要,但上下文、长期规则和验收标准同样重要。

总工作流

比较稳定的一套流程是:

读上下文 -> 写计划 -> 确认范围 -> 小步实现 -> 跑验证 -> 总结结果 -> /new 开新对话

Agent 很适合做“有明确边界的工程任务”,但不适合在上下文混乱、目标模糊、验证缺失的情况下自由发挥。因此,每次让它动手之前,都要先让它理解项目、对齐任务,并明确最后如何验收。

阅读全文 »

前言

最近在做烟雾分割相关实验和读文献时,越来越觉得:一篇能中、能留住的工科论文,往往不是「方法堆叠」写得好,而是「问题链条」讲得通。 方法可以换 backbone、换 loss、换训练 trick,但审稿人真正关心的是:你到底在解决什么、为什么现有工作还不够、你的设计是不是冲着这个缺口去的。

这篇文章不是通用写作课笔记,而是结合计算机视觉 → 语义分割 → 烟雾分割这条线,把自己近期梳理的一套问题驱动写作逻辑记下来,方便以后开新课题、改稿子、和导师对齐 story 时对照使用。

阅读全文 »

先交代一下这套深度学习环境的硬件配置:

  • 显卡:技嘉 RTX 5090 纯血版(国外背回来的)
  • CPU:AMD 9950X
  • 主板:华硕 X870E-PLUS WIFI7
  • 固态:三星 990 Pro 2TB
  • 机械硬盘:西部数据紫盘 2TB
  • 机箱:安钛克 FLUX SE
  • 电源:安钛克 NE 1300 金牌(1300W,ATX 3.0,原生 12V-2x6)
  • 风冷散热:九州风神 阿萨辛4
  • 内存:美商海盗船 DDR5 5200 32G×2
  • 系统:Ubuntu 24.04.4 LTS,内核 6.17.0-29-generic
  • 驱动:NVIDIA 590.48.01(开源内核模块 + GSP),CUDA Runtime 13.1

最近在跑深度学习训练时,接连遇到几类不同表现的黑屏和 GPU 掉盘问题。起初我以为在 BIOS 里禁用核显就能解决,但实际测试下来发现问题仍然存在。经过日志排查和限功耗验证,最终确认:这不是显存不足,也不是代码问题,而是 RTX 5090 满功耗下的瞬时功耗尖峰触发供电保护,导致 GPU 掉出 PCIe 总线(Xid 79)

阅读全文 »

前言

Git 是开发中绕不开的版本控制工具,但其包含的命令和底层概念非常多。在实际的日常代码管理中,很多时候我们只需要用到它的一小部分核心功能。

为了提高工作效率,我在这里整理了一份自己平时最常用到的 Git 操作清单,主要涵盖了本地代码的暂存、提交、历史回退以及与远程仓库的交互。这份记录以实用为主,方便在忘记具体指令时随时查阅。

阅读全文 »

最近在处理烟雾分割任务时,发现现有的语义分割评估指标在应对特定分布(如目标极其微小、类别极度不平衡)时存在一些统计上的盲区。为了更客观地衡量模型性能,我对常用的评价指标进行了梳理,并记录了在 MMSegmentation 框架下实现自定义烟雾分割评价指标的过程。

阅读全文 »
0%