大模型焚決4-關於怎麼提高ClaudeCode用國產大模型的緩存命中率

昨天更新claudeCode到2.1.153,結果發現coding Plan的限額刷刷地用完了,速度感覺比之前快大概4-5倍,而且還觸發了429的限制。這不科學啊。

然後我檢查了下我的調用日誌,好傢伙,因爲ClaudeCode的更新,導致緩存失效了,緩存命中都是0.... 按照之前90%-97%的緩存命中,這半天的時間的費用快趕上我之前好幾天的大模型費用了屬於是....

爲此,我趕緊更新了一波ClaudeCode的配置,爲了防止大家也被A/給坑了,將相關配置發給大家參考配置,後續不要再被ClaudeCode的噁心機制給坑了,導致費用大增。不得不說,A/真的不是人啊!!

所以今天講一講,如果配置國產大模型,在CC-Switch或者直接編輯ClaudeCode的時候,有哪些地方需要注意。

1.1M上下文怎麼配置:

CC-switch裏面,在模型後面增加[1m]的標誌。如果你是deepseek,那就是deepseek-v4-pro[1m],如果是小米mimo就是mimo-v2.5-pro[1m]

配置好後,打開claudecode的cli頁面,就能看到是1M上下文了,如果打開後不是1M上下文,那麼可能是你的ClaudeCode的版本比較老,需要更新了。

2.提高緩存命中率

但是更新ClaudeCode後,可能緩存命中就爲0或者非常低了... 爲什麼呢? 因爲ClaudeCode的公司不當人啊,加了很多騷操作,導致你的緩存基本命中不了,這個時候就需要通過參數將它給修改了。

claudeCode的參數文件裏面,它分爲好幾類:

2.1 環境變量類型

這裏面我們要改哪些呢? 就是我下面提到的這幾個,你可以直接複製進去你的claudeCode的配置文件裏面,或者複製到cc-switch裏面。別問爲什麼,配置了後試下前後的緩存命中率你就知道了,會來感謝我的!

"API_TIMEOUT_MS": "6000000", "CLAUDE_CODE_ATTRIBUTION_HEADER": "0", "CLAUDE_CODE_DISABLE_FEEDBACK_SURVEY": "1", "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1", "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1", "CLAUDE_CODE_MAX_CONTEXT_TOKENS": "1000000", "DISABLE_AUTO_COMPACT": "1", "ENABLE_PROMPT_CACHING_1H": "1", "ENABLE_TOOL_SEARCH": "true"

2.2 全局配置類

如果你是用Deepseek-V4-Pro的話,記得把effortLevel改成max,這也是官方推薦的方式,這樣雖然DS響應慢一點,但是會思考得更加全面,表現會好一些(官方文件的說法是開了max後能比的上OPUS4.6不開思考....)

2.3 插件/skill/hooks相關

這些基本不需要你自己去動,你只需要知道有這塊內容。你完全可以交給ClaudeCode來幫你裝插件/skill/hooks。比如我的這一套,就是和claudeCode說我要

“以OMC(Oh-My-ClaudeCode)爲主,以ECC(EveryThing-Claude-Code)和GSD(Get-Shit-Done)爲輔,建立一個agent、hooks、skills、rules不衝突的開發提醒,給出你的方案建議供我決策”。

然後在claudecode的指導下建立起來的。

2.4 HUD類

HUD是啥呢?就是你安裝了OMC或者claude-hud後,在claudeCode窗口最下方展示你的上下文用了多少,你的當前在運行的agent有哪些,以及用了什麼工具的附加界面

一般你安裝和配置了OMC,就會有它帶的HUD。當然,如果你要裝Claude-Hud,那也是推薦的。這塊不用管,你裝什麼hud,這裏就會怎麼樣對應改成那個hud。

經過上述配置,多對話幾輪,你再看你的緩存命中,就會提到很多了,甚至能到99%:

以上就是今天的內容,感興趣的朋友不妨點贊和關注,我們下期再見。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com