模型与价格

下表所列模型价格以"百万 tokens"为单位。Token 是模型用来表示自然语言文本的最小单位，可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。

模型细节	deepseek-v4-flash	deepseek-v4-pro
BASE URL (OpenAI)	https://api.deepseek.com
BASE URL (Anthropic)	https://api.deepseek.com/anthropic
模型版本	DeepSeek-V4-Flash	DeepSeek-V4-Pro
思考模式	支持非思考与思考模式（默认），详见思考模式文档
上下文长度	1,000,000 tokens
输出长度	最大 384,000 tokens
JSON Output	✓ 支持	✓ 支持
Tool Calls	✓ 支持	✓ 支持
前缀续写 (Beta)	✓ 支持	✓ 支持
FIM 补全 (Beta)	✓ 仅非思考模式	✓ 仅非思考模式
百万tokens 输入（缓存命中）	¥0.02	¥0.025
百万tokens 输入（缓存未命中）	¥1.00	¥3.00
百万tokens 输出	¥2.00	¥6.00
并发限制	2,500	500

^* deepseek-chat 与 deepseek-reasoner 将于 2026/07/24 23:59 弃用。更多并发限制细节请参考限速与隔离文档。

扣费规则说明

扣减费用 = token 消耗量 × 模型单价，对应费用将直接从充值余额或赠送余额中扣减。当两者同时存在时，优先扣减赠送余额。

Token 是模型处理文本的最小语义单元。一个中文字符约等于 1.5-2 个 token，一个英文单词约等于 1-2 个 token。可使用官方 Tokenizer 工具预估消耗量。

对于重复的上下文前缀，系统自动缓存。缓存命中时按更低价格计费。多轮对话中历史消息部分自动享受缓存价格，显著降低长对话成本。

产品价格可能发生变动，DeepSeek 保留修改价格的权利。请依据实际用量按需充值，定期查看此页面以获知最新价格信息。重大调整将提前通知。