模型与价格
下表所列模型价格以"百万 tokens"为单位。Token 是模型用来表示自然语言文本的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。
| 模型细节 | deepseek-v4-flash | deepseek-v4-pro |
|---|---|---|
| BASE URL (OpenAI) | https://api.deepseek.com | |
| BASE URL (Anthropic) | https://api.deepseek.com/anthropic | |
| 模型版本 | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
| 思考模式 | 支持非思考与思考模式(默认),详见思考模式文档 | |
| 上下文长度 | 1,000,000 tokens | |
| 输出长度 | 最大 384,000 tokens | |
| JSON Output | ✓ 支持 | ✓ 支持 |
| Tool Calls | ✓ 支持 | ✓ 支持 |
| 前缀续写 (Beta) | ✓ 支持 | ✓ 支持 |
| FIM 补全 (Beta) | ✓ 仅非思考模式 | ✓ 仅非思考模式 |
| 百万tokens 输入(缓存命中) | ¥0.02 | ¥0.025 |
| 百万tokens 输入(缓存未命中) | ¥1.00 | ¥3.00 |
| 百万tokens 输出 | ¥2.00 | ¥6.00 |
| 并发限制 | 2,500 | 500 |
* deepseek-chat 与 deepseek-reasoner 将于 2026/07/24 23:59 弃用。更多并发限制细节请参考限速与隔离文档。
扣费规则说明
计费方式
扣减费用 = token 消耗量 × 模型单价,对应费用将直接从充值余额或赠送余额中扣减。当两者同时存在时,优先扣减赠送余额。
Token 是什么
Token 是模型处理文本的最小语义单元。一个中文字符约等于 1.5-2 个 token,一个英文单词约等于 1-2 个 token。可使用官方 Tokenizer 工具预估消耗量。
缓存命中说明
对于重复的上下文前缀,系统自动缓存。缓存命中时按更低价格计费。多轮对话中历史消息部分自动享受缓存价格,显著降低长对话成本。
价格调整声明
产品价格可能发生变动,DeepSeek 保留修改价格的权利。请依据实际用量按需充值,定期查看此页面以获知最新价格信息。重大调整将提前通知。