主流 AI 大对比
国内 vs 国外、聊天型 vs 终端型——先认全,再选对。
下面是当下最常用的 AI。点上面的标签筛一筛,或选一个"你想干嘛",看看哪些更适合你。
中文口语自然,移动端体验好
推理 / 编程强,性价比高
长文本阅读见长
阿里生态,办公集成
联网搜索,资料查询
通用能力标杆,需网络条件
长文 / 写作 / 编程口碑佳
Google 生态,多模态
终端里的编程智能体
OpenAI 终端编程 CLI
Google 终端 CLI
中文 / 编程评级为通俗示意,非评测数据;具体能力、价格与可用区域以各家官网为准。
参数对比:旗舰模型 · 上下文 · 价格(2026 年 6 月)
| AI | 厂商 · 地域 | 当前旗舰模型 | 上下文窗口 | 价格 输入/输出(每百万 token) | 擅长 · 免费入口 |
|---|---|---|---|---|---|
| Claude(顶配) | Anthropic · 国外 | Fable 5 | 100 万 | $10 / $50 | 当前最强、全能 SOTA;Max 档 / API |
| Claude | Anthropic · 国外 | Opus 4.8 | 100 万 | $5 / $25 | 写作 / 编程 / 长文;网页有免费档 |
| ChatGPT | OpenAI · 国外 | GPT-5.5 | 约 105 万 | $5 / $30(缓存输入 $0.5) | 通用能力标杆;网页有免费档 |
| Gemini | Google · 国外 | Gemini 3.1 Pro | 最高 200 万 | $2 / $12(超 20 万翻倍) | 多模态 / 超长上下文 / 搜索;网页有免费档 |
| DeepSeek | 深度求索 · 国内 | DeepSeek V4 | 长上下文 | 约 ¥1 / ¥2(Flash 档) | 推理 / 编程 · 开源 · 极致性价比;网页免费 |
| 豆包 | 字节跳动 · 国内 | 豆包大模型 | 长上下文 | 极低(具体见官网) | 中文口语 / 移动端;网页 + App 免费 |
| 通义千问 | 阿里 · 国内 | Qwen3.6 | 长上下文 | 约 ¥2 输出(输入更低) | 办公 / 阿里生态;网页免费 |
| Kimi | 月之暗面 · 国内 | Kimi K2.6 | 超长文本 | 约 ¥4 输出 | 长文档阅读;网页免费 |
| 智谱 GLM | 智谱 · 国内 | GLM-5.1 | 长上下文 | 约 ¥4.4 输出(输入更低) | 编程 · 有 Coding 套餐;有免费额度 |
| 文心一言 | 百度 · 国内 | 文心大模型 | 长上下文 | 具体见官网 | 中文 / 联网搜索;网页免费 |
数据来源:各家官方定价页(platform.claude.com / openai.com / ai.google.dev、DeepSeek、阿里百炼、月之暗面、智谱等)与 2026 年 6 月公开报道汇总。国外价为美元、国内为人民币(约数,仅示意量级,不可直接换算比较);AI 价格与模型迭代极快,使用前请以各家官网最新为准。
编程能力对比:基准分 · 长上下文 · 终端工具(2026 年 6 月,按 SWE-bench 排序)
| AI · 模型 | SWE-bench Verified(修真实 bug) | 长上下文(仓库级) | 官方终端工具 | 编程亮点 | 编程性价比 |
|---|---|---|---|---|---|
| Claude · Fable 5(顶配) | 95%(厂商自报) | 100 万 | Claude Code | Mythos 级、全能 SOTA,当前编程最强 | 中(最贵但最强) |
| Claude · Opus 4.8 | 88.6% | 100 万 | Claude Code | 复杂重构 / 长任务标杆,编程口碑最佳 | 中上 |
| ChatGPT · GPT-5.5 | 82.6% | 约 105 万 | Codex | 通用 + 编程均衡,生态广 | 中上 |
| DeepSeek · V4-Pro | 约 80.6% | 长 | 可接 Claude Code 等(见 5-2) | 开源 · 推理强,国产编程首选 | 极高 |
| Gemini · 3.1 Pro | 约 80%(自报,三方略低) | 最高 200 万 | Gemini CLI | 超长上下文、读大仓库 / 多模态强 | 高 |
| Kimi · K2.6 | 约 78% | 超长 | 可接 Claude Code 等 | 长代码 / 长文档阅读 | 高 |
| 智谱 GLM · 5.1 | 约 78% | 长 | 可接(有 Coding Plan) | 编程性价比高、套餐便宜 | 极高 |
| 通义 Qwen · 3.6 | 约 76% | 长 | 可接 Claude Code 等 | 多语言、阿里生态 | 高 |
| 豆包 · 字节 | 见官网 | 长 | 可接第三方 | 偏中文对话,编程非主打 | 高 |
| 文心 · 百度 | 见官网 | 长 | 可接第三方 | 偏中文,编程非主打 | 中 |
编程基准为 SWE-bench Verified(让模型自动修真实 GitHub bug 的通过率,越高越强;数据为 2026 年 6 月公开榜单与各家技术报告汇总)。重要提醒:该基准对前沿模型已有数据污染争议、不同测评脚本差异较大,更严格的 SWE-bench Pro 普遍低 15~35 分(如 Fable 5 在 Pro 仅 80.3%);且最新模型(如 Fable 5、Opus 4.8)暂为厂商自报、尚无第三方标准化复测——分数仅供参考,不等于你的真实体验。长上下文 / 性价比 / 亮点为通俗示意。来源:Anthropic / OpenAI / Google 官方报告、DeepSeek / 智谱 / 月之暗面 / 阿里技术报告,及 SWE-bench、LiveBench 等公开榜单。