学习地图
第 0 篇 · 看懂 AI 全景
约 5 分钟
0-2

主流 AI 大对比

国内 vs 国外、聊天型 vs 终端型——先认全,再选对。

① 认全

下面是当下最常用的 AI。点上面的标签筛一筛,或选一个"你想干嘛",看看哪些更适合你。

你想干嘛?
地域
形态
11 个匹配
豆包
字节跳动
国内 聊天型
中文
编程
有免费

中文口语自然,移动端体验好

DeepSeek
深度求索
国内 聊天型
中文
编程
有免费

推理 / 编程强,性价比高

Kimi
月之暗面
国内 聊天型
中文
编程
有免费

长文本阅读见长

通义千问
阿里
国内 聊天型
中文
编程
有免费

阿里生态,办公集成

文心一言
百度
国内 聊天型
中文
编程
有免费

联网搜索,资料查询

ChatGPT
OpenAI
国外 聊天型
中文
编程
有免费

通用能力标杆,需网络条件

Claude
Anthropic
国外 聊天型
中文
编程
有免费

长文 / 写作 / 编程口碑佳

Gemini
Google
国外 聊天型
中文
编程
有免费

Google 生态,多模态

Claude Code
Anthropic
国外 终端型
中文
编程
需订阅

终端里的编程智能体

Codex
OpenAI
国外 终端型
中文
编程
需订阅

OpenAI 终端编程 CLI

Gemini CLI
Google
国外 终端型
中文
编程
有免费

Google 终端 CLI

中文 / 编程评级为通俗示意,非评测数据;具体能力、价格与可用区域以各家官网为准。

参数对比:旗舰模型 · 上下文 · 价格(2026 年 6 月)

AI厂商 · 地域当前旗舰模型上下文窗口价格 输入/输出(每百万 token)擅长 · 免费入口
Claude(顶配)Anthropic · 国外Fable 5100 万$10 / $50当前最强、全能 SOTA;Max 档 / API
ClaudeAnthropic · 国外Opus 4.8100 万$5 / $25写作 / 编程 / 长文;网页有免费档
ChatGPTOpenAI · 国外GPT-5.5约 105 万$5 / $30(缓存输入 $0.5)通用能力标杆;网页有免费档
GeminiGoogle · 国外Gemini 3.1 Pro最高 200 万$2 / $12(超 20 万翻倍)多模态 / 超长上下文 / 搜索;网页有免费档
DeepSeek深度求索 · 国内DeepSeek V4长上下文约 ¥1 / ¥2(Flash 档)推理 / 编程 · 开源 · 极致性价比;网页免费
豆包字节跳动 · 国内豆包大模型长上下文极低(具体见官网)中文口语 / 移动端;网页 + App 免费
通义千问阿里 · 国内Qwen3.6长上下文约 ¥2 输出(输入更低)办公 / 阿里生态;网页免费
Kimi月之暗面 · 国内Kimi K2.6超长文本约 ¥4 输出长文档阅读;网页免费
智谱 GLM智谱 · 国内GLM-5.1长上下文约 ¥4.4 输出(输入更低)编程 · 有 Coding 套餐;有免费额度
文心一言百度 · 国内文心大模型长上下文具体见官网中文 / 联网搜索;网页免费

数据来源:各家官方定价页(platform.claude.com / openai.com / ai.google.dev、DeepSeek、阿里百炼、月之暗面、智谱等)与 2026 年 6 月公开报道汇总。国外价为美元、国内为人民币(约数,仅示意量级,不可直接换算比较);AI 价格与模型迭代极快,使用前请以各家官网最新为准。

编程能力对比:基准分 · 长上下文 · 终端工具(2026 年 6 月,按 SWE-bench 排序)

AI · 模型SWE-bench Verified(修真实 bug)长上下文(仓库级)官方终端工具编程亮点编程性价比
Claude · Fable 5(顶配)95%(厂商自报)100 万Claude CodeMythos 级、全能 SOTA,当前编程最强中(最贵但最强)
Claude · Opus 4.888.6%100 万Claude Code复杂重构 / 长任务标杆,编程口碑最佳中上
ChatGPT · GPT-5.582.6%约 105 万Codex通用 + 编程均衡,生态广中上
DeepSeek · V4-Pro约 80.6%可接 Claude Code 等(见 5-2)开源 · 推理强,国产编程首选极高
Gemini · 3.1 Pro约 80%(自报,三方略低)最高 200 万Gemini CLI超长上下文、读大仓库 / 多模态强
Kimi · K2.6约 78%超长可接 Claude Code 等长代码 / 长文档阅读
智谱 GLM · 5.1约 78%可接(有 Coding Plan)编程性价比高、套餐便宜极高
通义 Qwen · 3.6约 76%可接 Claude Code 等多语言、阿里生态
豆包 · 字节见官网可接第三方偏中文对话,编程非主打
文心 · 百度见官网可接第三方偏中文,编程非主打

编程基准为 SWE-bench Verified(让模型自动修真实 GitHub bug 的通过率,越高越强;数据为 2026 年 6 月公开榜单与各家技术报告汇总)。重要提醒:该基准对前沿模型已有数据污染争议、不同测评脚本差异较大,更严格的 SWE-bench Pro 普遍低 15~35 分(如 Fable 5 在 Pro 仅 80.3%);且最新模型(如 Fable 5、Opus 4.8)暂为厂商自报、尚无第三方标准化复测——分数仅供参考,不等于你的真实体验。长上下文 / 性价比 / 亮点为通俗示意。来源:Anthropic / OpenAI / Google 官方报告、DeepSeek / 智谱 / 月之暗面 / 阿里技术报告,及 SWE-bench、LiveBench 等公开榜单。