0-2

主流 AI 大对比

国内 vs 国外、聊天型 vs 终端型——先认全，再选对。

① 认全

下面是当下最常用的 AI。点上面的标签筛一筛，或选一个"你想干嘛"，看看哪些更适合你。

你想干嘛？

地域

形态

11 个匹配

豆包

字节跳动

国内聊天型

中文

编程

有免费

中文口语自然，移动端体验好

DeepSeek

深度求索

国内聊天型

中文

编程

有免费

推理 / 编程强，性价比高

Kimi

月之暗面

国内聊天型

中文

编程

有免费

长文本阅读见长

通义千问

阿里

国内聊天型

中文

编程

有免费

阿里生态，办公集成

文心一言

百度

国内聊天型

中文

编程

有免费

联网搜索，资料查询

ChatGPT

OpenAI

国外聊天型

中文

编程

有免费

通用能力标杆，需网络条件

Claude

Anthropic

国外聊天型

中文

编程

有免费

长文 / 写作 / 编程口碑佳

Gemini

Google

国外聊天型

中文

编程

有免费

Google 生态，多模态

Claude Code

Anthropic

国外终端型

中文

编程

需订阅

终端里的编程智能体

Codex

OpenAI

国外终端型

中文

编程

需订阅

OpenAI 终端编程 CLI

Gemini CLI

Google

国外终端型

中文

编程

有免费

Google 终端 CLI

中文 / 编程评级为通俗示意，非评测数据；具体能力、价格与可用区域以各家官网为准。

参数对比：旗舰模型 · 上下文 · 价格（2026 年 6 月）

AI	厂商 · 地域	当前旗舰模型	上下文窗口	价格输入/输出（每百万 token）	擅长 · 免费入口
Claude（顶配）	Anthropic · 国外	Fable 5	100 万	$10 / $50	当前最强、全能 SOTA；Max 档 / API
Claude	Anthropic · 国外	Opus 4.8	100 万	$5 / $25	写作 / 编程 / 长文；网页有免费档
ChatGPT	OpenAI · 国外	GPT-5.5	约 105 万	$5 / $30（缓存输入 $0.5）	通用能力标杆；网页有免费档
Gemini	Google · 国外	Gemini 3.1 Pro	最高 200 万	$2 / $12（超 20 万翻倍）	多模态 / 超长上下文 / 搜索；网页有免费档
DeepSeek	深度求索 · 国内	DeepSeek V4	长上下文	约 ¥1 / ¥2（Flash 档）	推理 / 编程 · 开源 · 极致性价比；网页免费
豆包	字节跳动 · 国内	豆包大模型	长上下文	极低（具体见官网）	中文口语 / 移动端；网页 + App 免费
通义千问	阿里 · 国内	Qwen3.6	长上下文	约 ¥2 输出（输入更低）	办公 / 阿里生态；网页免费
Kimi	月之暗面 · 国内	Kimi K2.6	超长文本	约 ¥4 输出	长文档阅读；网页免费
智谱 GLM	智谱 · 国内	GLM-5.1	长上下文	约 ¥4.4 输出（输入更低）	编程 · 有 Coding 套餐；有免费额度
文心一言	百度 · 国内	文心大模型	长上下文	具体见官网	中文 / 联网搜索；网页免费

数据来源：各家官方定价页（platform.claude.com / openai.com / ai.google.dev、DeepSeek、阿里百炼、月之暗面、智谱等）与 2026 年 6 月公开报道汇总。国外价为美元、国内为人民币（约数，仅示意量级，不可直接换算比较）；AI 价格与模型迭代极快，使用前请以各家官网最新为准。

编程能力对比：基准分 · 长上下文 · 终端工具（2026 年 6 月，按 SWE-bench 排序）

AI · 模型	SWE-bench Verified（修真实 bug）	长上下文（仓库级）	官方终端工具	编程亮点	编程性价比
Claude · Fable 5（顶配）	95%（厂商自报）	100 万	Claude Code	Mythos 级、全能 SOTA，当前编程最强	中（最贵但最强）
Claude · Opus 4.8	88.6%	100 万	Claude Code	复杂重构 / 长任务标杆，编程口碑最佳	中上
ChatGPT · GPT-5.5	82.6%	约 105 万	Codex	通用 + 编程均衡，生态广	中上
DeepSeek · V4-Pro	约 80.6%	长	可接 Claude Code 等（见 5-2）	开源 · 推理强，国产编程首选	极高
Gemini · 3.1 Pro	约 80%（自报，三方略低）	最高 200 万	Gemini CLI	超长上下文、读大仓库 / 多模态强	高
Kimi · K2.6	约 78%	超长	可接 Claude Code 等	长代码 / 长文档阅读	高
智谱 GLM · 5.1	约 78%	长	可接（有 Coding Plan）	编程性价比高、套餐便宜	极高
通义 Qwen · 3.6	约 76%	长	可接 Claude Code 等	多语言、阿里生态	高
豆包 · 字节	见官网	长	可接第三方	偏中文对话，编程非主打	高
文心 · 百度	见官网	长	可接第三方	偏中文，编程非主打	中

编程基准为 SWE-bench Verified（让模型自动修真实 GitHub bug 的通过率，越高越强；数据为 2026 年 6 月公开榜单与各家技术报告汇总）。重要提醒：该基准对前沿模型已有数据污染争议、不同测评脚本差异较大，更严格的 SWE-bench Pro 普遍低 15~35 分（如 Fable 5 在 Pro 仅 80.3%）；且最新模型（如 Fable 5、Opus 4.8）暂为厂商自报、尚无第三方标准化复测——分数仅供参考，不等于你的真实体验。长上下文 / 性价比 / 亮点为通俗示意。来源：Anthropic / OpenAI / Google 官方报告、DeepSeek / 智谱 / 月之暗面 / 阿里技术报告，及 SWE-bench、LiveBench 等公开榜单。