怎么通俗地和老板解释：国外的旗舰模型到底强在哪里？

fiht · 2026-06-15T00:51:15Z

你是研发团队的组长，你想做一笔财务预算采购国外厂商的模型加速研发。 CTO 和 CFO 都过来问了：“国内模型和国外模型编程上有多少差别？买国内的 Coding Plan 可以吗？” 你的回答：

模型

预算

差异

110 replies • 2026-06-15 21:52:00 +08:00

1 2

❮

❯

1

idealhs

13h 58m ago

1

一分钱一分货

2

280303

13h 57m ago

让 CTO 自己去试试

3

akorn

13h 57m ago

你是在问 ai 吗

4

turing518

13h 56m ago

不如让你想买的国外旗舰大模型做一下自我推荐？

5

xtreme1

13h 54m ago

4

CTO 干啥吃的

6

Yasuke

13h 51m ago

2

CTO 是完全脱离技术了吗

7

syubo2810

13h 51m ago

1

其实还是钱的问题和风险问题，国外的怎么保证稳定性，差距是不是大到必须要用国外的，即使不稳定价格也贵，还有政策风险

8

Charbo

13h 47m ago

16

不知道还以为你是 CTO

9

wqhui

13h 46m ago

分几个组用不同模型做差不多难度的需求，对比需要几轮完成、单次采纳率是多少

10

wangxinpier

13h 45m ago

哈哈，效率高了，人员就过剩了，减员后，成本下降，你为公司着想，还得说服各方，看来还是时机未到呀

11

zlhsvc

13h 44m ago

1

CTO 干啥吃的 +1

12

Sezxy

13h 43m ago

你可以跟 cto 说，你用国外模型一人能顶 10 人，用国内模型，一人能顶一人

13

crocoBaby

13h 43m ago

CTO 咨询你技术意见?????

14

yanest

13h 42m ago

电脑也应该换国产芯片的

15

fiht

OP

13h 42m ago

1

CTO 吃饭的时候偶遇了你：
“小刘啊，听说国外大模型发展得很好，但是我看一些 benchmark ，也就比国内的模型高几个点啊”

你的回答：

16

wy315700

13h 41m ago

@Sezxy 话别说太满，到时候 CTO 一个人出 10 个人的活。

17

fredweili

13h 40m ago

这是在问么？回答可以就行了

18

MiHwAppleTslFan

13h 40m ago

12

99%和 90%的差别不是 9%,是 1000%,一个需要改 1%,一个需要改 10%
同理,99%和 99.9%也是

19

Sezxy

13h 39m ago

@wy315700 #16 反正要通俗

20

exploretheworld

13h 39m ago via Android

苹果和安卓

21

systemGuest

13h 37m ago

19

我强烈建议你，尽量推动他们使用国内模型，合理合法合规，实在犹豫用爱国去绑架，然后你自己用国外的。

22

xyooyx

13h 35m ago

主要是在 Long-horizon 任务中

23

Rorysky

13h 34m ago

中国人使用美国模型违反美国法律

24

polo3584

13h 32m ago

让老板自己去试

25

billzhuang

13h 27m ago via iPhone

醒醒

26

jimrok

13h 26m ago

1

这个时候，你应该做的是套利，自己买国外模型，其他人用国内的模型，省下的时间喝茶不好吗。国内模型也不是不能用，可以锻炼人的判断力。

27

imagecap

13h 26m ago

自作孽不可活

28

nomansky

13h 25m ago

强就强在不会回复：抱歉我无法回答你的问题

29

charlie21

13h 25m ago

甲：本来就是炼丹性质的工作，如何选购炼丹用煤？
乙：烧这个煤炼出来的丹好，烧这个煤炼出来的丹不好、炼丹速度慢、吃坏了肚子要死人的
甲：haha 反正不是我吃。哪个便宜用哪个

30

wy315700

13h 23m ago

@Sezxy #19

通俗的方法就是先采购国内模型，到时候出 BUG 了，或者进度慢，CTO 问就是国内模型不行。

31

toexplore

13h 21m ago

这个问题 Dario 估计也解释不了

32

unnamedhao

13h 17m ago

不需要研究，回答应该是“可以的”

33

94

13h 16m ago

8

@fiht #15 ，需要看你们使用 AI 的定位和用途是什么。如果一味的追求 Frontier 并不一定符合公司对于 AI 的定位，容易大炮打蚊子。
是日常开发工作中当成初中级开发来用，还是在遇到一些复杂问题时当成精通领域的资深开发来解决问题。

按照我们整体的体验来看结论是：日常业务的开发，国内的模型完全够用的。
如果是需要用来解决一些疑难问题，同时自己没有对应领域的知识，那么国内模型就很难满足那种“指哪打哪”的爽快感，容易出现一两个小时投入进去啥产出都没有。

34

javalaw2010

13h 13m ago

整理几个最权威的 leaderboard, 将数据可量化的提供到领导面前，除此以外，再以实际的场景举例说明海外顶尖模型的性价比，最后，再给到领导一个可选的国产替代方案。

35

312ybj

13h 13m ago

直接做两个 html 给他们看效果就行了，要不要看看我的 ccmax 网址：aHR0cHM6Ly9hbnl0b2tlbnMuY2Mv

36

SilenceLL

13h 12m ago

我们当时是拿我们的项目，定义了一个复杂的任务，基本影响整个系统的那种任务。然 ai 去做，拿结果说话。

37

baizhu

13h 8m ago

你让你们老板看看 spacex 发射的火箭数量，再看看国内航天发射的火箭数量

38

coryxu

13h 4m ago

1

我也遇到你这种情况，CTO 也是不懂的，他平时不写代码不知道哪个好用，平时也是问豆包做 PPT 的。
我最后是用表格同一个编码问题，用国内模型，和国外模型的效果对比，让整个开发团队过来看哪个模型好，差距有多大，并提出来让大家去试用。你尽量不要说太多，让大家去说。
最终采购了 GPT

39

kuhung

13h 0m ago

一分钱一分货，要不然就上两套让大家看看调用量和采纳率。

40

Seck

12h 55m ago

1

这有啥好解释的

你就说复杂的需求，国内模型搞不定，国外的可以搞定

不用，就是搞不定

把话说死

和老板说话，目的是关键而不是态度

41

xixiv5

12h 53m ago

当你在医院选国产货的时候 AI 就可以选国内模型

42

zlo309618100

12h 43m ago

基于业务场景搭一个基准测试，看一下各家模型的智力水平吧。
如果国内模型能够满足你们的业务诉求，那在老板的角度也没必要采购国外的模型。

43

lswlray

12h 43m ago

2

[你想做一笔财务预算采购国外厂商的模型加速研发]

出发点就错了

44

THESDZ

12h 42m ago

3

一笔财务预算采购国外厂商的模型加速研发

你不是做决策的，你是列调查结果的，拿出数据和政策风险，由上面的人决策。
其他的不是你考虑的。

45

tcper

12h 41m ago

1

你老板想听到的就是：国内国外差的不多

46

expression

12h 41m ago

如果你都说不出来具体的差异，那就代表这个差异和你们无关，随便选就行

47

nb85144

12h 40m ago

如果能满足需求，哪个便宜用哪个

这是多数公司的采购策略不需要任何解释

48

rammiah

12h 39m ago

这个得量化对比，只靠嘴是不行的，拿出你们的测试用例用国内外大模型都跑一遍，看耗时，正确率，token 消耗，价格就行了，如果你们老板看了之后能接收国产那就选国产吧

49

sunpj

12h 39m ago

cto 是个管理岗位。。不是技术岗位。。

50

bigLinux

12h 27m ago

这个论坛的回复似乎都看不起国产模型，这也是一种自我贬低，考虑到合规问题，其实可以用国产的模型，大多数人用国产模型就够用了，鼓吹国外模型的人，怕不是有一种莫名的优越感，觉得自己用上了国外模型就很高级。

51

Muniesa

12h 20m ago

强在复杂、小众需求，如果是一句话许愿式编程，国外模型可以直接生成出一个还凑合的结果，国内模型可能会有各种小问题。但如果业务需求没那么复杂，事先给模型制定好计划，其实差距并不大。

至于说「强就强在不会回复：抱歉我无法回答你的问题」，这明明是国内模型的强项吧，claude 和 gpt 都会拒绝甚至封号的逆向，国内模型直接就干。

52

peter986

12h 19m ago

说实话，国外模型真没比国内模型强多少，现在 deepseekv4 和 glm 都是很强的，不必 claude 差多少，那些吹国外模型牛逼的，都是带上滤镜了

53

a280807225

12h 16m ago

@peter986 的确是这样遥遥领先

54

yufeng0681

12h 14m ago

1

你有先入为主的观念了（可能一开始就用了国外大模型）
公司用，和你个人用是两回事，考虑的维度会多很多；你还要通俗的解释，这又不是和一个朋友，网友推荐大模型。
这种调研报告，就应该专项去做，还要各种数据验证，可持续验证（毕竟大模型还在快速迭代）。

我从成本这一个维度看，就能看到：80%的场景用便宜模型，20%的场景用能破局的模型。这样成本能降低

55

bush911

12h 4m ago via Android

@fiht #15 告诉他：实践是检验真理的唯一标准

56

boogoogle

12h 4m ago

你得听老板的倾向,老板说哪个好就是哪个好,不然最后出问题都是你背锅.

57

skills

12h 0m ago

https://mp.weixin.qq.com/s/yznqr4EVV_CyU6yEQsSB0g
找这种模型数据排行的文章，然后整理一些给你领导看就 OK 了啊。

58

unusualcat

11h 57m ago

形势一片大好，不是小好，是大好。
弯道超车，遥遥领先。
赢麻了。

59

ooee2016

11h 54m ago

直接问 ai 不就行了

60

Abirdcfly

11h 49m ago

如果 CTO 没有脱离一线，没有完全不懂技术，那实际人家问你就表明了人家的态度了。

61

chniccs

11h 47m ago

为什么要用大模型呢，如果他们不主动要求的话，应该现在工作上就别用，自己的事喜欢啥就用啥

62

la2la

11h 46m ago

这个看预算吧
如果预算充足肯定国外模型啊，预算不充足也没啥好选择的，glm qwen3.6 我感觉编程还可以，没有那么大差距

63

NoCash

11h 44m ago

就是钱的问题，钱的问题不是靠你嘴皮子就能解决的，公司就是没钱

64

unregister

11h 43m ago

你开发组的组长还来问这种问题?你别当组长了

65

lieliew

11h 31m ago

国内是应届大学生，国外是两年工作经验的工程师

66

xFrye

11h 23m ago

怎么 cto 还来问你？

67

mooyo

11h 18m ago

国内模型落后国外两次迭代的差距

68

Fruktozka

11h 13m ago

就用国内的，要不后面一堆合规和稳定性的事情都是你的事情

69

Liftman

11h 8m ago

。。。为什么要来问我们？如果你都说不清这么简单的事情，说明你自己也没用过，也不懂技术，何必呢？用用 glm mimo minimax 挺好的。。。

70

gscsnm

11h 2m ago

主要得看你们的业务复杂度。
如果没那么高的话，国内模型就能 ok

如果高的话，国内就废废

71

chunqiuyiyu

10h 56m ago

就用国内吧，预算低，合法。

72

Nzelites

10h 50m ago

按成本核算国外模型性价比我觉得不咋的平常业务开发你们都做什么自己心里没个数吗 curd 仔国产模型也轻轻松松解决

73

sg552

10h 47m ago

海外的 88 分，国内的 85 分，而且海外的第一名很多时候都被国内的占据。两者效果差不多，但价格上国内是海外的 1/75 ，普遍比国外低很多很多。

国外评分高，不是因为他们牛逼，而是因为显卡没有对他们禁运，没有对他们禁售，他们起步早一点而已。

建议老板直接用国内：
1. 海外不稳定，哪天把我们给封了。
2. 用国内的话就特别舒服，一直用一直舒服，每天用一个亿的 token 也没几个钱儿。
3. 还间接爱国，干死那些跪舔海外的。

74

jadeborner

10h 47m ago

到底哪个是 CTO ？

75

YICHUJIFA

10h 42m ago

不要说用国外模型你们怎样，要给领导分析，用国外模型，领导能获得什么

76

SayHelloHi

10h 37m ago

国外模型：
1 天的工作 1 小时可以完成 😀

77

yolee599

10h 23m ago via Android

加速研发事情做完了最后被裁的还不是自己，让它成为自己的护城河不好吗？其他人都用国内模型，你就偷偷用国外模型，你提前把事情做完了就偷偷摸鱼，偷偷提升自己不行吗？

78

Cmdhelp

10h 13m ago

市值

79

Sezxy

9h 52m ago

@Seck #40 在老板眼里，搞不定就换人

80

xuanbg

9h 38m ago

那就买国内的！

解释个毛线啊

81

jsq2627

9h 30m ago

@sunpj 虽然，但是能问这个问题，明显两耳不闻窗外事

82

smlcgx

9h 26m ago

老板一听国产这么便宜，你说啥都没用

83

tool3d

9h 24m ago

具体看项目了,天天 WEB 内网开发+CURD,纯国产模型也不是不可以.
你要来个高科技创新,那只能国外模型了.

84

robinlovemaggie

9h 13m ago

如果连 CTO 那都需要解释区别，建议跑路~

85

ybybwdwd

9h 9m ago

你们有啥复杂任务需要 chagpt 和 claude ？一般需求明确的任务，国模差距真不大，我司还采购的 lingma 用 qwen3.6plus 呢，配合我自己的 opencode go 的 dsv4 ，日常开发完全足够了，更不用说最新的 glm5.2 、kimi k2.7 编码还比这俩强

86

diudiuu

9h 8m ago

没用过不知道，听说国外的厉害

87

xiaoliuzhenshuai

9h 7m ago

领导说的有道理，平常的垃圾业务需求就直接用国模就行了当然用起来并不便宜

88

lemonfishTBS

9h 7m ago

用国外的模型，你可以裁掉一半人，用国内的模型你还要继续付 5 个人的工资

89

kakki

8h 59m ago

建议大家都用国内的,我一个人用国外的就行.

90

sanqian

8h 54m ago

CTO 问这问题也是人才了

91

thep

8h 47m ago

CTO 和 CFO 都关注，那说明公司对技术没那么激进，说回来其实就是自己想用国外的，自己能兜底就用，否则稳妥就国产

92

wysnxzm

8h 40m ago

怎么通俗地和老板解释：国内的旗舰模型到底弱在哪里？

93

jadewant

8h 29m ago

CFO 问能理解，但是 CTO 问，直接暴露职业能力。

94

f1001

8h 26m ago

别跟老板犟,老板真的在意哪个强会自己去试

95

shenhualv7

8h 16m ago via Android

按我的通俗的说法，就是高中生和大学生的差别，前者知道所学的东西，后者基本上拥有完事的社会观世界观，可以回答学习之外的问题

96

cyrivlclth

8h 8m ago

@ybybwdwd 我也觉得，我一直同时用 glm5.1 和 gpt5.5 进行一些 crud 的开发（反正自己不写一行代码那种），用起来结果大差不差，都是一次性，一个会做错一些，一个会过渡设计多做一些跑偏。反正都需要人再次介入。最终结果都差不多，又不是啥特别困难的需求。整的大家开发都是什么高难度的需求一样，高难度的需求大概率还不是古法上。。。

97

zerovoid

7h 58m ago

CTO 居然还要问你的意见，梦里啥都有啊。

98

Retr0

7h 28m ago

很明显 op 的 token 不够了。这问题你问国外的旗舰模型两个来回就能有完整答案了，跑来这里吊回答

99

lujiaosama

7h 25m ago

你能保证稳定可用吗。看起来国内要稳定用只有投奔中转站这一条路。数据合规都是后话。

100

Smilencer

7h 24m ago

1

自掘坟墓。。。

国内大模型的差距，正是你现在还没被裁的护城河 -- 2026 年 6 月

1 2

❮

❯