fiht

怎么通俗地和老板解释:国外的旗舰模型到底强在哪里?

  •  
  •   fiht · 14h 5m ago · 11198 views

    你是研发团队的组长,你想做一笔财务预算采购国外厂商的模型加速研发。 CTO 和 CFO 都过来问了:“国内模型和国外模型编程上有多少差别?买国内的 Coding Plan 可以吗?”

    你的回答:

    110 replies    2026-06-15 21:52:00 +08:00
    1  2  
    idealhs
        1
    idealhs  
       13h 58m ago   ❤️ 1
    一分钱一分货
    280303
        2
    280303  
       13h 57m ago
    让 CTO 自己去试试
    akorn
        3
    akorn  
       13h 57m ago
    你是在问 ai 吗
    turing518
        4
    turing518  
       13h 56m ago
    不如让你想买的国外旗舰大模型做一下自我推荐?
    xtreme1
        5
    xtreme1  
       13h 54m ago   ❤️ 4
    CTO 干啥吃的
    Yasuke
        6
    Yasuke  
       13h 51m ago   ❤️ 2
    CTO 是完全脱离技术了吗
    syubo2810
        7
    syubo2810  
       13h 51m ago   ❤️ 1
    其实还是钱的问题和风险问题,国外的怎么保证稳定性,差距是不是大到必须要用国外的,即使不稳定价格也贵,还有政策风险
    Charbo
        8
    Charbo  
       13h 47m ago   ❤️ 16
    不知道还以为你是 CTO
    wqhui
        9
    wqhui  
       13h 46m ago
    分几个组用不同模型做差不多难度的需求,对比需要几轮完成、单次采纳率是多少
    wangxinpier
        10
    wangxinpier  
       13h 45m ago
    哈哈,效率高了,人员就过剩了,减员后,成本下降,你为公司着想,还得说服各方,看来还是时机未到呀
    zlhsvc
        11
    zlhsvc  
       13h 44m ago   ❤️ 1
    CTO 干啥吃的 +1
    Sezxy
        12
    Sezxy  
       13h 43m ago
    你可以跟 cto 说,你用国外模型一人能顶 10 人,用国内模型,一人能顶一人
    crocoBaby
        13
    crocoBaby  
       13h 43m ago
    CTO 咨询你技术意见?????
    yanest
        14
    yanest  
       13h 42m ago
    电脑也应该换国产芯片的
    fiht
        15
    fiht  
    OP
       13h 42m ago   ❤️ 1
    CTO 吃饭的时候偶遇了你:
    “小刘啊,听说国外大模型发展得很好,但是我看一些 benchmark ,也就比国内的模型高几个点啊”

    你的回答:
    wy315700
        16
    wy315700  
       13h 41m ago
    @Sezxy 话别说太满,到时候 CTO 一个人出 10 个人的活。
    fredweili
        17
    fredweili  
       13h 40m ago
    这是在问么?回答可以就行了
    MiHwAppleTslFan
        18
    MiHwAppleTslFan  
       13h 40m ago   ❤️ 12
    99%和 90%的差别不是 9%,是 1000%,一个需要改 1%,一个需要改 10%
    同理,99%和 99.9%也是
    Sezxy
        19
    Sezxy  
       13h 39m ago
    @wy315700 #16 反正要通俗
    exploretheworld
        20
    exploretheworld  
       13h 39m ago via Android
    苹果和安卓
    systemGuest
        21
    systemGuest  
       13h 37m ago   ❤️ 19
    我强烈建议你,尽量推动他们使用国内模型,合理合法合规,实在犹豫用爱国去绑架,然后你自己用国外的。
    xyooyx
        22
    xyooyx  
       13h 35m ago
    主要是在 Long-horizon 任务中
    Rorysky
        23
    Rorysky  
       13h 34m ago
    中国人使用美国模型违反美国法律
    polo3584
        24
    polo3584  
       13h 32m ago
    让老板自己去试
    billzhuang
        25
    billzhuang  
       13h 27m ago via iPhone
    醒醒
    jimrok
        26
    jimrok  
       13h 26m ago   ❤️ 1
    这个时候,你应该做的是套利,自己买国外模型,其他人用国内的模型,省下的时间喝茶不好吗。国内模型也不是不能用,可以锻炼人的判断力。
    imagecap
        27
    imagecap  
       13h 26m ago
    自作孽不可活
    nomansky
        28
    nomansky  
       13h 25m ago
    强就强在不会回复:抱歉我无法回答你的问题
    charlie21
        29
    charlie21  
       13h 25m ago
    甲:本来就是炼丹性质的工作,如何选购炼丹用煤?
    乙:烧这个煤炼出来的丹好,烧这个煤炼出来的丹不好、炼丹速度慢、吃坏了肚子要死人的
    甲:haha 反正不是我吃。哪个便宜用哪个
    wy315700
        30
    wy315700  
       13h 23m ago
    @Sezxy #19

    通俗的方法就是先采购国内模型,到时候出 BUG 了,或者进度慢,CTO 问就是国内模型不行。
    toexplore
        31
    toexplore  
       13h 21m ago
    这个问题 Dario 估计也解释不了
    unnamedhao
        32
    unnamedhao  
       13h 17m ago
    不需要研究,回答应该是“可以的”
    94
        33
    94  
       13h 16m ago   ❤️ 8
    @fiht #15 ,需要看你们使用 AI 的定位和用途是什么。如果一味的追求 Frontier 并不一定符合公司对于 AI 的定位,容易大炮打蚊子。
    是日常开发工作中当成初中级开发来用,还是在遇到一些复杂问题时当成精通领域的资深开发来解决问题。

    按照我们整体的体验来看结论是:日常业务的开发,国内的模型完全够用的。
    如果是需要用来解决一些疑难问题,同时自己没有对应领域的知识,那么国内模型就很难满足那种“指哪打哪”的爽快感,容易出现一两个小时投入进去啥产出都没有。
    javalaw2010
        34
    javalaw2010  
       13h 13m ago
    整理几个最权威的 leaderboard, 将数据可量化的提供到领导面前,除此以外,再以实际的场景举例说明海外顶尖模型的性价比,最后,再给到领导一个可选的国产替代方案。
    312ybj
        35
    312ybj  
       13h 13m ago
    直接做两个 html 给他们看效果就行了, 要不要看看我的 ccmax 网址:aHR0cHM6Ly9hbnl0b2tlbnMuY2Mv
    SilenceLL
        36
    SilenceLL  
       13h 12m ago
    我们当时是拿我们的项目,定义了一个复杂的任务,基本影响整个系统的那种任务。然 ai 去做,拿结果说话。
    baizhu
        37
    baizhu  
       13h 8m ago
    你让你们老板看看 spacex 发射的火箭数量,再看看国内航天发射的火箭数量
    coryxu
        38
    coryxu  
       13h 4m ago   ❤️ 1
    我也遇到你这种情况,CTO 也是不懂的,他平时不写代码不知道哪个好用,平时也是问豆包做 PPT 的。
    我最后是用表格同一个编码问题,用国内模型,和国外模型的效果对比,让整个开发团队过来看哪个模型好,差距有多大,并提出来让大家去试用。你尽量不要说太多,让大家去说。
    最终采购了 GPT
    kuhung
        39
    kuhung  
       13h 0m ago
    一分钱一分货,要不然就上两套让大家看看调用量和采纳率。
    Seck
        40
    Seck  
       12h 55m ago   ❤️ 1
    这有啥好解释的

    你就说复杂的需求,国内模型搞不定,国外的可以搞定

    不用,就是搞不定

    把话说死

    和老板说话,目的是关键而不是态度
    xixiv5
        41
    xixiv5  
       12h 53m ago
    当你在医院选国产货的时候 AI 就可以选国内模型
    zlo309618100
        42
    zlo309618100  
       12h 43m ago
    基于业务场景搭一个基准测试,看一下各家模型的智力水平吧。
    如果国内模型能够满足你们的业务诉求,那在老板的角度也没必要采购国外的模型。
    lswlray
        43
    lswlray  
       12h 43m ago   ❤️ 2
    [你想做一笔财务预算采购国外厂商的模型加速研发]

    出发点就错了
    THESDZ
        44
    THESDZ  
       12h 42m ago   ❤️ 3
    一笔财务预算采购国外厂商的模型加速研发

    你不是做决策的,你是列调查结果的,拿出数据和政策风险,由上面的人决策。
    其他的不是你考虑的。
    tcper
        45
    tcper  
       12h 41m ago   ❤️ 1
    你老板想听到的就是:国内国外差的不多
    expression
        46
    expression  
       12h 41m ago
    如果你都说不出来具体的差异,那就代表这个差异和你们无关,随便选就行
    nb85144
        47
    nb85144  
       12h 40m ago
    如果能满足需求,哪个便宜用哪个

    这是多数公司的采购策略不需要任何解释
    rammiah
        48
    rammiah  
       12h 39m ago
    这个得量化对比,只靠嘴是不行的,拿出你们的测试用例用国内外大模型都跑一遍,看耗时,正确率,token 消耗,价格就行了,如果你们老板看了之后能接收国产那就选国产吧
    sunpj
        49
    sunpj  
       12h 39m ago
    cto 是个管理岗位。。不是技术岗位。。
    bigLinux
        50
    bigLinux  
       12h 27m ago
    这个论坛的回复似乎都看不起国产模型,这也是一种自我贬低,考虑到合规问题,其实可以用国产的模型,大多数人用国产模型就够用了,鼓吹国外模型的人,怕不是有一种莫名的优越感,觉得自己用上了国外模型就很高级。
    Muniesa
        51
    Muniesa  
       12h 20m ago
    强在复杂、小众需求,如果是一句话许愿式编程,国外模型可以直接生成出一个还凑合的结果,国内模型可能会有各种小问题。但如果业务需求没那么复杂,事先给模型制定好计划,其实差距并不大。

    至于说「强就强在不会回复:抱歉我无法回答你的问题」,这明明是国内模型的强项吧,claude 和 gpt 都会拒绝甚至封号的逆向,国内模型直接就干。
    peter986
        52
    peter986  
       12h 19m ago
    说实话, 国外模型真没比国内模型强多少, 现在 deepseekv4 和 glm 都是很强的, 不必 claude 差多少, 那些吹国外模型牛逼的,都是带上滤镜了
    a280807225
        53
    a280807225  
       12h 16m ago
    @peter986 的确是这样 遥遥领先
    yufeng0681
        54
    yufeng0681  
       12h 14m ago   ❤️ 1
    你有 先入为主的观念了(可能一开始就用了国外大模型)
    公司用,和你个人用是两回事,考虑的维度会多很多; 你还要通俗的解释,这又不是和一个朋友,网友推荐大模型。
    这种调研报告,就应该专项去做,还要各种数据验证, 可持续验证(毕竟大模型还在快速迭代)。

    我从成本这一个维度看, 就能看到:80%的场景用便宜模型,20%的场景用能破局的模型。 这样成本能降低
    bush911
        55
    bush911  
       12h 4m ago via Android
    @fiht #15 告诉他:实践是检验真理的唯一标准
    boogoogle
        56
    boogoogle  
       12h 4m ago
    你得听老板的倾向,老板说哪个好就是哪个好,不然最后出问题都是你背锅.
    skills
        57
    skills  
       12h 0m ago
    https://mp.weixin.qq.com/s/yznqr4EVV_CyU6yEQsSB0g
    找这种模型数据排行的文章,然后整理一些给你领导看就 OK 了啊。
    unusualcat
        58
    unusualcat  
       11h 57m ago
    形势一片大好,不是小好,是大好。
    弯道超车,遥遥领先。
    赢麻了。
    ooee2016
        59
    ooee2016  
       11h 54m ago
    直接问 ai 不就行了
    Abirdcfly
        60
    Abirdcfly  
       11h 49m ago
    如果 CTO 没有脱离一线,没有完全不懂技术,那实际人家问你就表明了人家的态度了。
    chniccs
        61
    chniccs  
       11h 47m ago
    为什么要用大模型呢,如果他们不主动要求的话,应该现在工作上就别用,自己的事喜欢啥就用啥
    la2la
        62
    la2la  
       11h 46m ago
    这个看预算吧
    如果预算充足肯定国外模型啊,预算不充足也没啥好选择的,glm qwen3.6 我感觉编程还可以,没有那么大差距
    NoCash
        63
    NoCash  
       11h 44m ago
    就是钱的问题,钱的问题不是靠你嘴皮子就能解决的,公司就是没钱
    unregister
        64
    unregister  
       11h 43m ago
    你开发组的组长还来问这种问题?你别当组长了
    lieliew
        65
    lieliew  
       11h 31m ago
    国内是应届大学生,国外是两年工作经验的工程师
    xFrye
        66
    xFrye  
       11h 23m ago
    怎么 cto 还来问你?
    mooyo
        67
    mooyo  
       11h 18m ago
    国内模型落后国外两次迭代的差距
    Fruktozka
        68
    Fruktozka  
       11h 13m ago
    就用国内的,要不后面一堆合规和稳定性的事情都是你的事情
    Liftman
        69
    Liftman  
       11h 8m ago
    。。。为什么要来问我们?如果你都说不清这么简单的事情,说明你自己也没用过,也不懂技术,何必呢?用用 glm mimo minimax 挺好的。。。
    gscsnm
        70
    gscsnm  
       11h 2m ago
    主要得看你们的业务复杂度。
    如果没那么高的话,国内模型就能 ok

    如果高的话,国内就废废
    chunqiuyiyu
        71
    chunqiuyiyu  
       10h 56m ago
    就用国内吧,预算低,合法。
    Nzelites
        72
    Nzelites  
       10h 50m ago
    按成本核算国外模型性价比我觉得不咋的 平常业务开发你们都做什么自己心里没个数吗 curd 仔国产模型也轻轻松松解决
    sg552
        73
    sg552  
       10h 47m ago
    海外的 88 分,国内的 85 分,而且海外的第一名很多时候都被国内的占据。两者效果差不多,但价格上国内是海外的 1/75 ,普遍比国外低很多很多。

    国外评分高,不是因为他们牛逼,而是因为显卡没有对他们禁运,没有对他们禁售,他们起步早一点而已。

    建议老板直接用国内:
    1. 海外不稳定,哪天把我们给封了。
    2. 用国内的话就特别舒服,一直用一直舒服,每天用一个亿的 token 也没几个钱儿。
    3. 还间接爱国,干死那些跪舔海外的。
    jadeborner
        74
    jadeborner  
       10h 47m ago
    到底哪个是 CTO ?
    YICHUJIFA
        75
    YICHUJIFA  
       10h 42m ago
    不要说用国外模型你们怎样,要给领导分析,用国外模型,领导能获得什么
    SayHelloHi
        76
    SayHelloHi  
       10h 37m ago
    国外模型:
    1 天的工作 1 小时可以完成 😀
    yolee599
        77
    yolee599  
       10h 23m ago via Android
    加速研发事情做完了最后被裁的还不是自己,让它成为自己的护城河不好吗?其他人都用国内模型,你就偷偷用国外模型,你提前把事情做完了就偷偷摸鱼,偷偷提升自己不行吗?
    Cmdhelp
        78
    Cmdhelp  
       10h 13m ago
    市值
    Sezxy
        79
    Sezxy  
       9h 52m ago
    @Seck #40 在老板眼里,搞不定就换人
    xuanbg
        80
    xuanbg  
       9h 38m ago
    那就买国内的!

    解释个毛线啊
    jsq2627
        81
    jsq2627  
       9h 30m ago
    @sunpj 虽然,但是能问这个问题,明显两耳不闻窗外事
    smlcgx
        82
    smlcgx  
       9h 26m ago
    老板一听国产这么便宜,你说啥都没用
    tool3d
        83
    tool3d  
       9h 24m ago
    具体看项目了,天天 WEB 内网开发+CURD,纯国产模型也不是不可以.
    你要来个高科技创新,那只能国外模型了.
    robinlovemaggie
        84
    robinlovemaggie  
       9h 13m ago
    如果连 CTO 那都需要解释区别,建议跑路~
    ybybwdwd
        85
    ybybwdwd  
       9h 9m ago
    你们有啥复杂任务需要 chagpt 和 claude ?一般需求明确的任务,国模差距真不大,我司还采购的 lingma 用 qwen3.6plus 呢,配合我自己的 opencode go 的 dsv4 ,日常开发完全足够了,更不用说最新的 glm5.2 、kimi k2.7 编码还比这俩强
    diudiuu
        86
    diudiuu  
       9h 8m ago
    没用过不知道,听说国外的厉害
    xiaoliuzhenshuai
        87
    xiaoliuzhenshuai  
       9h 7m ago
    领导说的有道理,平常的垃圾业务需求就直接用国模就行了 当然用起来并不便宜
    lemonfishTBS
        88
    lemonfishTBS  
       9h 7m ago
    用国外的模型,你可以裁掉一半人,用国内的模型你还要继续付 5 个人的工资
    kakki
        89
    kakki  
       8h 59m ago
    建议大家都用国内的,我一个人用国外的就行.
    sanqian
        90
    sanqian  
       8h 54m ago
    CTO 问这问题 也是人才了
    thep
        91
    thep  
       8h 47m ago
    CTO 和 CFO 都关注,那说明公司对技术没那么激进,说回来其实就是自己想用国外的,自己能兜底就用,否则稳妥就国产
    wysnxzm
        92
    wysnxzm  
       8h 40m ago
    怎么通俗地和老板解释:国内的旗舰模型到底弱在哪里?
    jadewant
        93
    jadewant  
       8h 29m ago
    CFO 问能理解,但是 CTO 问,直接暴露职业能力。
    f1001
        94
    f1001  
       8h 26m ago
    别跟老板犟,老板真的在意哪个强会自己去试
    shenhualv7
        95
    shenhualv7  
       8h 16m ago via Android
    按我的通俗的说法,就是高中生和大学生的差别,前者知道所学的东西,后者基本上拥有完事的社会观世界观,可以回答学习之外的问题
    cyrivlclth
        96
    cyrivlclth  
       8h 8m ago
    @ybybwdwd 我也觉得,我一直同时用 glm5.1 和 gpt5.5 进行一些 crud 的开发(反正自己不写一行代码那种),用起来结果大差不差,都是一次性,一个会做错一些,一个会过渡设计多做一些跑偏。反正都需要人再次介入。最终结果都差不多,又不是啥特别困难的需求。整的大家开发都是什么高难度的需求一样,高难度的需求大概率还不是古法上。。。
    zerovoid
        97
    zerovoid  
       7h 58m ago
    CTO 居然还要问你的意见,梦里啥都有啊。
    Retr0
        98
    Retr0  
       7h 28m ago
    很明显 op 的 token 不够了。这问题你问国外的旗舰模型两个来回就能有完整答案了,跑来这里吊回答
    lujiaosama
        99
    lujiaosama  
       7h 25m ago
    你能保证稳定可用吗。看起来国内要稳定用只有投奔中转站这一条路。数据合规都是后话。
    Smilencer
        100
    Smilencer  
       7h 24m ago   ❤️ 1
    自掘坟墓。。。

    国内大模型的差距,正是你现在还没被裁的护城河 -- 2026 年 6 月
    1  2  
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3038 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 335ms · UTC 14:56 · PVG 22:56 · LAX 07:56 · JFK 10:56
    ♥ Do have faith in what you're doing.