V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  qiancheng  ›  全部回复第 1 页 / 共 5 页
回复总数  88
1  2  3  4  5  
从训练模型的原理上来看 tokenizer 对中文和英文编码的 token id 是不一样的,虽然经过 ROPE 位置编码,中英文混合语料训练过,表面上看回答的头头是道,但是中英文的表现会有较大差异。

1 、大家可能记得 llama3/4 在中文上的表现一塌糊涂,但是在英文上的表现尚可
2 、国内的大模型基座训练会增大中文语料比率,以及增加一下中文互联网常见的语料和书籍,所以大家实际在用大模型比如豆包,千问,deepseek 时候会感觉中文的思考能力和回答的模式接近正常人,这是因为在 post-training 以及 RL 阶段对齐了中国人在日常的常见场景,这也是为什么有的会给你推荐中药和中医的原理,以及算命,阴阳等。

不要忘记大模型发展到如此智能的当下,依然建立在概率论和语料的基础上的。

我赞同 #16 rick13 的观点,如果你能引导 AI 用英语思维,critic thinking 这是最好,但不完全代表你用纯英文问国内的 GPT 就能获得比中文 prompt 得到更好的更高质量的回答,因为国内的 GPT 在英文语料上的训练比率较低,且没有后续多阶段精调。

如果你希望 AI 能更好辅助你,首先你自己要能够 critic thinking ,并验证信息源,尽量不带偏见使用开放式问答,多角度反复尝试多个 GPT 。
Zoo
5 天前
回复了 silencelixing 创建的主题 Mac mini Mac mini 适合跑什么本地模型?
Everything -> HoudahSpot
win + V -> Maccy
say good job
20 天前
回复了 Jacefan 创建的主题 剧集 推荐一些美剧 xdm
fall captain
2025 年 12 月 24 日
回复了 BearPear 创建的主题 职场话题 找工作的时候怎么能看出一个公司值不值得去呢?
大小周应该在入职前,至少提前明确并慎重告知提醒至少 2 次以上。 广州深圳的上下班时间有加班我可以姑且认为是普遍情况,但是大小周不在此列。

面试时候建议去公司借用一下厕所,第一了解同事工位和坑位情况,我非常同意 @my101du 说的,厕所是一个公司的良心,如果坑位比较紧张或者坑位比较脏,说明这个公司的行政和福利基本没有。就不要考虑了

还有可以在脉脉找人了解公司的情况,比如茶水间/微波炉/冰箱/休息区/卫生间等等,一般会在脉脉吐槽


#13
2025 年 12 月 23 日
回复了 capgrey 创建的主题 Apple 实用主义向, Apple 产品的几个「最早」梳理
Apple 产品的几个「最早」

苹果产品中的几个最早期版本总结如下:

最早的 5G 手机:iPhone 12 mini
最早的高刷手机:iPhone 13 Pro
最早的 USB-C 接口手机:iPhone 15
最早的高刷+USB-C 手机:iPhone 15 Pro
最早的 ARM64 芯片笔记本:MacBook Pro 2020 M1
最早的高刷笔记本:MacBook Pro 2021 M1Pro 14.2 英寸
2022 MacBook Air 的外观变化:外观改动

这些信息可用于二手购买决策,欢迎更多补充。
2025 年 12 月 19 日
回复了 JeffyChen 创建的主题 汽车 旧油车车机有什么推荐改造方式?
#5 @zh379 是什么型号? 全志 linux t113-s3/s4 是吗?
2025 年 12 月 12 日
回复了 haoe06644 创建的主题 职场话题 大佬们,深圳做过 AI 产品的 Python 是不是比较少呀
多得是啊 ai native python
2025 年 12 月 9 日
回复了 leoztodo 创建的主题 职场话题 工作不太忙的时候,你们都怎么偷偷学习的?
#5
Learn English, but not in a vacuum. Pair it with something you care about and learn both together. If English seems unhelpful, you probably haven’t mastered it. When you do, you’ll realize it’s one of the most powerful skills for your life and career.
2025 年 12 月 5 日
回复了 qiancheng 创建的主题 宽带症候群 关于家庭外网的几个核心困惑问题
@xpn282 也自己搞过 clash 规则,主要的问题其实就是经常需要更新规则,或者发现一个新的域名需要处理,用 GEO 分流也不一定准。主打就是一个折腾,需要时常维护。
2025 年 12 月 2 日
回复了 thxgod 创建的主题 iPhone 为什么 icloud 的同步能如此地慢?
@jisongkun how much is about the 8TB mbp?
2025 年 11 月 19 日
回复了 CoderLife 创建的主题 Apple Mac Mini 硬盘买小了 现在用两天就要清数据, 怎么破
系统装在外置硬盘 SSD 里,从外置硬盘作为启动首选项
2025 年 11 月 16 日
回复了 tiancaiXD 创建的主题 生活 各省婚礼彩礼多少钱?
回礼吗
2025 年 11 月 14 日
回复了 Untamed 创建的主题 问与答 虚心求教: AI 编程 0-1 工作流+独立落地指南
如果有一个具体的案例,这些问题都可能找到一些方法论。说 AGI 没有到来就是因为暂时还不能解决所有的场景,或者说在通用场景不如垂直模型 + if—else 来得 acc 更高。
1  2  3  4  5  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1169 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 53ms · UTC 17:53 · PVG 01:53 · LAX 09:53 · JFK 12:53
♥ Do have faith in what you're doing.