locoz 最近的时间轴更新
locoz

locoz

V2EX 第 224012 号会员,加入于 2017-04-01 11:56:09 +08:00
今日活跃度排名 12482
根据 locoz 的设置,主题列表只有在你登录之后才可查看
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
locoz 最近回复了
5 小时 24 分钟前
回复了 punu 创建的主题 生活 如何调整“开车骂行人,走路骂司机”的心态
不用调整,世界上本来就不缺傻逼,你在哪个角度都会碰到傻逼,这是很正常的现象。说白了,你骂的只是那个被你碰到的傻逼而已。
GPT4 写小说就一坨屎,要写就用 Claude 系列的,哪怕是第一代都比 GPT4 好
@matrix1010 #22 你把事情想复杂了,自己去搜索、根据搜索到的页面内容进行归纳总结和找到需要的信息、自己添加日志进行 debug 、自动调用命令行、自动通过特定方式部署程序等模拟人机交互的事情,都是只需要做好操作接口,并且在 prompt 中告诉语言模型可以这么做,就能轻松做到的事情,这方面反而是这整个产品中最简单、最没有门槛的。

因为做到这些事情的核心在于决策能力,而决策能力来源于语言模型,像 GPT4 、Claude2 这种头部级别的大语言模型本身就具备做出这种决策的能力,并且之前出现过的很多让 AI 进行自动化操作的产品都是这么做的,包括 ChatGPT 上的插件功能本质上也就是这么做的。
@matrix1010 #19 小公司没有任何 [自己训练一个能跟 GPT4 之类头部级别的模型 PK 的模型] 的可能性,所以为了效果好只能是基于 GPT4 或者 Claude2/3 这种头部的大模型来实现,否则模型的基础能力差会导致很多问题完全解决不了。

另外,新智元 介绍 Devin 的文章最后有提到:“CEO Wu 并没有详细说明他们的智能体背后使用的 AI 技术,只是笼统地解释说,团队找到了将大语言模型(例如 OpenAI 的 GPT-4 )与强化学习技术相结合的独特方法。”,很显然也只能是行业头部的大模型了。

效果方面我觉得没什么好对比的,根据官方的说法和演示视频中的效果来看,大概率是加了个提取关键信息的模型,代替了人提取关键信息给 AI 的步骤,做到在使用尽可能压缩上下文的情况下丰富信息量,自动化地让 AI 在输入信息密度极高的情况下输出东西,这效果当然会比上下文长度受限、可输入信息不全的情况下只能直接丢问题给 AI 的情况要好。

但其实随着像 Claude 3 这种支持更长上下文的模型进一步发展,未来完全可以在不需要那么精细地提取关键信息的情况下让 AI 得到所需的所有信息,哪些文件相关那就直接把文件都丢给 AI 就行了。在这个前提下,Devin 做的这种优化其实优势是会越来越小的。
@pixelbook #11 在决策层被 AI 取代之前,底下干活的早就被取代完了。决策层最核心的能力之一就是想法要具有前瞻性、能看透一个甚至多个行业找到最合适的路线,指望靠着以大众发布的内容为主的数据去训练出一个能站在更高的角度看问题的 AI ,在当下属于是做梦。当下这种训练方式能做到的 AI 仅限于把客观的信息概括出来,在没有人去引导的情况下是完全做不到跨多行业“思考”出能称得上是“决策”的东西的。
@matrix1010 #8 不至于的,都是依赖别人的模型实现的效果,在用的模型一致的情况下做不到多大的能力差距。
有些类型的问题,当下的语言模型搞不定就是搞不定,哪怕是人专门去精选输入内容和调整 prompt 都很难搞定,这是模型基本能力的问题,再优化也解决不了。
决策能力方面看起来是模型的问题,可以试试在用 Claude 3 的情况下能达到什么程度,我现在让 AI 改代码、加功能都是几个文件直接丢过去了,可工作的上下文长度长带来的效果极其明显。
飞书也有搞这些,还请人做了好多软广。但说到底这种功能实现起来都很简单,核心问题还是数据安全和隐私问题,解决不了这个问题就永远没法推广起来,这不是说不考虑就能不考虑的…
3 天前
回复了 nullo 创建的主题 宽带症候群 代理服务器
@nullo #9 那你可以选择用 v2ray 之类的解决问题
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5341 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 09:32 · PVG 17:32 · LAX 02:32 · JFK 05:32
Developed with CodeLauncher
♥ Do have faith in what you're doing.