V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Plutooo  ›  全部回复第 3 页 / 共 13 页
回复总数  250
1  2  3  4  5  6  7  8  9  10 ... 13  
看来 GPU 算力大迭代之前,这一代大模型应该是难有较大进步了
看图和描述没感觉跟内存有多大关系,可以观察下 gc 日志或者 jstat 看下 gc 频率
线程池需要放全局算一个,线程池的参数需要调大
从你的描述中一次请求需要下发 200 个请求到下游,你的代码需要等 200 个请求都执行完成一次请求才会结束
而最大只能同时执行 14 个任务,理论情况抛开 cpu 上下文切换等耗时,你的一次请求完成时间大概是 一次请求的时间*( 200/14 ),可以大概推算下跟这个值对不对
77 天前
回复了 ottoli 创建的主题 职场话题 offer 二选一,路过的朋友帮忙出出主意
12w 在上海只靠自己挺难的
78 天前
回复了 zskr 创建的主题 酷工作 滴滴国际化金融大量岗位招聘,组内直推
@zskr 投了三天没反应的话可以认为是被刷了吗
81 天前
回复了 wisej 创建的主题 Windows 求助: windows 超大虚拟内存(swap) 泄漏?
开始-资源监视器-内存-提交,看看是哪个进程的问题吧
@pkoukk #52 我记得这个吞吐量说的都是单机情况
消息队列异步消费+1
网传 kafka 吞吐能 17w ,rocketmq 能 11w ,感觉完全没啥问题
82 天前
回复了 kushu001 创建的主题 程序员 关于软件开发中的跨地区的时区问题
你看到的方案没问题,服务端只返回时间戳给客户端,客户端根据用户时区自行解析
85 天前
回复了 zskr 创建的主题 酷工作 滴滴国际化金融大量岗位招聘,组内直推
要求过往业务对口吗
@kchenzhi 你好,可以请教一下 http outputstream 流式返回主要是通过什么实现吗,是 rpc 有类似的实现么
周末团建从来不去,周末团建跟加班没区别,我又不是卖身给公司
两个接口各干各的会有什么问题吗
不是组内直招的内推没啥意义
123 天前
回复了 wangfenjin 创建的主题 程序员 现在国内最好的技术博客平台是什么?
每个平台都放一份,再搞个公众号
124 天前
回复了 reDesign 创建的主题 职场话题 程序员会是最先被 ai 取代的职业吗?
个人认为会是翻译,等国产 AI 出类似高级语音的模式,同声传译估计会舒服很多
把 B 服务当成直接从数据库查不也是存在一样的问题么,还是说担心 B 服务的内存占用
1  2  3  4  5  6  7  8  9  10 ... 13  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5548 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 36ms · UTC 06:49 · PVG 14:49 · LAX 22:49 · JFK 01:49
Developed with CodeLauncher
♥ Do have faith in what you're doing.