V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  rogerer  ›  全部回复第 1 页 / 共 1 页
回复总数  15
1 小时 15 分钟前
回复了 est 创建的主题 分享发现 浏览器 JS 都支持原生中文分词了
@rogerer 实际上,分词并不能只通过词频去计算,特别是对于中文,错误率会很高。更精准的解决方案是让一个轻巧的 word2vec/bert based model 跑在前端,去实时地做分割。
1 小时 17 分钟前
回复了 est 创建的主题 分享发现 浏览器 JS 都支持原生中文分词了
@eason1874 浏览器提供的这个功能还是太粗糙了,比如你的这句话「浏览器鼠标双击选中文本就是自动分词的」,浏览器把「中文」当做一个词分割出来,应该是用高频词去贪心,并没用用到 context aware 的技术
我觉得要做到用英语工作没有那么难,用不到太多高深的表达
最小二乘法因为涉及到矩阵运算 在高维的时候效率比较低
@debuggerx 没错 如果只是后端偶尔用用 JavaScript 完全没必要去了解它背后的构造 可能 typescript 更适合
266 天前
回复了 CNN 创建的主题 程序员 近视眼,请问蔡司镜片到底值不值得买?
防蓝光镀层很容易就被磨掉了
好奇是什么资料查询需要用到 AI 模型
不好说,ChatGPT 虽然是基于 GPT3.5 这个大模型做的,但是 GPT3.5 并没有直接表现出这样的智能,而是通过 RLHF 等 finetune 技术诱导出来的。我更倾向于认为,模型容量的增长对其能力是线性的增长,基于 GPT4 和 3.5 的两代 ChatGPT 之间的 gap 远远没有 ChatGPT based on GPT3.5 和之前其他对话系统直接的 gap 大。
353 天前
回复了 yagamil 创建的主题 程序员 前端技术过于分裂
熟悉自己业务线上的技术栈,同时对其他技术栈保持了解就行了。技术又学不完。
2023-02-16 00:48:13 +08:00
回复了 Kiwifruit08 创建的主题 程序员 chatGPT 的数学计算貌似存在一些问题
神经网络模型对数字计算规则是不敏感的,比如让它计算一个字符串的长度,它可能会算错。但是如果让他写一段代码去计算字符串长度,然后得到执行结果,它多半就能算对。
@WangLiCha 应该可以把 HTML 对象渲染到 canvas 里,这种轮子比较多。
@logiclee 应该是近世代数部分有讲?不过近世代数一般不作为离散数学看待了。
@wasd6267016 位计算怎么是离散数学呢?
2021-12-29 18:21:31 +08:00
回复了 lslvxy 创建的主题 程序员 30+老鸟想考研了
老板们也不太喜欢成家了的学生。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3049 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 04:38 · PVG 12:38 · LAX 21:38 · JFK 00:38
Developed with CodeLauncher
♥ Do have faith in what you're doing.