V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  LeeReamond  ›  全部回复第 40 页 / 共 86 页
回复总数  1701
1 ... 36  37  38  39  40  41  42  43  44  45 ... 86  
@lower 头疼,关系型数据库还是好用啊,取某范围数据的某字段之类的,还有连表。存 kv 数据或者关系型数据库里存 json 的话相当于抛弃了关系型的好处,所以每次读取一个字段都需要读取并解析全库
2022-04-24 07:53:03 +08:00
回复了 xyzzyssd 创建的主题 硬件 在美国充电宝能回收吗?
之前看到说法似乎锂电池不像铅蓄电池,是可以随便乱扔的
@AS4694lAS4808 读取是很简单的,网关方面更新的话也不用停机,只是不知道数据库应该咋搞
2022-04-24 05:33:24 +08:00
回复了 Richard14 创建的主题 Python 用 VS Code 和 Sublime Text 写 Python 哪个更合适?
@cassyfar 草。。我就是一直不买许可甚至还写工作代码的,犯忌讳了吗
2022-04-22 01:13:37 +08:00
回复了 frankyzf 创建的主题 Python 有适合小孩看的基于 pygame 的书吗
@frankyzf 想学游戏也是直接 unity ,他学不懂你转换成他能理解的语言教他就行了,pygame 整个一个大坑,干啥啥不行,到处都是坑,最后学完除了书上的 demo 以外啥也做不出来,学了当没学。另外我感觉本身学做游戏对孩子的正反馈就很差,主程、美工、音乐、脚本,一个人成年人也拿不出这么多资源,何况小孩,结果就是啥也做不出来
2022-04-21 11:24:50 +08:00
回复了 Richard14 创建的主题 Python FastAPI 跨域工作不正常, CORS 可以支持二级域名吗?
感觉不应该有问题,cors 没有不支持二级域名的说法,nginx 反向代理也不会替换 origin
2022-04-20 22:23:02 +08:00
回复了 DuDuDu0o0 创建的主题 程序员 Python3 列表能被闭包函数使用,整数变量却不行呢?
这是语言特性,具体问题就是子 block 对父 block 中资源的处理方案,各个语言对这三点的处理不尽相同,一般的三个问题是 1 、能否感知,2 、能否读取,3 、能否修改。

就 python 来说是能感知和读取,修改的话会创建副本,所以父 block 不用担心变量被子 block 或调用乱改。可能有一些考量在,虽然目前我个人来说更喜欢闭包可以全权修改的方案。

解决方案一般是 nonlocal 或者传递指针,传递指针是指传进子 block 的是对象或者[0,],子 block 中用 item.property += 1 或者 item[0] += 1 的方式修改。nonlocal 效率更高,不过传指针更灵活一些,性能其实倒是不太有所谓,python 列表单次寻址耗时大概是 20 纳秒左右,在绝大多数场景中这并不是值得在意的开销。
2022-04-20 22:03:26 +08:00
回复了 3dwelcome 创建的主题 算法 构建一个完美无冲突的 hashmap(上图附代码)
我觉得一楼对比效率的图意义不大,毕竟 hashmap 实现的上细节也很丰富,不可一概而论。看了 LZ 之前两个帖子,应该就是传统算法遇到 hash 碰撞则按链表方式保存,二级搜索采用逐个对比,lz 觉得二级搜索可以再加一层 hash ,以此类推。不过从普遍情况讲,google 开源 cityhash 已经是十多年前的事了,哈希发展到 2022 年,快速哈希算法本身效率和碰撞率都很低,普遍应用场景中碰撞本身是少数,所以二级索引中使用全文读生成二级哈希效率会比直接位对比快吗?我看不尽然,举例中使用的 md5 和 sha1 之类的成本极高的算法更不现实了,生产中也没见过这么用的。

再一个如果是从数理逻辑上针对无穷输入的情况设计普遍适用模块,逐位对比当然是永远不会出 bug 的,但是多层哈希法无法保证一定不会出现某对数据所有哈希值相同的情况,哈希算法需要人为设计是有限的,数据是无限的 ,完美看起来反倒没有现在通用方案完美。
2022-04-20 02:26:08 +08:00
回复了 qq249418187 创建的主题 问与答 你是什么时候觉得时间过的飞快?
@enchilada2020 确实,感觉活这么大心理最放不下的还是父母,最惭愧的也是父母,但自己老大不小又一事无成,也没什么能报答的,时间就这么过去了。
2022-04-19 20:24:22 +08:00
回复了 LeeReamond 创建的主题 Python 如何确保一个类是跨进程安全的?
@qbqbqbqb
@fcfangcc
@janus77
@gfreezy
@lolizeppelin
@xuanbg 异步是为了让过程调用受网络管理,需求是 CPU 密集型任务所以使用 fork 多进程,楼上老哥说得对,我试了一下好像真的除了 fd 以外不共享任何数据,跟我记忆中有些偏差(我印象中不特意创建进程间可共享内存也有同指向发生,试了下好像除了虚拟内存表以外物理内存表也全拷贝了,完全的互不相干。。)


关于代码写完过几年看不懂的问题,因为是开源项目其实当时还写了蛮详细的注释的,只不过是用英文写的,现在看注释一大坨一大坨像看论文一样实在不想看。可能这个故事教育我们就是不要好面子写英文,外国人看不看得懂不是最重要的,自己能看懂才是。。
2022-04-19 11:18:40 +08:00
回复了 v2410117 创建的主题 随想 有多少人接受了自己平庸的?
我觉得普通也不代表平庸吧,人在定义自己或他人的社会属性的时候,普通往往跟人掌握的社会资源挂钩。所以往往社会看一个人,看他没钱也没资源,那就是广泛意义上属于普通的那一类。比如年轻人除非是 X 二代继承了资源,否则基本上都是没什么资源的,在社会整体看这些年轻人都很普通。但是这些人里也有一些是活的与众不同的,或者活的精彩的,说他们平庸又有失偏颇了。
2022-04-18 10:37:14 +08:00
回复了 LeeReamond 创建的主题 问与答 TF-IDF 提取大数量的文章关键字时如何解决算不动的问题?
@LeeReamond 实用就是比如我是百度贴吧的维护者,然后我想给每个帖子一楼加个自动摘要之类的。。像简单能学到的 tfidf 似乎完全应付不了百度贴吧的数据量
2022-04-18 10:36:25 +08:00
回复了 LeeReamond 创建的主题 问与答 TF-IDF 提取大数量的文章关键字时如何解决算不动的问题?
@paopjian 有什么其他效果好的 /常见的摘要算法推荐吗?想做点生产能实用的到的东西。。tfidf 其实只是想当个 helloworld 跑,概念和实现啥的都挺简单的,没想到真的跑起来发现完全跑不动。。
2022-04-18 09:27:14 +08:00
回复了 seaswalker 创建的主题 程序员 Windows Java / Python 性能确实拉跨
并不很理解,同样的代码生成的字节码几乎一样,而字节码解释为机器码又几乎一样,一样在 cpu 上跑为啥会慢。。。WSL2 不比原生慢就不错了,还能快 30%我觉得可能是你测试有问题,毕竟听起来你测的是纯计算而不是 IO ,涉及到系统内核 IO 的话倒是由于系统实现不同确实有很大区别。
2022-04-18 09:22:16 +08:00
回复了 LeeReamond 创建的主题 问与答 TF-IDF 提取大数量的文章关键字时如何解决算不动的问题?
@murmur 不是很懂,主要 tf-idf 有个整体词频,我不输入所有贴的话怎么得到总体词频呢。你的意思是取样算出来的和整体也差不多?不过也不知道咋取样啊,比如我导入 A 板块的帖子,那用这个板块产生的词频算 B 板块的 tf 是不是就不太对了
2022-04-18 09:07:08 +08:00
回复了 LeeReamond 创建的主题 问与答 TF-IDF 提取大数量的文章关键字时如何解决算不动的问题?
@murmur 我筛除了大部分没有实体含义的词性。最后得到的词有三万多个。。所以按 100 万帖子算的话,整个 tfidf 的矩阵大小就是 100 万*三万,太难顶了
1 ... 36  37  38  39  40  41  42  43  44  45 ... 86  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4647 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 44ms · UTC 03:58 · PVG 11:58 · LAX 20:58 · JFK 23:58
Developed with CodeLauncher
♥ Do have faith in what you're doing.