V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  laminux29  ›  全部回复第 3 页 / 共 98 页
回复总数  1950
1  2  3  4  5  6  7  8  9  10 ... 98  
49 天前
回复了 crc8 创建的主题 Python 为什么 Python 会有那么多人喜欢用?
因为差生多、穷、贪婪,整个世界都这样。

差生多的意思是,没有几个人会严谨对待数据类型、异常处理,导致 js 、python 这类语言风靡。一旦工程大了,最终害人害己。

穷的意思是,项目资金少,人力贵,导致催需求,不会给工程师预留多少时间来规范化地处理需求。

贪婪的意思是,催需求,缩减工期,减少人力支出,能减少资本家的成本支出。
50 天前
回复了 bjzhou1990 创建的主题 宽带症候群 PVE 管理口性能的疑问
网络没做隔离,导致 OpenWRT 的 WAN 口与 LAN 口混在一起,OpenWRT 会对 LAN 口做各种管理,比如 dhcp 等等。

你这种情况,要不给 OpenWRT 直通,要不 vlan 做隔离。直通比 vlan 简单,物理网口不够,直接加 pcie 网卡或 usb 网卡。
50 天前
回复了 jmliubiao 创建的主题 宽带症候群 请教各位一个 ddns 网络问题
为啥不用 TP-Link 的? TP-Link 路由器自带免费的 DDNS ,需要咨询一下客服,哪些款式支持。

然后你可以在 TP-Link 路由器后台,申请一下 xx.tpddns.cn 域名。TP-Link 路由器会自动把公网 IP ,解析到这个域名。这个域名还可以通过 cname 解析到你自己的域名里,比如阿里云的 xx.top 域名。

还有一种方法,如果你有阿里云的自己的域名,可以去 github 上搜一个支持阿里云的 ddns ,比如 NewFuture 的 DDNS 项目。这玩意有 Linux 和 Windows 版本。做个开机自启的任务计划,以及每分钟更新一次的任务计划。
1.你买了个香港阿里云主机。你登录到云主机上,在云主机上,从互联网下载文件,快的时候 5MB/s ,慢的时候 200KB/s.

2.你在云主机上,有一个 APK 文件,大小为 100MB 。你在公网上,从这台云主机,下载这个 100MB 的 APK 文件,速度是 200KB/s 。

是这个意思吗?

我觉得,如果你能把问题表述完整,没有歧义,并且把单位写对,最后给一下云主机的带宽信息,这更有利于解决这个问题。
@iseki
你这个例子,假阴性不就出来了:

4 、5 、
1234 、12345 、
2 、23 、2345 、
3 、34 、
4 、
5

这些都缺失。
@sockpuppet9527

倒排索引不是用来解决楼主这个需求的。建议仔细看一下倒排索引的说明,然后找几个物流单号,用这种方法试试,你就明白了。
@iseki

分词与近似策略是无法精确处理这类需求的。所以我在开始就说了,这类需求,就没办法用索引。

recheck 只能解决假阳性,解决不了假阴性。

你说你们这边线上在用,没什么大问题,那是因为你们没发现问题,而且用户也没汇报。不仅如此,就连大电商平台,比如淘宝京东的历史订单号的搜索,因为他们采用分词搜索,所以他们也没办法实现这个需求。
@sockpuppet9527

这玩意也是分词机制,你仔细看看你发的链接。分词与近似策略是无法精确处理这类需求的。所以我在开始就说了,这类需求,就没办法用索引。

业内目前应对这部分问题,第一是不处理。很多电商平台通过关键字搜索历史订单时,会发生这种情况,搜不出来;然后是通过剪枝需求去做的,比如银行只允许搜最近 3 个月的交易记录。
@alansfinal

那篇文档的意思是,pg_trgm 这玩意本质上是类似于全文搜索的,需要预先对自然语言的词汇进行处理,所以无法处理非词汇的结果,也就是纯数字是处理不了的。

而且这还是一种近似搜索,会有错误的结果,并不是 LIKE %keyString% 这种精确搜索。
@iseki

它后面写了 non-alphanumerics
@skinny

OP 是希望用纯数字字符串当成子串来进行搜索,或者更严谨来说,是匹配,而且还不限定位置。这种匹配,在算法与数据结构的层面,是没办法加索引的,只能蛮干,这也是为什么这类业务很少见,而且搜索引擎对这种搜索也没办法做到高精准度。
@lmshl

如果你看不懂 10 楼发的英文,可以试试翻译软件。
1.防止爬虫。

2.手机上有你的个人信息,更容易做信息收集与广告推荐。
另外,是否考虑修改需求,比如淘宝业务,用户的查询范围只是自己的订单,菜鸟驿站老板查询的范围只是他的驿站范围,那么可以通过剪枝 + 数据冗余的方法,空间换时间,能控制到一个比较理想的性能范围。

然后查询接口,再按时间进行分区:最近 3 个月内是默认查询,如果要查询所有时间范围,就让他们排队查询,或查询结果异步通知。
这种需求,是没办法用索引的,所以无论什么数据库,包括 ES 、Click House 、Redis 、PG 甚至 Oracle ,都不好使,只能用硬件去硬抗。2 楼老哥说对了。

可以使用基于区域或散列,进行分片,用很多物理机去扛,每台物理机扛一个分片。简单一些可以用 MongoDB ,天生分布式 + 分片。需要高性能那就用 Redis 集群,大内存,数据提前加载到内存里。

话说回来,这种需求,虽然提高了用户体验,但真的烧钱。公司没钱的话,不建议这么做。
@lmshl 笑死,你发的东西,你都不看一下嘛?

pg_trgm ignores non-word characters (non-alphanumerics) when extracting trigrams from a string.
生产力有多屏电脑,大屏影音娱乐有平板,出差有轻薄本,一直不明白折叠手机有何意义,而且这玩意还会降低续航、增加重量、增加操作麻烦程度。

我身边倒是很多中产女第一时间买了这玩意。
os.chmod('/usr/local/test', 0o644) 时,执行这行命令的用户是?

应用程序中通过 wget 下载文件时,执行 wget 的用户是?
60 天前
回复了 fqzz 创建的主题 NAS 求助一个 Qnap 交换机的网络问题
去 0daydown 下载一个 Cisco Packet Tracer ,把你家里的 PC 、交换机、路由器,搭建出来。这软件有调试模式,能以可视化跟踪数据包,数据包断在哪里一目了然。

一般来说,要不就是 vlan-id 不对,或者 trunk 口忘了允许相关 vlan-id ,或者是没用高级自动化路由协议的情况下,忘了写路由规则。
想体验苹果系统,在虚拟机上安装就行了。没有刚需,跟风上 Mini M4 是纯纯的智商税。

你想打游戏,应该买 7945HX ,板 U 一套只要 2500 元,但总跑分是 M4 的 1 倍,而且最大能上 64GB 内存,有 2 个 nvme 插槽。
1  2  3  4  5  6  7  8  9  10 ... 98  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   994 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 21:58 · PVG 05:58 · LAX 13:58 · JFK 16:58
Developed with CodeLauncher
♥ Do have faith in what you're doing.