V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wxf666  ›  全部回复第 5 页 / 共 34 页
回复总数  665
1  2  3  4  5  6  7  8  9  10 ... 34  
@AEnjoyable #2 如果执行完 minio.uploadfile(xxx,yyy),就突然崩了,数据是不是就不一致了
136 天前
回复了 Xrall 创建的主题 数据库 数据库查询优化到底该怎么做?
@showB1 #35 你的意思是,虽然现在消费级固态,能做到 100W 随机读写 / 秒,

但 MySQL 没能完全利用好这个资源,所以做不到?


请教一下,主要是什么方面耗时过多了呢?

- 网络 IO ?
- 等待锁?
- ……?

https://i.imgur.com/F29pmQ6.png https://i.imgur.com/F29pmQ6.png
136 天前
回复了 Xrall 创建的主题 数据库 数据库查询优化到底该怎么做?
@xuanbg #32 按理说,现在平民级固态完全做得到呀?

5000 条就算全走固态 IO ,应该 0.005 秒就好?


耗时在什么地方呢?网络 IO 吗?还是 MySQL 的锁啥的?

https://i.imgur.com/F29pmQ6.png https://i.imgur.com/F29pmQ6.png
136 天前
回复了 Xrall 创建的主题 数据库 数据库查询优化到底该怎么做?
@xuanbg #25 现在千元消费级固态,不是都支持 100W 随机查找/秒 了吗?

换句话说,即使服务器内存只有几百 MB ,MySQL 完全用不了缓存,所有读写都走固态 IO ,

随机查找 50W 行,也应该 0.5 秒就能搞定?

https://i.imgur.com/F29pmQ6.png https://i.imgur.com/F29pmQ6.png

https://i.imgur.com/uB205yf.jpeg
就 16MB 内存数据,你直接用语言自带的 Hash / HashMap / Dict / Object / Unordered_map / Table ,不行吗?
SQLite 不适合分布式写入。

要有高的写并发,就得利用 WAL ,尽可能缓冲多点事务,再落盘写入。

而官方说,WAL 模式要求所有进程在同一主机上,不能在网络文件系统上工作:

> All processes using a database must be on the same host computer; WAL does not work over a network filesystem. This is because WAL requires all processes to share a small amount of memory and processes on separate host machines obviously cannot share memory with each other.


@wwd179 #12

单机上使用的话,利用好 WAL ,加上外部互斥锁(或者一个进程专门处理写请求),可以实现很高的并发。

这两天我测试过,在电视盒子上(单核 Nginx 默认页压测 1W QPS ,性能不及 6 年前骁龙 636 千元机一半),

Python 的 FastAPI + SQLite + 去年本站被爬的千万数据:

- 200 模拟发帖回帖 + 全文索引 / 秒
- 1100 获取整帖(包括回帖者信息) / 秒
能不能像聊天记录一样,只拉取有更新却没下载过的?

简单做法:配置项放数据库里,标记创建/更新时间。

客户端开启时,拉取 [上次开机时间,现在] 范围内的新配置项?

https://i.imgur.com/F29pmQ6.png https://i.imgur.com/F29pmQ6.png
140 天前
回复了 ChainLock 创建的主题 程序员 Linux 写时复制问题
@dhb233 #7 请教一下,4GB 的程序被 fork 之后,系统会设置 100W 页不可写吗?(假设 4KB/页)
143 天前
回复了 TimG 创建的主题 程序员 求问数据清洗的简易方法
@NoOneNoBody 老老实实 CASE WHEN 各种情况呢?

分不清年月日的,就标记为错误?(反正换人来识别,也是标错呀)

然后不断审查标为错误的日期,看有啥情况会被遗漏,完善 WHEN ?
143 天前
回复了 TimG 创建的主题 程序员 求问数据清洗的简易方法
为啥看第一行需求,觉得用纯 SQL 写,也没啥难的呢。。

可以给几行数据(敏感数据用其他字符串代替就好)看看吗?
一个 `sort` 命令不就行了嘛。。你的日期部分也满足默认字典序

里面有个选项:`-m, --merge 归并已排序的文件;不进行排序`

你可以尝试如下命令(用了 `scp`、`curl` 两种方式,流式远程获取日志文件。远程服务器可以 `python3 -m http.server` 临时开个服务端):

```shell
sort -m 本机日志.log <(curl -s http://远程主机 1IP:服务端口/路径/日志.log) <(scp -O 远程主机 2 用户 @远程主机 2IP:/路径/日志.log /dev/stdout) >合并后日志.log
```


如,`sort -m <(seq 1 4) <(seq 3 6) <(seq 5 8)` 执行效果为:

```
1
2
3
3
4
4
5
5
6
6
7
8
```
@yinmin #17 用外部互斥锁,保证同一时间只有一个写入呢?

我试了下,WAL 模式下,开事务写入一条 1KB 记录再提交,每秒能有 3W 的 TPS ?

而且 WAL 模式下,写不影响读,意味着任何时候,都能有无数个并发读?
@FantaMole #10
@Sawyerhou #13

光速 30W KM/S ,一微秒才走 300 米,

这是要在交易所附近三公里下单,才能几微秒上报成功吗?

是这么算吗? https://i.imgur.com/F29pmQ6.png https://i.imgur.com/F29pmQ6.png
169 天前
回复了 webeasymail 创建的主题 Java 有什么好用的轻量级搜索服务?
@webeasymail 下载个开源 simple 中文分词插件,再写几行 SQL ,也会投入很多精力吗?
169 天前
回复了 webeasymail 创建的主题 Java 有什么好用的轻量级搜索服务?
最轻量简单的,应该是 1MB 的 SQLite 了吧。。

案例就是手机端上的微信,全文搜索了吧。。


[《微信全文搜索耗时降 94%?我们用了这种方案》]( https://cloud.tencent.com/developer/article/2220615 ) 里说:

> 一个包含 100w 条中文内容、每条长度 100 汉字的 FTS5 的表查询三个词,optimize 状态下耗时 2.9ms

> 100w 条内容每次写入 100 条的情况下,按照 WCDB 的方案执行 merge ,耗时在 10s 内。
这点数据,即使是在性能弱鸡的手机端,进行全文搜索,不是最简单的 1MB 的 SQLite ,都能解决的吗?


[《微信全文搜索耗时降 94%?我们用了这种方案》]( https://cloud.tencent.com/developer/article/2220615 ) 里说:

> 一个包含 100w 条中文内容、每条长度 100 汉字的 FTS5 的表查询三个词,optimize 状态下耗时 2.9ms

> 100w 条内容每次写入 100 条的情况下,按照 WCDB 的方案执行 merge ,耗时在 10s 内。
去年不是有 V 友,做了个 MetaGPT 吗?

声称:1 元成本,能使 GPT 以团队的形式工作,协作处理更复杂的任务。包括产品经理,架构师,项目经理,工程师,它涵盖了一个软件公司的全过程。

还说该项目上了 [trending]( /t/954282 ) 和 [榜三]( /t/954971 ),还做了 [主题演讲]( /t/982619 )。。

不知现在咋样了。。

链接:[MetaGPT:人人都可以成为老板,运营 GPT 公司]( /t/953091 )
192 天前
回复了 june4 创建的主题 编辑器 未来最牛编辑器 zed 的 Linux 版终于出来了
1. 用过第三方维护的 Windows 上的 Zed ,

界面体验感觉很平庸,连平滑滚动都没有。。

连 Flutter 应用都比不上。。不知是第三方移植问题还是啥。。



2. 官方维护的 Zed ,界面性能/流畅度,能和 Edge Legacy 掰一掰吗?

感觉 Windows 的 Edge Legacy 浏览器,界面体验最好,平滑滚动最为流畅、跟手。

新版 Edge 、Chrome ,总感觉会慢几帧,时不时卡一两帧,平滑滚动也很平庸。。



https://i.imgur.com/F29pmQ6.png https://i.imgur.com/F29pmQ6.png
@xfriday #19

Win 上,最接近虚拟内存的概念是啥?

Linux 上,最接近提交大小的概念是啥?
@opengps #7 为啥要看提交大小(虚拟内存?)呀?

这个帖子说,浏览器每个进程,都能吃 1TB 提交大小(虚拟内存)呀?

但实际不会吃这么多。。所以看提交大小(虚拟内存),有啥作用吗?

[Chrome 和 VSCode ,每个进程能占用 1T 虚拟内存,有图有真相]( /t/955304 )
1  2  3  4  5  6  7  8  9  10 ... 34  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3967 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 05:13 · PVG 13:13 · LAX 21:13 · JFK 00:13
Developed with CodeLauncher
♥ Do have faith in what you're doing.