V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wxf666  ›  全部回复第 8 页 / 共 26 页
回复总数  514
1 ... 4  5  6  7  8  9  10  11  12  13 ... 26  
2022-12-07 20:38:44 +08:00
回复了 Lexgni 创建的主题 程序员 数据库自增 id 不连续会有什么问题吗?
@8355 所以感觉 6 楼像一本正经的胡说八道。。


@RedisMasterNode 业务量大,一般至少会用 `bigint` 吧?`bigint` 不会这么容易用完吧。。
2022-12-07 18:36:50 +08:00
回复了 Lexgni 创建的主题 程序员 数据库自增 id 不连续会有什么问题吗?
@8355 我主要是没理解,为何『自增不连续 ID 』会出现 @cloverzrg2 说的『`ORDER BY` 失效』、『查询麻烦』、『出现重复 ID 』问题。。
2022-12-07 17:21:34 +08:00
回复了 kkyypy 创建的主题 Linux Linux 中如何找到 2 个文件的并集
俩文件有多大呢?

文件 a 较小的话(内存存得下),如 8 楼所说,一两行 awk 应该就行了


@winglight2016 就 2 亿数据,感觉一个几百 KB 的 SQLite 都能很好应对,不必要上大数据平台吧
2022-12-07 17:12:11 +08:00
回复了 Lexgni 创建的主题 程序员 数据库自增 id 不连续会有什么问题吗?
@cloverzrg2

- 不连续的 ID 会顺序不正确?(变逆序 /随机顺序?)

- 平时连续的 ID 会使什么查询操作变得便捷呢?(俩 uid 间有多少人?)

- 自增 ID 为何会插入重复的 ID ,甚至覆盖原有数据呢?
2022-12-07 13:53:34 +08:00
回复了 wloverine 创建的主题 程序员 Hive SQL 题求教
@SbloodyS 数据库新手问下,现在基本都不用 PostgreSQL 、MySQL 、SQL Server 、Oracle 、SQLite 这些数据库了是吗?
2022-12-07 11:02:49 +08:00
回复了 wloverine 创建的主题 程序员 Hive SQL 题求教
@cau1iflower 有啥数据库支持直接引用别名的吗?

比如 `LAG(start_date)`、`LEAD(start_date)` 这些
2022-11-24 14:08:35 +08:00
回复了 dafuyang 创建的主题 MySQL 兄弟们,关于 sql 优化的问题想请教一下
@xiangyuecn `select a,b,c,d from table order by d desc limit 0,100;` 不是先走索引 d 查出主键,再查出对应的 a, b, c, d 吗?

实在不行,使用 `FORCE INDEX`,或者 `SELECT a, b, c, d FROM (SELECT id FROM table ORDER BY d DESC LIMIT 0, 100) t JOIN table USING(id)` ,感觉性能可以更好啊?(至少能减少数据传输?)
2022-11-24 11:15:03 +08:00
回复了 dafuyang 创建的主题 MySQL 兄弟们,关于 sql 优化的问题想请教一下
@xiangyuecn 这个不就是楼主所说的『强制使用 d 索引』嘛。。

另外,为嘛要分开写呢?直接 `select a,b,c,d from table order by d desc limit 0,100;` 不行吗?
2022-11-22 22:31:12 +08:00
回复了 andyJado 创建的主题 程序员 为什么我们不用 git 当数据库呢?
@andyJado

以及,怎么确保『用户消费货币 和 用户发帖 /回复』同时发生或不发生?(防止突然断电、程序突然崩溃等)

这些都是最最最基础的数据库功能,连 1MB 的 SQLite 都能轻易实现


可能数据量太大(而且没有数据),你不好练习

可以去搜索一下『 SQL 经典 50 题』,一些基于『十来行学生、课程、教师、成绩数据』的各种查询,看看怎么用 Git 实现?
2022-11-22 22:04:50 +08:00
回复了 andyJado 创建的主题 程序员 为什么我们不用 git 当数据库呢?
@andyJado

1. 怎么存储 用户 的 提醒通知(及其是否已读)、历史消费、收藏节点 /主题、关注 /block 的用户?
2. 怎么知道 帖子 有哪些 回复?(回复所属的帖子)
3. 怎么知道 某个回复 有哪些“感谢回复者”记录?
4. 怎么搜索 某个用户 所有帖子、回复?
2022-11-22 21:13:08 +08:00
回复了 andyJado 创建的主题 程序员 为什么我们不用 git 当数据库呢?
@andyJado 比如 V 站的 1K 个节点、60W 个用户、90W 个帖子、1200W 个回复,

以及每个用户的个人信息、所有提醒通知、虚拟货币消费历史,

还有每个帖子中某些用户的“感谢回复者”记录等,

怎么在 Git 里存储呢?


增删查改 节点、用户及个人信息、帖子、回复、提醒、消费 等,大概咋实现呢?
2022-11-22 10:27:47 +08:00
回复了 pcana 创建的主题 程序员 这个应该是比较全的各语言框架性能排行榜!
为啥 C/C++/Rust 效率能差于其他语言呢
2022-11-17 20:09:01 +08:00
回复了 qiyong 创建的主题 程序员 面试中遇到的一道 sql 题
@potatowish wangxin3 `goods_sales_record` 表应该允许多次售出某个商品吧

因为楼主 @qiyong 也用了 `FROM goods_sales_record GROUP BY goods_id`


我试了下,`goods_sales_record` 表加个 `(7, 1, '100')`,#12 #14 结果就不对了


试着拿 `SQLite` 写了下:

*( V 站排版原因,行首有全角空格,记得删除)*

```sql
WITH
  goods(id, name, group_id) AS (
   VALUES
   (1, '苹果手机', 1),
   (2, '三星手机', 1),
   (3, '联想电脑', 2),
   (4, '华为手机', 1),
   (5, '华硕电脑', 2),
   (6, 'IKBC', 3)
 ),

  goods_group(id, name) AS (
   VALUES
   (1, '手机'),
   (2, '电脑'),
   (3, '键盘')
 ),

  goods_sales_record(id, goods_id, sales_volume) AS (
   VALUES
   (1, 1, '50'),
   (2, 2, '30'),
   (3, 3, '88'),
   (4, 4, '88'),
   (5, 5, '444'),
   (6, 6, '34')
 ),

  goods_sales(goods_id, total_sales) AS (
   SELECT goods_id, SUM(sales_volume)
   FROM goods_sales_record
   GROUP BY 1
 ),

  top3 AS (
   SELECT *
   FROM goods_sales
   ORDER BY total_sales DESC
   LIMIT 3
 )

SELECT
  g1.name 商品名,
  gg.name 商品所属分组名,
  t3.total_sales 商品销量,
  SUM(gs.total_sales) 分组内所有商品总销量
FROM top3 t3
JOIN goods g1 ON g1.id = t3.goods_id
JOIN goods g2 USING(group_id)
JOIN goods_group gg ON gg.id = g1.group_id
JOIN goods_sales gs ON g2.id = gs.goods_id
GROUP BY g1.id
ORDER BY 分组内所有商品总销量 DESC, 商品销量 DESC;
```
2022-11-15 22:52:20 +08:00
回复了 diandian666 创建的主题 程序员 十年程序员难倒了一个算法上面,真的老了
@maggch97 确实,改成 round(1.15 * 100) 就能继续跑了

但跑了快半个钟了,还没出结果。。
2022-11-15 20:42:18 +08:00
回复了 kaiki 创建的主题 MySQL 求一个多条件查询,每个条件都能查询指定数量的结果的语句
@dqzcwxb 请教一下,为嘛不选用窗口函数呢?(差在哪儿?)
2022-11-15 20:38:23 +08:00
回复了 brader 创建的主题 程序员 请教个 sql 查询问题
@brader 能大致放一下当前的表结构 和 查询 SQL 吗?
2022-11-15 20:03:04 +08:00
回复了 diandian666 创建的主题 程序员 十年程序员难倒了一个算法上面,真的老了
@aijam 为嘛我改成楼主第一组数据(最长的那组),跑不出结果呢?

显示:ans = {6213: [], 2667: [], 1776: []}
2022-11-08 12:53:41 +08:00
回复了 blankmiss 创建的主题 NAS Zlib 的数据量怎么这么少,才 31T 的书籍?
@blankmiss 我不是说 31T 多 /少,是说 sql 少,才 1200W 数据,其中有 13W 中文书籍

但看到 @kernelpanic 在 #93 楼说下了 2000W 本,其中 20W 本是中文

是不是少了 800W ?
2022-11-08 12:48:20 +08:00
回复了 maichaide 创建的主题 Linux 远离国产软件,只配在虚拟机和沙箱里跑!
楼上的建议远离 Chrome 吗?

这货时不时有个 software_reporter_tool 扫硬盘也很吃资源,风扇呼呼响,而且没有提供选项关掉
2022-11-08 05:01:46 +08:00
回复了 blankmiss 创建的主题 NAS Zlib 的数据量怎么这么少,才 31T 的书籍?
@kernelpanic 我只下了 sql 文件

统计了下,总共不到 1200W 行数据,中文才 13 万本左右

是不是数据库缺失很多啊?@blankmiss ,有啥办法补全吗?
1 ... 4  5  6  7  8  9  10  11  12  13 ... 26  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   996 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 20:38 · PVG 04:38 · LAX 13:38 · JFK 16:38
Developed with CodeLauncher
♥ Do have faith in what you're doing.