V2EX › ipwx 的所有回复 › 第 26 页 / 共 200 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 ... 22 23 24 25 26 27 28 29 30 31 ... 200

❮

❯

2022-05-20 10:33:52 +08:00

回复了 zealboy 创建的主题 › 程序员 › 有什么值得捣鼓的机器学习/深度学习的项目吗

@zealboy 因为我不相信有什么岁月静好是不变的。

大厂可以裁人，研究话题可以衰退拿不到经费，国家经济可以下滑，一场大病可以卖掉房子。

我感觉活在世界上十分不安全，而我想给自己打造一个避风港，才有闲心去做有趣的事情。

2022-05-20 08:31:30 +08:00

回复了 zealboy 创建的主题 › 程序员 › 有什么值得捣鼓的机器学习/深度学习的项目吗

@zealboy 相比较于亿万富翁我更想找点有意思的 project ！
----

年轻真好哇，真好哇。我也怀念那个无忧无虑，不食人间烟火的时代。搞投资组合是为了做亿万富翁嘛？能做亿万富翁的能有几个（笑）。只是为了能给自己搭一个避风港，想做什么就做什么而已。

不然你做什么研究都要看别人的口味，不符合别人口味的研究你连经费都申请不下来。

2022-05-20 08:27:51 +08:00

回复了 zealboy 创建的主题 › 程序员 › 有什么值得捣鼓的机器学习/深度学习的项目吗

@zealboy 客观来说我做过的机器学习项目可能不比你少...
----

嗯好嘛。客观来说，我发过深度学习的文章，顶会。

2022-05-19 23:58:15 +08:00

回复了 zealboy 创建的主题 › 程序员 › 有什么值得捣鼓的机器学习/深度学习的项目吗

@c0xt30a 换句话说，5000 支股票配 1000 个算法海选，确实组的出来几百个对象的投资组合

2022-05-19 23:57:39 +08:00

回复了 zealboy 创建的主题 › 程序员 › 有什么值得捣鼓的机器学习/深度学习的项目吗

@c0xt30a 是也不是。不同板块的股票相关性本来就低，你再搞几十套算法怼上去，每个算法的买卖操作不一样，相关度就更低了。这样就能组出来一套可以降低抖动的投资组合。

当然 A 股不能做空所以没那么理想。能做空的市场，这么一搞，相关度就迅速下降了。

2022-05-19 17:03:54 +08:00

回复了 zealboy 创建的主题 › 程序员 › 有什么值得捣鼓的机器学习/深度学习的项目吗

@zealboy 顺便不提 AI ，有个事实供参考：

若有 N 个独立同分布的变量 x1...xN ，均值都是 mu ，标准差都是 σ。那么如果我每个变量只取 1/N ，并加起来：

y = (1/N)(x1+...+xN)

那么 y 的标准差就是 σ/sqrt(N)。
----

这个事实有啥用呢？很简单，如果你全仓单吊一支股票，那它一个回撤抖动可能大小是 σ。但如果你选了 N 支和它表现差不多的股票，收益期望都一样，那么它们加起来的收益期望和原来一支股票的收益期望仍然相同，但是一个抖动只会给你造成短暂的 σ/sqrt(N) 的损失。。。

当然无论怎么样，收益总数的期望是一致的。但是抖动从 σ 变为 σ/sqrt(N)，相信你会好很多的，至少持仓过程的心理压力就不会那么大了。
----

所以我们需要 AI 。不然你怎么一个人自己配置 100 支股票呢？

2022-05-19 16:58:57 +08:00

回复了 zealboy 创建的主题 › 程序员 › 有什么值得捣鼓的机器学习/深度学习的项目吗

不过我个人是偏向于价值投资理念的对于量化以及中短期交易不是很感兴趣
----

这个理念和楼主不关心 AI 其实有着同样核心的内核：相信自己（作为人）的智慧，觉得机器没啥大不了的。大概是一部分程序员的常见心态吧。

我就不一样，与其相信我的智慧、精力（市场上那么多公司哪有那么多时间一个个看）、毅力（一个大跌我可拿不住），我更相信机器。

2022-05-19 15:54:57 +08:00

回复了 hiugo 创建的主题 › 程序员 › 如何快速顺序生成一亿个数字

@jessun1990 顺便我的 Linux Mint 主机：

$ time seq 1 100000000 > /dev/null

real 0m0.544s
user 0m0.536s
sys 0m0.008s

2022-05-19 15:53:04 +08:00

回复了 Richard14 创建的主题 › 问与答 › Numpy 对一串向量进行量化有什么简便写法吗

1)

import numpy as np
im = np.array([0,1,15,16])
np.asarray(im / 16, dtype=int) # array([0, 0, 0, 1])

2)
随便运算，最后取整。

2022-05-19 15:04:25 +08:00

回复了 hiugo 创建的主题 › 程序员 › 如何快速顺序生成一亿个数字

@jessun1990 是 mac 。看起来 Linux 做了优化，>/dev/null 不用过系统调用。mac 实打实系统调用花了 17 秒

2022-05-19 11:42:34 +08:00

回复了 toeii 创建的主题 › 问与答 › 有偿求助（NLP）：请问如何计算两个词之间的共现/转移概率（transitional probability）？

1. 找一个巨大的语料库。
2. 用分词（比如 jieba ）抽取词的 token 。
3. 然后直接统计。

----

但是……

这个方法估计你得不到有意义的答案，原因是 word token 太稀疏了，所以是失真的。

改进方法：

1. 找一个巨大的语料库。
2. 用分词抽取 word token 。
3. 训练 word embedding model 。
4. 训练一个分类器，p(next word embedding | previous word embedding)

----

如果要增加效果，可以考虑

p(next word embedding | context)

而不是只给定上一个词语。相关的改进建议查询论文。

2022-05-19 11:37:56 +08:00

回复了 hiugo 创建的主题 › 程序员 › 如何快速顺序生成一亿个数字

❯ time seq 1 100000000 > /dev/null
seq 1 100000000 > /dev/null 15.53s user 0.02s system 99% cpu 15.553 total

2022-05-18 13:43:43 +08:00

回复了 LeeReamond 创建的主题 › Python › Pandas 或 numpy 有什么接口可以直接将内存数据暴露给第三方程序吗？

@LeeReamond 一般 cmake 就行了。第三方库直接一起丢进来编译就是了。C++ 算法库一般都是模板，而模板库一般都是 header-only ，根本不难编译。pybind11 用 os 自带的就行，apt-get install pybind11-dev python3-dev 然后 cmake FindPackage 就可以了。

2022-05-17 14:30:37 +08:00

回复了 bugfan 创建的主题 › 奇思妙想 › 做一个无插件的可以 fq 的 js 代理网站，可以访问油管/奈飞/维基百科/推特，是否靠谱？

你这需求难度堪比造火箭。

2022-05-17 12:02:55 +08:00

回复了 Zerek 创建的主题 › 问与答 › 没有能稳定聊天的异性，和同性聊天又感觉很没意思。没有什么特殊的想法，就是想找一个年龄差不多有共同语言的异性聊聊天，双方又不会觉得不方便。这种情况是不是应该去找那些打广告的社交软件？求支招

举个常见的例子，男的失恋了去找兄弟，然后就是喝酒吹牛兜风玩游戏，基本目标是消磨时间；女的失恋找姐妹，会聊很多生活的经历和想法，讨论用什么心态对待，算是情感上的连接。
----

@Zerek 楼主加油。你看 53L 的言论「“失恋”这种词也是种软弱，就不应该出现在男性身上。。。」，就知道为啥你找不到可以聊的同性了。统计上，我国大环境如此，水做的男人不多的。

不过既然楼主的性格有点水做的，不如找找强势的大姐姐。或者干脆女装（ doge

2022-05-14 17:15:08 +08:00

回复了 shikimoon 创建的主题 › 程序员 › 有上亿的词算词频怎么算比较快

上述操作必须用指针在那里魔法计算。。。不要用 STL 容器。不然速度还是提不上去

1 ... 22 23 24 25 26 27 28 29 30 31 ... 200

❮

❯