crackhopper 最近回复了
看开头,我以为是要做独立游戏咧。不过我预判你早晚要搞游戏的,哈哈。很欣赏你,可以做个朋友? UTogNzEwNTkgMTIwOQ== ,有空可以多交流。
可以,看到算法题的时候,我赶紧查了一下。哈哈。习惯性查答案。
至于学历,随便搞搞就能拿个非全日制本科学历吧。大专不够用。
用不到,然后忘了,那就搞个开源项目直接用新技术去做。连项目没有的情况下,当然学了就忘。效率为零。
公司项目如果让你练手,那你就在公司里用新技术。不让练手,搞开源项目呗,有啥的。
另外,做得深入一些了,自然就会涉及到各种原理性质的、算法性质,乃至数学相关的东西。自然就提升了。至于方向,要么做感兴趣的,要么做擅长的。如果没有感兴趣,也没有擅长的,只能说,不适合吃技术这口饭。
看完,个人觉得你不应该找 AI 技术合伙人。除非你很有钱,或者已经有融资了(那样也不会在这里找人了)。
应该找尽可能全栈的工程师。AI 方面可以调用别人的模型或者 API ,以出效果为主,不以调优为主。
行业方向上,先从工程和需求开始做,而不是从算法。主要是算法 ROI 比较低(主要还是投入大,产出小),调算法包则 ROI 比较高(调包当然容易了,同时出效果也快)。
不建议做自己想出来的新需求,除非你是多次创业者;建议从一些已经有的需求上做,然后用 AI 做微创新。
直接考虑用 AI 技术作为卖点下场,会有很多问题。在大部分实际需求中,AI 都是锦上添花,并非雪中送炭。没有基础功能需求支撑,基本做了也是徒然,竞争力弱,效果大概率跟做个好的 ppt 差不多。此外,要搞清楚你的产品是 2c 还是 2b ,2c 重点是怎么搞流量,2b 重点是怎么搞客户。不管是哪个,自己去研发行业模型都不是最重要的事儿。
AI 技术方面:搞 AI 需要数据,需要算力。人的方面主要是需要有经验的,或者足够聪明的。然后基本就是调参,根据结果来测试参数,不断调优,时不时看论文,用点新技术调优。问题是,数据算力其实都不便宜,做完之后的产出也仅仅是模型,离产品还有很大差距,大概是 1 分到 100 分的差距。并且,产出模型所需的时间并不稳定,取决于数据质量,算力多少,问题难度。而且每次调整,都不是那么可控的,玄学。所以你找了个 AI 工程师,大概率就是做了个模型,给你演示一下自己研发是啥效果,然后发现很难往下做了并且钱也没了。
我个人预判还能凑合跑一些图(仅仅做一些推断),但应该比较慢。
4070 ti super 我用着的话还可以,不过那个机器只用来跑图,不做别的。4090 ,我也入手了,4090 可以勉强做一些 LoRA 微调。主要点:机箱弄大点,方便后续添东西。电源功率高点,免得负载上不去。散热看情况弄,差了自然也是有问题的,不过那个主要看 CPU 负载。另外,GPU 卡都这么贵了,主板 CPU 内存也得上来吧,要不然 IO 方面的瓶颈或者 CPU 不够导致性能发挥不足,岂不是浪费。总之,照着 2 万以上来配电脑可能更加好一些,别想着太便宜了。(如果 4090 ,照着 2.5 万以上配吧)
至于全量训练啥的,就别想了,不是个人玩得起的,至少 8 卡吧。
我印象里,没有 main(当然动态库也有自己的 main),加上编译上带有--shared ,输出是 so ,就会形成动态库。其他主要就是写 makefile, cmake 之类的。好久没写了,我当年一般用 cmake 多一些,这样编译器标签什么的,基本都构建系统给你处理好了。就只需要项目编译组织对了就行,正确的添加好依赖,然后构建;一般项目应该都做好这些依赖的 link 配置了,当然 linking 出问题会比较麻烦,又很多细节,我也不展开说了,你可以先试试。
此外,.so 里面函数签名也有可能是麻烦的点,如果为了更好被别的语言调用,C 的封装接口更加易用一些( C++的 mangling 可能会导致查找符号上还挺困难的,但是如果项目本身是 C++的你会发现封装一层 C 接口也有不少工作量)。另一个常见做法是,在项目中添加比如 java 语言的头文件,然后对相关调用当前 java 提供的 native 函数进行封装,这样会直接导出 java 可有识别的函数。(我推测大概率可以,其他语言都有类似做法) java 的调用技术,应该叫 jni ?你可以自己多研究研究。我对 java 不太熟,只停留在表面使用。
我反正也是个分布式方面的外行,就随便说点自己想到的复杂性:
需要有除了操作以外的日志记录步骤,这样回退出问题可以检测到,并重新回退。然后加了这个步骤就成了 2pc 。
还有其他复杂的地方,比如每个 api 要保证幂等,api 之间的依赖。。。回滚过程中和其他事件的互斥,以及业务上怎么更好处理互斥,互斥带来的性能问题。然后就复杂了呗。本身锁的实现可能不复杂,怎么用锁才是复杂的根源。
有贷款有家要养 => 选钱多但不喜欢
选钱少但喜欢的 => 没负担
但是,下面不一定成立:
没负担 => 选钱少但喜欢的
因为可能没负担只是必要条件,不是充分条件。证明完毕。
之前 org-mode ,现在感觉就 txt 就可以了。
此外很多时候,会直接做成 ppt ,顺便给别人讲一波,感觉 ppt 记笔记也挺好,至少自己看着也容易懂一些。
所以目前是:ppt+txt 记笔记了。我觉得记个大概,然后附带一些网址链接。后续回顾的时候根据网址索引,这样比较有用。
脑图可能也有点用,但我不喜欢使。我个人觉得脑图更适合准备考试/面试之类的,根据脑图直接回想对应知识点。
如果是看书学习这种,我估计我还是会切换回 org-mode 这种吧。现在看书学习比较少了,大部分是看源码、看论文、看论坛、看技术帖子。如果是系统看书,可能还是记录功能更多更便捷的会好点;比如用 obsidian/org-mode (后者门槛有点高,还得上手 emacs ,不推荐新手。