现在 AMD 跑深度学习咋样?支持 cuda 吗?
1
forrestshuang 2020-06-01 17:58:15 +08:00 1
cuda 是英伟达的,amd 只能 cpu 跑 深度学习, 和 NV 的 GPU 差距可能到百倍。
建议买一张二手的 1080Ti |
2
mayx 2020-06-01 17:59:55 +08:00 via Android
可以用 OpenCL
|
3
raycool 2020-06-01 18:03:24 +08:00
是 AMD CPU 还是 GPU
|
4
coderluan 2020-06-01 18:07:42 +08:00
不支持 CUDA, 虽然 AMD 也有 OpenCL, 但是只有少部分框架支持, 还是有限的支持, 除非特殊情况, 是不建议买的.
|
5
misdake 2020-06-01 18:22:29 +08:00
TensorFlow 有 ROCm 的 port,好像两年前左右开始支持,现在到 tensorflow-rocm 2.1.1 。
tf 我没在 A 卡上用过哦不知道到底支持得怎么样。另外别的框架 lz 可以搜搜,tf 应该是跟得比较勤快的。 |
6
Hayek 2020-06-01 18:22:44 +08:00
|
7
lvyuedong 2020-06-01 18:54:32 +08:00 via Android
amd 有 rocm,虽然支持很烂
|
9
lithiumii 2020-06-01 19:37:23 +08:00 via Android
@Hayek 有个小坑:pandas 和 bumpy 默认的依赖 mkl 是英特尔的,amd 直接装的话调用 mkl 会有负优化,要指定用 OpenBLAS 或者用某些环境变量
|
11
luyanaa 2020-06-02 10:35:21 +08:00
印象里面 Github 上面 ROCm 跑 ResNet50 的 benchmark 相对价格不算很难看,主要是受 AMD 每代产品定位的拖累( Radeon VII 毕竟买的人实在太少,大多数人买的 Vega56/Vega64(GFX9 架构)或者 RX580(GFX8)说到底就是甜品卡,就算是平常的使用环境 RX580 也只能和 GTX1050Ti 或者 GTX1060 对比,Vega64 只能和 1070Ti 对比)。实际上我个人的统计(仅供参考,不保证完全控制变量,不保证实际使用体验,来源基本都是 Github 的 issue 和 lambdalabs 的测试数据) Resnet50 benchmark Vega64 比 1080Ti 慢 1/7,Radeon VII 甚至 ROCm2.7 能够接近 RTX2080Ti 的表现。但显然 ROCm 各方面的支持做的不好,新架构的支持偏慢( RDNA 我印象里面似乎还只有 unofficial 的 port,只是填了基础的坑,离开箱可用还差一些),性能还得一点点鸡血上去( Radeon VII 从 2.1.96 到 2.6 似乎 Image/sec 涨了快四分之一),等到满血了很可能下一代甚至下两代都已经出来了,而且动不动还有各种神奇的锅。(当然我以上的数据都只算了 ResNet50 的 Benchmark,因为这个 Benchmark 那个 issue 里测的最多,最方便进行有意义的统计,并不全面,但应该能反映一些问题)
知乎里面可能比较值得参考的几个帖子: https://www.zhihu.com/question/53091802/answer/890213654 https://zhuanlan.zhihu.com/p/80531243 |