1
imn1 2019-12-03 11:41:05 +08:00 1
1.硬盘箱,不熟悉的情况下,不要用阵列,真出问题时个人完全难以拯救
2.USB3 + 7200rpm 的不会太差,注意不要多盘同时写就好 3.瓶颈肯定是 CPU 的,如果数据只有 1T,还不如用 SSD,HDD 只作为备份 粗略算你的数据量是几百万张,虽然不算巨大,但 建议花点时间分类 /分目录,挤在一起的话 HDD 寻址可能比读取字节更费硬盘,所以工作用 SSD 更好 |
2
Olament OP @imn1 感谢回复,我现在用的就是 SSD 来存放数据集,但是最近开始做视频方面的工作了,所以未来数据的大小肯定辉成倍增长的。所以您觉得 WD MyBook 是一个不错的方案吗?
|
3
ZRS 2019-12-03 12:41:28 +08:00 via iPhone
机械硬盘性能肯定不够 建议分层存储 机械盘放冷数据 需要用的放 SSD
不推荐 WD MyBook 叠瓦盘性能可靠性都很差 建议买 HGST 的企业级 8T 空气价格也很厚道 |
4
imn1 2019-12-03 12:45:28 +08:00
首先,我是基本不买西数的,你可以认为这是个人偏见也没所谓
我一般选择是硬盘+盒子或箱子,盒子比盘需要更慎重购买,我个人 3 寸用优越者,2 寸用 SSK PS:我觉得深度学习写盘并不频繁啊,还比不上要经常写 log 的程序,只是读取频繁而已,你是中间结果需要 dump 到盘上么? |
5
ipwx 2019-12-03 12:52:01 +08:00 via Android
窃以为 ssd 存数据集毫无意义。你真训练起来,只要把读取图片放到后台线程就行了。基本上复杂的 cnn,单个 batch 的运行时间都是秒级的,一秒还不够你一个后台线程机械硬盘读完一个 batch 的嘛?
|
9
lsylsy2 2019-12-03 13:03:26 +08:00
看起来大部分数据是冷数据?
我个人是比较旁门左道的方案:大型台式机机箱+二手硬件 家用主板 +i3i5 级别配置 +SATA 扩展卡 /SAS 直通卡,只用来扩展接口,不用高级的 RAID 等功能 +snapraid+mergerfs,适合冷数据,可以达到类似 raid6 效果的冗余度 目前成果是 3000RMB 整套方案,20T 裸容量( 2T*10 ),14T 可用容量( 10 盘里任意坏 3,不会丢数据)。 加 500 可以配个好的 UPS,加几百可以上万兆或多个千兆口聚合 |
10
feather12315 2019-12-03 13:05:38 +08:00 via Android
@ZRS #3 my book 8T+是 hgst 降级的氦气盘
|
11
tomczhen 2019-12-03 13:15:29 +08:00 via Android
捡垃圾,组 ceph。
|
12
ipwx 2019-12-03 13:52:44 +08:00 1
@Olament 我们实验室的集群是我搭起来的。
文件系统和数据库:两台 Xeon E5 做 MooseFS/MongoDB Master,三台 48T (共 144T )做数据存储。MooseFS 是 goal=2 的双倍存储,MooseFS 是 Master/Slave*2 的三倍存储。当然,这些都是偏向于读写速度的配置。写入速度显然不如单机。 交换机:3 台 Cisco 24 口全千兆 + Ciso 专有的互联接口,这个互联接口好像是 48Gbps 的。 CPU 集群:10 台 E5。 GPU 集群:3 台,其中一台 10 卡,另两台各 4 卡。 - - - - 实验数据和结果都存在文件系统和数据库服务器上。Home 目录也是 MooseFS 的。计算节点不保存任何数据,开放 Docker。用户系统是 LDAP 服务器。运行良好。 |
13
ipwx 2019-12-03 13:55:44 +08:00
@Olament 哦对,文件系统和数据库服务器,四个千兆网口做了 LACP Bonding。其他计算节点做了双网口的 Bonding。
|
16
ZRS 2019-12-03 14:30:07 +08:00
@feather12315 谢谢指正 我再了解一下 不过我还是很推荐国行的 HGST 毕竟有五年的质保
@qping 淘宝几家大店应该都可以 前些日子看 HUS728T8TALE6L4 已经做到 1.1K 左右了 |
17
ryd994 2019-12-03 15:12:23 +08:00 via Android
|
19
ryd994 2019-12-03 15:26:04 +08:00 via Android
|
20
lsylsy2 2019-12-03 15:38:12 +08:00
@ryd994 这里指的是在哪里发生了数据损坏?
snapraid 本身读写的时候其实相当于 JBOD,并没有做数据切块之类的操作,不会像 ZFS 那样严重依赖内存内的索引,而且本身就从我自己(没 ECC )的台式机过一遍,NAS 多个 ECC 并没有明显降低风险的感觉 |
22
hchechao2 2019-12-03 23:54:05 +08:00 via Android
上次解压个几十万张图片就把我的 p300 弄坏了
|