特殊行业小企业的大文件存储、共享和永久备份的一些问题

2024 年 11 月 12 日
 ipengxh

前情概要

  1. 公司性质特殊,存储的数据是刑事案件的手机、电脑、服务器镜像,数据需要保留至少 30 年;
  2. 公司起步阶段,对成本比较敏感,目前公司规模约 10 人,一般 1~5 个人参与一个项目;
  3. 每年 50~100 个项目,每个项目所需的存储从 10G 到 30T 不等,平均在 1T 左右;
  4. 存储的数据以 zip 压缩文件为主,也可能临时存储大量服务器镜像的原始文件( raw 、qcow2 等格式),文件大小从 10G 到 1T 不等,每个项目还包含数十个文档文件。

当前方案

  1. Dell 730XD + TrueNAS Scale + 12x16T ;
  2. 2 个 ZFS 存储池,每个 6 块盘,一个冗余 1 块盘( Z1 ),一个冗余 2 块( Z2 );
  3. 开启 zstd-9 ,对于服务器镜像的原始文件有极佳的压缩率( 1T 的镜像文件实际占用空间可能会小到 1G )
  4. 仅开 samba 协议挂载形式访问数据;
  5. ZFS 离线备份往年数据。

当前存在的问题

  1. 权限管理的问题。每个项目的数据不允许项目外的人访问(也不允许列举目录),不知道是不是使用 TrueNAS 的姿势不对,没找到可以配置的入口。TrueNAS 是否可以方便的实现该需求?如不可以,有无更好的选择?

潜在的风险

  1. 氦气盘不稳定因素。据网上的资料,氦气盘存在漏气的风险,考虑到成本因素,离线备份只有一份备份,备份损坏可能导致灾难性问题。是否应当考虑其他存储介质?
  2. TrueNAS 稳定性问题。目前已经挂过一次 TrueNAS 系统盘了( Intel 傲腾),用新盘装新系统添加池就恢复了。TrueNAS 是否存在其他可能导致数据丢失的潜在风险?
6385 次点击
所在节点    NAS
84 条回复
cppgohan
2024 年 11 月 12 日
@ipengxh 使用公有云, 但是整体加密存上去
ungrownxiaohao
2024 年 11 月 12 日
@ipengxh #39 加密后也不行吗?本地物理手段管理,终究还是要专人掌握那把“钥匙”的。
ipengxh
2024 年 11 月 12 日
@cppgohan @ungrownxiaohao 理论加密后丢云上面没问题,但是甲方知道你把这样的数据丢到云服务商那儿估计会觉得我们脑子有泡。
另外还有一个问题是网络带宽,一个案件假如有个 10T 的数据,千兆上传就得传半个多月,无法接受这样的速度。
duanxianze
2024 年 11 月 12 日
短期先用硬盘存着,赌一下 5 到 10 年后技术突破,单位体积存储空间翻 10 倍
glasslion
2024 年 11 月 12 日
@bthulu 你是想让 OP 吃花生米啊
yamaidai
2024 年 11 月 12 日
跟我之前有点像,我们是体制内招投标的,开标录像要求终身保留。实际上我们就是定期拷贝到硬盘丢那儿不管了。
sadwxds
2024 年 11 月 12 日
我咋觉得这个大量冷数据的存储介质好像只有光盘或者磁带这种最靠谱。
硬盘的话机械硬盘貌似需要持续供电,断电时间久了照样数据丢失了。
johnnyyee
2024 年 11 月 12 日
我觉得前期用 TrueNAS 组 raid1 做热备份吧,尽量使用不同批次的磁盘避免同期问题,并且多准备一些硬盘做冷备份。等后期预算上来了直接去买企业服务吧,毕竟有原厂保障相对稳点。
pckillers
2024 年 11 月 12 日
能够加密压缩 zip 包后直接云上买对象储存的冷备,说不定是最不折腾的了。 预算够可以多买几家云多重备份。

但是因为规章制度问题必须自己本地架服务器的话就有的好折腾了。

硬盘冷备是最不折腾的,但风险也不是最低的。 因为硬盘也有暴毙的风险。 机房也有火灾的风险。
fish2050
2024 年 11 月 12 日
@PrinceofInj 那个自然是刻盘了,盘上贴上标签纸
swLoXtOtd89pGg8t
2024 年 11 月 12 日
@sadwxds #47 长时间断电丢数据是固态
8355
2024 年 11 月 12 日
我大概考虑了下目前的实现方案,发现并不是很困难,其实就是有保修的可靠商用硬件即可,目前的存量数据并不是很大。
每年大概 1pb 按照 100 个项目每个 10tb 计算,你们的硬件必然是随着保修期长期购买新硬件淘汰老硬件的过程。
公司需要有专业的的硬盘维修和数据恢复修复人员。
乐观估计按照技术发展每年单块硬盘最大容量翻一倍计算,每年需要保持购入 2pb 容量的硬件作为主备,每年的成本会持续降低到一个差不多的固定线进行维持。
Huelse
2024 年 11 月 12 日
paopjian
2024 年 11 月 12 日
这么特殊的公司?应该走档案库级别数据存储方案吧, 还整什么 trusNAS smb 实在是嫌死的不够快,
每个项目都应该用磁带/磁盘/光盘单独存储, 两地三备份, 物理隔离保护, 定期归档拷贝销毁
ipengxh
2024 年 11 月 12 日
@paopjian
1. 档案级别数据存储方案具体是什么样的?
2. TrueNAS+SMB 的缺陷在哪?为啥会死得快呢?
3. 两地三备份等措施成本过高,甲方不会承担如此高的成本的。
nicoljiang
2024 年 11 月 12 日
如果所有内容都会压缩加密的话,确实可以上云,缤纷云的成本比较低。
我们目前也在开发自部署方案,是自研的。
如果需要的话,我们可以讨论一下私有化方案。
xpfd
2024 年 11 月 12 日
你这些都有成熟方案 楼上都说了 分级存储 冷数据 多份备份 硬盘 光盘 磁带 别放一个地方
PeterPig
2024 年 11 月 12 日
数据敏感的话其实还是建议遵循 3-2-1 原则,磁盘和磁带搭配可能还是最好的选择。磁带的主要成本还是在磁带机上,算下来反而是越用单位成本越低的。如果前期价格敏感的话如果规章制度允许可以考虑下闲鱼货,我记得有看到过 LTO8 的 30T 只要 300+的,磁带的单 T 成本绝对是远低于磁盘,而且没有磁盘这种经常通电保持状态的要求,更有利于大规模的冷数据存储
cainiuwow
2024 年 11 月 12 日
如果是我,我选择群晖,重要资料不敢放在一个开源的 nas 系统上,群晖起码有售后,很多大型企业和高校都用群晖。
如果前期资金少,那就现 raid1 ,等后期再换其他方案,即使有钱,也没必要一步到位,万一过几年有重大技术革新呢。
luoshengdu
2024 年 11 月 12 日
到我的销售强项了,可以了解一下 qnap 和 seagate 的方案。
https://www.qnap.com.cn/zh-cn/solution/high-density-with-seagate-jbod

通过 qnap 的高性能 nas 机头,加上希捷 5u84 的扩展柜。2u 机头+两个 5u 的扩展柜,即可实现 4pb 左右的容量。节约占地面积,高可靠性

方案特性,
长期存储的功耗非常客观,可定制硬盘的功耗,降低 TCO 。
原厂的兼容认证,无后顾之忧
NAS 对于文件权限天生有优势,精确到用户的控制(不允许项目外的人访问(不允许枚举目录))
希捷原厂磁盘柜+硬盘,硬件诊断有最佳优势,避免硬盘损坏的风险
更可使用希捷高级的 Exos® CORVAULT™自修复型存储,自动管理故障,自动修复故障
QNAP 原厂的系统在各种主机间平滑迁移,坏主机,坏硬盘,都不怕

缺点:比自组略微费钱,但比起其他品牌的那相当省钱了。优点:很省心

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1088741

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX