免费试用
新闻动态
高效、安全保护文件中集成的核心业务系统,根据业务需求,提供定制开发。
如何将大数据迁移到云存储
发布时间:2012年08月27日 来源:连用科技

      如今,很多企业的IT管理人员都在考虑将企业数据向云中迁移,云存储逐渐成为一个热门的趋势。如果为目前的信息技术产业搭配关键词,云存储无疑是其中之一。权威技术研究和咨询公司Gartner预测,到2015年,云存储将增长89.5%,市场份额达到28.8亿美元 ;到2016年,共享内容并且能够实现从多个设备上并发访问内容的愿望将促使消费者将超过三分之一的数字内容存储到云中 。越来越多的客户咨询有关将 50TB左右的数据迁移至云环境的问题。从理论上来说,将数据移至云环境是一个很简单的问题,而实际上,有很多重要的问题需要提前考虑,比如:您的带宽有多少?您的数据规模有多大?您需要恢复数据吗?可接受的数据恢复时间是多长?您的云服务提供商允许您来“植入”数据吗(例如,将驱动器或设备发送给客户,由客户在本地备份其数据,然后将驱动器/设备递送给提供商)?您的云服务提供商有基于云的服务器以便您能够直接从云存储恢复数据吗?

      接下来,让我们仔细分析两个计划将50TB 数据移至云端的客户案例。一个客户有一个 T1 线路,而另一个客户则有光纤OC3网络。

      例 1:具有 T1 线路的客户

      50TB 的数据,通过 1.544 Mbps,链路也称为 T1 线路)=       79124 小时或者近 3297 天

      首次通过 T1 备份 50TB 数据(典型重复数据删除率为 57%)= 33549 小时或 1398 天

      连续通过 T1 备份 50TB 数据(典型不间断重复数据删除率为 90%)= 8387 小时或 349 天,这代表了预计 10% 的日增量和 90%的重复数据删除率。在这个例子中,很显然,对于云服务提供商而言,收到每日增量数据的时间并不合理。

      例 2:拥有 OC3 网络的客户

      50TB 数据,通过 OC3 = 788 小时或者近 32 天

      首次通过 OC3 备份 50TB 数据(重复数据删除率为 57%)= 334 小时或 14 天

      连续通过 OC3 备份 50TB 数据(重复数据删除率为 90%)= 84 小时或 3.5 天,重申一下,这代表了预计 10% 的日增量和 90% 的重复数据删除率。云服务提供商仍然没有在 24 小时的时间窗口内收到每天的变更数据。如果要使提供备份或归档数据的时间窗口不超过24 小时,则是一个更大的挑战。

      另外,要说明的一点是,目前假设的是一个仅有最低 WAN 开销无其他网络负载的“原始”环境。但如果您使用这些线路上网、收发电子邮箱或拨打 IP 电话的话,那么,对于带宽和数据传输的时间影响不言而喻。

      下表列出了基于这些相同假设细分的 10TB 数据。


      这就是为什么我们在部署云存储前将需要考虑的问题列举出来,其实将数据写入云只是第一步而已。如果在灾难事件发生的情况下云是您公司的存储资源的一部分,那么将数据找回来特别是备份或者归档数据将更加重要。您的云服务提供商允许您向云端“植入”数据吗?您的云服务提供商有基于云的服务器以便您能够直接从云存储恢复数据吗?如果遇到灾难,您的云服务提供商会将存有您的数据的驱动器递送给您以供数据恢复吗?对这些问题的回答至关重要。

      随着大规模、50TB 数据云解决方案的出现,客户该如何应对上述数学挑战?现在,我要向大家介绍针对这一问题的一个有效的解决方案。在这个案例中,客户与一家云服务提供商密切合作,该提供商能够:1) 让客户将数据“植入”云环境 2) 基于 VMware 构建其计算云以充分利用物理到虚拟 (P2V) 技术。这种类型的云解决方案具有诸多优势。

      首先,向云环境“植入”数据的功能使客户能够将介质递送至云服务提供商,随后只需以在线方式即可发送变更数据。在充分利用了集成数据缩减技术(如源端重复数据删除和压缩)的情况下,这种方式显著减少了所需的带宽。

      其次,一旦出现灾难,客户能够通过服务提供商的云接入口进行数据恢复。由于服务提供商运行了 VMware,客户不仅能够进行数据恢复,还能够充分利用 P2V 技术 — 在 CommVault 的案例中,我们的 Virtualize Me功能能够自动将物理服务器恢复到虚拟机。此外,企业还应当向其云服务提供商询问他们是否能够使用工具来以多流方式将数据传至云,并最大程度利用带宽,尤其是,对于有专用 1Mbps 带宽客户。 

       CommVault的 Simpana 9软件中引入了第三代重复数据删除技术,可以在客户端删除90% 的冗余备份和归档数据。 Simpana 9 使用这种方式将客户端——磁盘——磁带中的重复数据删除扩展到整个企业,将网络中发送的数据量锐减90%,藉此有助于帮助企业显著加快将大量备份或归档数据迁移至云环境的速度。很多客户向我反馈,通过使用现代数据管理功能(如重复数据删除、压缩和多流等技术),显著缩短了他们向云环境迁移大量数据所需的时间 — 从数月缩短至数天,甚至数小时。

      对于将来考虑将硬件及物理设备迁移到“云端”的客户,希望以上的建议也会使他们云存储的部署准备更加充分和周到。因为,我们相信有效规划此类实施对于将数据迁移至云和测试数据恢复目标的成功具有举足轻重的作用。


最新新闻
文件数据“不落地”,企业文件数据防泄露的黄金法则
在AI时代,企业防止文件数据外泄露,是企业数字化中最挑战的难题之一。很多企业是上了数据DLP、终端DLP、云桌面等一系列的安全措施,但是企业的数据仍然每天都在外泄露。连用科技结合客户的实际应用场景,LFC 5.2提供了二种“数据不落地”模式 :1、文件外链+WEB在线文档模式; 2、文件安全沙箱模式 。
华为携手连用发布基于华为数据湖机台海量数据管理联合方案
华为联合连用科技推出基于华为存储数据湖的机台海量数据管理联合方案,融合华为在大数据、分布式存储、AI算法等ICT领域的领先技术和连用科技在数据归档应用系统方面的专长。联合方案旨在为制造业客户提供一个全面高效的工业智能化质检平台,以提升生产质量和质检效率,加速产线数字化转型。
连用科技发布 FSM5.2 文件安全交换新功能,推动行业发展新进程
近日,连用科技正式发布了 FSM5.2 文件安全交换新功能,这一重大举措为文件安全交换领域带来了全新的突破与变革,将对数据安全管理与高效传输产生深远影响。
连用中标某大型银行金融租赁电子文档中台+文件安全交换一体化平台
连用科技中标国内数千人规模的大型金融租赁电子文档中台和跨网文件安全交换一体化平台,助力企业实现高效安全的跨网文件交换管理与全球化办公协作。
重磅推出!连用Link AI 为企业业务提质增效,最大化释放知识价值
在当今信息爆炸的时代,企业面临着海量的数据和信息,如何有效地管理和利用这些知识资产成为一大挑战。然而,传统的搜索技术常常因只能进行关键字查询而无法满足对文档深层次理解的需求。
连用科技医疗行业文件安全统管平台解决方案:一体化打造安全、高效、智能的内容管理新生态
连用科技,作为业界领先的文件云解决方案提供商,针对医疗行业复杂多变的文件管理需求,倾力推出医疗行业文件安全统管平台解决方案。该方案依托连用科技文件云四大基础平台能力——统一存储管理、统一文件资产空间管理、统一内容计算能力、统一文件安全合规管控能力,实现了安全办公云盘应用、生产云盘空间应用以及医疗行业内容管理应用的高度集成与无缝对接,为医疗行业构建了一个安全、高效、智能化的内容管理新生态。
金融监管总局就《银行保险机构数据安全管理办法(征求意见稿)》公开征求意见
连用科技助力碳中和,推出绿色文件云归档方案
在全球碳中和目标的推动下,企业纷纷寻求对IT系统的绿色改造,以减少碳足迹,提升能源效率。在此背景下,连用科技适时推出了一款专为实现绿色环保、节能降耗而设计的文件云归档方案。该方案凭借其独特的技术特色与显著的经济效益,为企业数据存储管理提供了兼顾环保与成本效益的理想路径

留言