time 
设为首页】【收藏本站
当前位置: 主页 > Unix/Linux > Linux管理 > Linux集群 > GPFS 在 Linux 集群中的灾难恢复

GPFS 在 Linux 集群中的灾难恢复

时间:2010-07-01 22:46 点击:4854次 字体:[ ]




  灾难恢复是当前存储技术领域的热点之一。GPFS (General Parallel File System) 作为一个支持多节点的并行文件系统,在其长期运行过程中可能遇到各种问题(软件问题和硬件问题)而造成其中的某些节点不能正常工作。GPFS 提供了强大的功能来进行灾难恢复,以确保数据安全。本文根据 GPFS 的容灾特性提出了两种灾难恢复 ( disaster recovery) 的解决方案。一是将问题节点从 GPFS 集群中移除,使 GPFS 集群在剩下的健康节点上继续工作;二是重新安装配置问题节点,再对原有 GPFS 集群进行恢复,使其健康运行。采用这两种解决方案都可以快捷地恢复 GPFS 系统,从而保证整个 GPFS 集群正常的工作。最后,以实例的形式给出了详细的实现步骤以及实例分析。

  GPFS 文件系统相关介绍

  IBM General Parallel File System(GPFS) 是高性能、可扩展、并行文件系统。通过它,可以构建一个高可用、高性能的大型 Linux 计算机集群。GPFS 提供了强大的灾难恢复功能。从而,通过 GPFS 可以构建高可用的 Linux 集群。

  GPFS 文件系统

  GPFS 是一个并行的共享磁盘文件系统,它保证在资源组内的所有节点可以并行访问整个文件系统。GPFS 允许客户共享文件,而这些文件可能分布在不同节点的不同硬盘上。它提供了标准的 UNIX 文件系统接口。GPFS 能够很好的支持 UNIX 文件系统的工具,用户可以在 Linux 集群中像使用普通文件系统一样使用 GPFS 文件系统。它可以很好的应用在 Linux 集群中。

  GPFS 节点可能发生的问题

  GPFS 是由多个节点组成的集群系统,我们在 GPFS 长期运行过程中,可能有软件问题,比如集群中某个节点 GPFS 文件系统崩溃;也可能有硬件问题,比如系统磁盘坏掉,这样就会导致集群中某个节点不能工作。这些问题在 GPFS 集群长期运行过程中都是很可能遇到的问题,在遇到这种问题后,我们执行“mmgetstate – a”就会发现问题节点的状态不正常。状态“active”表示正常,其他状态都是异常。



本文地址 : http://www.fengfly.com/plus/view-182078-1.html
标签: 恢复 文件 节点 集群 灾难 GPFS
------分隔线----------------------------
最新评论 查看所有评论
发表评论 查看所有评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码: