X

News, tips, partners, and perspectives for the Oracle Solaris operating system

Sun Cluster 上的 Oracle

Guest Author

Oracle 是到目前为止在 Sun Cluster 3.x 上运行的最受欢迎的服务。Sun Cluster 支持高可用性 (highly available, HA) Oracle、Oracle Parallel Server (OPS) 和 Oracle Real Application Cluster (RAC),从而为用户提供了非常广泛的选择。以下是大大增强其吸引力的有关发行版、操作系统和平台的广泛适用范围。

SPARC 上的 HA Oracle 代理支持许多 Oracle 发行版,从 Solaris 8 上的 8.1.6.x 到 Solaris 10 上的 10.2.0.x,以及介于两者之间的各种发行版。此外,适用于(64 位)x86 HA Oracle 代理的 Sun Cluster 3.1u4 支持 Oracle 10g R1(32 位)和 10g R2(64 位)。

并行数据库适用范围同样很广,其中 SPARC 平台支持许多卷管理器(Solaris Volume Manager 和 Veritas Volume Manager)以及从 8.1.7 到 10.2.0.x 的 Oracle 发行版。此外,64 位 x86 平台上还支持 Oracle 10g R2 (10.2.0.x)。

此外还有许多 Oracle 数据存储选项:适用于 HA Oracle 的原始磁盘、高可用性本地文件系统和全局文件系统;适用于 Oracle OPS 的原始磁盘或网络连接存储,以及适用于 Oracle RAC 的原始磁盘、网络连接存储共享 QFS 文件系统

但为什么指出 Sun 支持这些发行版,为什么 Sun 不支持每个硬件和软件组合中的所有发行版?答案是高可用性是 Sun Cluster 最重要的目标,而此目标的实现并非偶然。它需要对所有代码更改进行广泛的同级评审来仔细地设计和实施软件,随后要进行非常严格的测试。

我大约是在去年才加入工程组的,实际所执行的测试数量之多让我感到很吃惊。而看到与 Oracle 之间的工程关系如此紧密,也很令人鼓舞。对于 64 位 x86 Solaris 上的 Oracle 10g R2 的最近发行版,与我协同工作的团队对该产品执行了各种 Oracle 设计的测试。这些测试检查了安装过程、它的“伸缩”功能(即添加或移除节点)以及它与先前发行版的共存性(每个发行版均针对各种类型的存储选项)。这些测试进行了数百次,如果发现错误,则通常需要重新测试并且这些只是 Oracle 强制测试。此外,Sun Cluster QA 还执行了广泛的负载与故障注入测试。

正是后面的这两项测试使得 Sun Cluster 在可靠性方面与众不同。安全保证策略是否值得投资取决于用户对于该策略在发生故障时能否“起到相应的作用”的信心度。当系统出现故障或负载较高时,用户级进程通常不响应,或可能仅在较长的延迟之后响应。此外,还可能很难确定其他群集节点是处于活动状态还是已经停用。此时,Sun Cluster 将发挥自身的作用;基于内核的成员监视器可以很快确定群集节点是否处于活动状态并采取措施(即故障隔离),以确保已发生故障或正在发生故障的节点不会损坏关键客户数据。

通过使用自动化测试工具,Sun Cluster 的质量保证 (Quality Assurance, QA) 团队能够模拟各种故障条件,如中止关键进程或异常中止节点。可以在测试周期的任何时刻重复执行这些操作。即使群集正在从前面的故障恢复,也可以注入故障。此外,QA 团队还执行一组全面的手动物理故障注入,如断开网络电缆连接和存储连接。这一切均有助于确保群集处于正常状态并继续提供服务,即使在出现级联故障以及负载极高的情况下也是如此。

通过此级别的“认证”而非简单的功能性回归测试意味着 Sun Cluster 能够实现竞争产品很难达到的服务可用性级别。

Tim Read,高级工程师

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.Captcha