6 Common Data Center Problems and Issues

Park Place Hardware Maintenance


迈克·詹宁斯,产品管理总监的大头照
Michael Jennings Published: April 25, 2022

管理数据中心基础设施可能是一项全天候的工作. 您的利益相关者期望100%的正常运行时间,无论是否合理. Between backups, security, resource utilization, and replacements, 你觉得自己更像消防员而不是系统管理员. 制定一个计划可以减轻你的责任压力.

在云计算和内部部署操作中识别和应用数据中心挑战和解决方案是IT成功的关键. 通过考虑以下六个常见的数据中心问题, 你要做好准备,在这些问题影响到你的运营之前识别并解决它们. 我们将首先关注数据中心面临的六大挑战,即:

  1. Data Center Design
  2. Power Supply Failure
  3. Environmental Issues
  4. Networking and Cabling
  5. Security
  6. Management

1. 数据中心设计问题-基础设施和容量规划

一些顶级数据中心挑战围绕着数据中心内的物理空间. Whether it’s too little space, too much space, or excessive heat due to hardware proximity, poor planning for your data center physical infrastructure can have significant and lasting effects. See the failures of IT infrastructure capacity planning below, and explore how you can prevent them!

Insufficient Space for Expansion

足够空间的重要性怎么强调都不为过.

  • Is there room for expansion?
  • 规划条例允许你的中心扩张吗?
  • 环境是否允许数据中心向外扩展?

糟糕的数据中心设计可能会限制数据中心未来的发展. Having to engage in a data center relocation 由于不可预见的增长可能对业务连续性和费用产生重大影响.

illustration of common data center problems

Too Much Space After Equipment Refresh

When consolidating old and new servers, 规划人员需要意识到,虽然新CQ9电子器更小,并且具有更小的物理足迹, 较新的CQ9电子器需要更多的功率,因为它们的能耗更高. There are differences in the demands of virtual servers vs. physical servers 这也会影响到你们工厂的需求.

At the same time, 这大大增加了设备刷新所需的冷却系统的数量. 这对数据中心的热足迹来说是一个重大挑战.

Challenges of Data Center Thermal Management

先进的热控制必须执行一个微妙的平衡行为,以实现适当的气流和温度,利用可用的冷却选项,如基于气流, water-based, and refrigerant-based systems.

将数据中心定位在可以通过冷空气和/或冷水自由冷却的位置, 因此,通常在遥远的北方或遥远的南方, 是否有助于减少数据中心热管理的挑战. Check out what 谷歌在芬兰一家废弃的造纸厂就做到了 利用波罗的海的水来冷却其数据中心.

2. 电源和/或不间断电源(UPS)故障

电源故障和所谓的不间断电源故障是计划外停机的最常见原因之一. 这些故障通常仅仅是由于规划不当和缺乏对必要的UPS设备的投资.

3. Data Center Environmental Issues

数据中心及其相关CQ9电子器在运行和热管理方面都有电源需求. 这些电力需求转化为能源需求. 数据中心是能源的巨大用户,那么我们从哪里获得这些能源供应呢?

一种选择是将数据中心建在经济实惠的能源附近. 从环保的角度来看,可再生能源显然是长期的候选者. For example, 位于有大量水力发电的河流附近的数据中心可能比位于核电站附近的数据中心更好, even if, in the short-term, 核能可能比水力发电便宜. 数据中心的规划应该考虑长期的环境影响.

According to Forbes在全球范围内,数据中心目前占电力需求的1%,贡献的电力为10%.3% of CO2 emissions. Energy efficiency, however, is key. 数据中心设计人员需要考虑总体能源消耗和能源效率. 在设计低成本能源时,只知道能源消耗是最小的或, conversely, that energy is not being used efficiently. Studies show 数据中心的容量通常没有得到充分利用,但闲置的CQ9电子器仍在消耗能源. 任何来自低成本能源的收益都必须得到有效和高效的利用.

4. 数据中心网络和布线的挑战

数据中心网络存在两个潜在的挑战. 首先是带宽:一个连接可以传输多少数据? Higher bandwidth means better network speed.

硬币的另一面是延迟:测量数据传输到目的地所需的时间. Latency is the delay of the data, 在宏观层面上,哪个是数据必须传输距离的函数.

data center problems with cabling

不管连接的速度如何,数据都必须传输一段距离. 在不同地点之间传输数据需要时间. 数据中心的网络依赖于速度:光纤电缆和短距离传输的数据可以避免数据中心延迟问题. Cables between your server, storage, 而且网络设备很快就会变得难以控制, 因此,事先制定一个计划可以防止未来的挑战.

除了距离,网络复杂性也很重要. 网络设备从来没有100%的效率,因为它们不断地优先考虑如何路由数据包. 最短的路线可能并不总是可用的. 数据可能需要通过更多的连接,这增加了延迟. In many cases, network bandwidth monitoring software 能帮你观察你的网络状况并做出相应的反应吗.

5. Data Center Security Issues

有几个常见的数据中心安全挑战, 从物理安全到访问相关问题, such as Denial of Service (DoS). In addition, there are data-related issues, 比如机密信息被盗, data being altered, or the pure loss of data. IBM’s recent study of data breaches 超过一半(52%)的数据泄露是由恶意攻击造成的, with the breakdown of root causes being:

  1. Compromised Credentials
  2. Phishing
  3. Cloud Misconfiguration
  4. Vulnerability in Third-party Software
  5. Physical Security Compromise

然而,到2021年,这些威胁不再是最昂贵的恶意数据泄露. Business Email Compromise now tops the list, from an average cost point-of-view, 紧随其后的是网络钓鱼和恶意内幕.

6. Data Center Management Issues

数据中心的管理具有挑战性. 最重要的是识别和消除数据中心运营的风险, 以实现关键系统的高可靠性和为客户提供高可用性为目标. 解决数据中心管理问题的一项关键技术是采用计算方法 数据中心基础设施管理(DCIM).

解决常见数据中心挑战的技术人员

DCIM通常监视、测量、管理和控制数据中心的:

  • 设备,如CQ9电子器、存储和网络
  • 电力分配和冷却系统等基础设施

DCIM的目标是允许从占地面积的角度全面查看数据中心的性能, equipment, and power/energy, 以及分析与这些标准相关的数据. DCIM应该允许设施确定它们的运行效率.

Real-time Network Monitoring and Reporting

DCIM的一个重要方面是正确地监视和测量网络运行. As stated previously, 在数据中心网络和布线中有许多挑战需要解决, 从关键系统之间的带宽到网络中涉及的延迟. Thus, DCIM需要网络的实时视图,以确保可以进行适当的报告和分析,以识别和修复任何潜在的瓶颈.

操作端监控和客户端监控可能是完全不同的挑战. 您可能会遇到并非源自数据中心内部的客户端问题, 但是DCIM工具不一定能帮助您确定真正的故障在哪里. Clients can leverage network monitoring software 以便更全面地了解他们的整个网络.

Optimizing Performance

高效的数据中心管理意味着优化性能. 对于数据中心来说,这意味着用更少的资源做更多的事情,同时确保 availability, Uptime, and reliability. 优化的一个关键组成部分是电力使用. 数据中心在其总功率需求方面的效率如何?

性能还与计算使用有关:有效地管理工作负载, and cooling efficiency. 优化良好的数据中心通常更可靠, 为客户提供额外的性能提升.

Reducing CAPEX and OPEX

运营自己的数据中心的组织正在进行资本支出投资,包括相关的前期成本和经常性升级成本. 典型的资本支出方法是将资源集中在组织的非核心业务上. Third party IT hardware maintenance 与OEM支持合同相比,可以有效地延迟设备更新的需要,同时节省30-40%.

替代方案是托管和基于云的数据中心,运营费用可控(OpEx)。. OpEx allows greater flexibility. Remote hands in data centers 是否还可以用于降低主机托管操作的成本,同时保持对网络的合理控制水平.

在面向资本支出和面向运营支出的方法中, 组织需要优化他们对资源的使用,以便他们只为他们真正需要的东西付费.

与合适的合作伙伴一起克服持续存在的数据中心挑战

使用几个不同的供应商很难实现全面的数据中心和网络优化. Park Place Technologies提供硬件维护, infrastructure managed services, network monitoring and management, and data center hardware sales from a single source!

立即CQ9电子,了解如何获得无缝支持,并与值得信赖的合作伙伴一起解决常见的数据中心问题.

迈克·詹宁斯,产品管理总监的大头照

About the Author

Michael Jennings,高级产品经理,负责产品管理
Mike的主要职责是维护和执行Park Place Technologies的Complex-EnterpriseCQ9电子器第三方硬件和软件维护的产品支持路线图和推出策略.