当前位置:文档之家› IPMI与BMC

IPMI与BMC

IPMI与BMC
IPMI与BMC

什么是BMC(基板管理控制器)?

在BMC中完全實現IPMI功能需要一個功能強大的16位元或32位元微控制器以及用於數據儲存的RAM、用於非揮發性數據儲存的快閃記憶體和韌體。一個提供IPMI v1.5的典型BMC大約需要

32k RAM和128k快閃記憶體。在這種情況下,伺服器可管理性的實現總成本(包括BMC chip、BMC 韌體和健康監視元件)將達40-50美元。這麼高昂的成本將極大地限制IPMI協議在低成本伺服器和網路連接設備中的推廣應用。

采用IPMI協議的一種創新性解決方案是利用高性價比的迷你基板管理控制器,它在安全遠程重啟、安全重新上電、LAN警告和系統健康監視方面能提供基本的IPMI v1.5遠程可管理性。由於性價比高,這款控制器還能用來管理網路設備,如公用桌上型電腦、印表機、集線器、數位電視視訊轉換盒等。

這種控制器是一種一站式解決方案,用戶無需做大量的韌體開發工作,因此能縮短新設計伺服器的面市時間。另外,因為mBMC相容IPMI,因此它能應用於任何相容IPMI的遠程終端設備。

這種低成本控制器非常適合用於多種遠程管理,比如刀鋒型伺服器、公用桌上型電腦、印表機、集線器和家庭網路設備(網路閘道、數位視訊轉換盒)等。

mBMC會周期性地輪詢數位感測器來監視系統工作狀態,并通過SMBus介面與主機通訊,還提供一個用於本地系統管理、‘推進’警告和存取非揮發性記憶體的介面。

推進’警告用於從主機發送LAN警告到遠程終端以通知BIOS或作業系統產生的任何事件。例如,緊急BIOS POST代碼可以通過LAN從典型的0×80 I/O埠重定向到遠程終端。

除了基本的IPMI功能和系統工作監視功能外,通過利用2個快閃記憶體之一儲存以前的BIOS,mBMC 還能實現BIOS快速元件的選擇和保護。例如,在遠程BIOS升級後系統不能啟動時,遠程管理人員可以切換回以前工作的BIOS映像來啟動系統。一旦BIOS升級後,BIOS映像還能被鎖住,可有效防止病毒對它的侵害。

mBMC的主要功能總結如下:

(1)為遠程系統管理提供IPMI v1.5 LAN消息,包括系統狀態監視;重啟、重新供電、斷電等底板控制;FRU資訊,少量SEL資訊用入口;BIOS保護和選擇。

(2)為本地系統可管理性提供IPMI v1.5消息。

(3)對LAN消息采用MD5簽名以保證遠程連接的安全性。MD5簽名加上私有密碼能夠很好地保護系統免受外部的侵襲。

(4)BIOS或OS可以將‘推進’警告作為SNMP Traps,并通過LAN報告嚴重事件。

(5)自發地進行系統健康監視并對嚴重事件產生糾正動作。

(6)LAN警告。

随着“云”概念的落地,包络融合各类设备的“大云”(公有云)、“小云”(私有云)层出不穷,IT运维所面临的情况也愈加复杂.使用管理软件在异地中心对无人机房实施远程监控/管理,成为目前IT运维的典型实践.

传统上的IT运维软件源于网管软件,基于SNMP协议架构.随着SNMP协议的不断完善,可以支持的设备种类也越来越多,交换机、路由器、服务器、磁盘阵列、UPS等均可以纳入管理域,实现自动告警,远程,动态实时维护。

标准的SNMP网管架构分为被管理的设备(Managed Device)、SNMP管理器(SNMP Manager)和SNMP代理(SNMP Agent)三个部分。对设备的应用有大致可分为2类:

1. 保证网络配置正常的情况下,交换机,路由器,磁盘阵列等有自带微操作

系统的设备,只要开机即可启动代理,实现被管理;

2. 对于服务器这类安装有多种异构操作系统的设备,需要在安装好的系统里

添加欲管理设备(比如RAID卡,网卡)的代理,方可实现管理。

类型一的健壮性要优于类型二,不足之处在于相对封闭,灵活性差;

类型二开放性好,可以灵活更新、升级以支持新设备,新特性,但是需要一个健康的操作系统。如果操作系统故障则无法保证代理正常运行。

例如笔者遇到的一个典型故障:

由于人员疏忽,在做系统更新时,将网卡配置文件里的DEVICE的D删除,余下EVICE 字段,重新启动后,更新过的服务器因为网卡不能正常启动而全部离线.

传统的解决方法是:委派机房管理人员逐一修改网卡配置;不过,考虑安全因素,一般都是用户自己的技术人员去机房修改.维护的时间开销是以小时计的,难以令人满意.

如何迅速解决此类事件呢?IPMI管理卡正好大显身手.

智能平台管理接口(IPMI) 是一种开放标准的硬件管理接口规范,该标准由Intel、HP、NEC、Dell和SuperMicro等公司制定。自1998 年,IPMI论坛创建了IPMI标准以来,已经有2次重大的版本演进.

1998年v1.0实现远程监控系统温度、电压;

2001年v1.5,新增PCI Management Bus等功能;

2004年v 2.0,能够向下相容IPMI 1.0及1.5。新增了Console Redirection,并加强了安全、VLAN 等特性。

IPMI 信息通过基板管理控制器(BMC)进行交流。使用底层硬件智能管理而不使用操作系统进行管理.

IPMI管理有2个主要优点:

首先,操作系统无关性,只要设备加电,BMC正常工作,即能实现管理;

其次,可以实现带外管理,即不占用业务传输的数据带宽。

操作系统无关性为维护带来了很大便利,可以使用户在软件系统故障时依然对设备保持有效的控制,进而完成修复工作.

一个完整的IPMI系统有下列几个组件:

BMC:Baseboard Management Controller

IPMB:Intelligent Platform Management Bus

ICMB:Intelligent Chassis Management Bus

SDR:Sensor Data Record

SEL:Sensor Event Log

FRU:Field Replacement Unit

BMC(Baseboard Management Controller)是核心控制器,系统管理软件对各个被管理单元的管理,都是由BMC来实现的。

IPMB(Intelligent Platform Management Bus)总线上连接着各个控制器,分别执行不同功能。IPMB总线上还连接着一些I2C芯片,作为传感器接口,让管理软件能够通过IPMB读取传感器数据。同时,这些传感器的具体配置信息,如告警阈值、事件触发是否允许等配置都作为SDR(Sensor Data Record)数据保存。上述操作生成的事件日志则保存为SEL(Sensor Event Log)数据。

在IPMB总线上,连接着一个ICMB(Intelligent Chassis Management Bus)桥,通过ICMB可以实现多个IPMI管理平台之间的通信。

下面我们就具体看一个带IPMI管理功能的服务器主板。

主板逻辑架构图,可以看到BMC芯片自带有DDRII内存接口、VGA接口、管理网卡接口。后两者是实现网络远程管理及远程KVM的基础。

主板IO接口分布图。其中接口1就是专门用于IPMI的管理网卡接口。在有些主板上管理网口也可以复用在板载网卡1(接口4)上。

管理卡的IP(即BMC IP)可以在BIOS内方便设定,也可以通过软件在管理界面设定。

IPMI管理主要有以下3个途径:

1.命令行,一般用于linux的字符终端下;

2.Web,使用带Java虚拟机的浏览器;

3.单独的管理软件,如IpmiView,可以集中管理多组平台,不像Web方式,为每个被管理节点都要开一个页面,占用资源少。

三者可实现的功能无区别,由用户视具体情况选择。2与3 的操作界面类似,下面各图源自IpmiView软件。

初始界面,左侧窗口可以看到有多个IPMI管理阈。右侧是具体选定的服务器IP及用户名密码输入窗口。Connected表示已经建立连接。点击下面的标签可以进入对应的管理页面。

电源管理及BMC重置界面

从这里可以实现加电服务器的远程开关机,无需人员到现场按Power钮。即便服务器有故障,不能正常引导进入系统,此功能也不受影响。

SEL界面

在这里能看到所有管理日志,为故障判断、系统维护提供有力支持。当现场工程师不能确定故障原因时,可以通过selview等软件将日志保存出来,提供给厂商技术人员分析。

SDR界面(温度,风扇转速监控)

传感器的历史记录

历史记录有助于分析不同负荷下系统的工作状态,为维护提供参考。

BMC设定

在此页面设定BMC IP(与BIOS的设定联动)以及SNMP信息。边上的Users页面内可以设定登陆的用户名,密码,权限;还可以获得被管理平台的序列号、IPMI版本、厂商等信息。

文本控制台(串口重定向)

在没有安装Java虚拟机的情况下,KVM overIP是无法打开的,这时可以通过串口重定向获取一个字符界面来操作被管理服务器。不过多数情况下,还是使用KVM over IP 更加方便。

KVM over IP界面

KVM over IP是通过发送Java数据包来实现的,所以需要在管理机上安装Java 虚拟机.(较早版本的管理卡会自带JavaRunTime,先发送给管理机,但是这样会大大增加初始数据流量,所以后来的管理卡只发送与操作有关的数据)在安装Java虚拟机后,即可打开如上的界面。如同在现场一样操作键盘、鼠标、显示器。

KVM over IP的最大优点是覆盖范围广,只要能Ping通并没有数据包过滤设置,就可以使用。不足之处在于可能会有一些延迟,反应较慢,这取决于网络质量。

KVM over IP的另一个重要意义在于,能看到现场设备的屏幕显示状况。比如一台服务器系统崩溃了,屏幕出现大量报错信息,有经验的远程维护人员可以及时看到并保存,以分析对策。大大提高维护的针对性、有效性。

虚拟媒体及驱动器重定向

IPMI的另一个显著优点。远程挂载媒体意味着能够不依赖业务网络而把文件复制到目标服务器上。原理是通过挂载管理机ISO文件或者分区的方式共享给被管理机使用,文章开头的故障就是通过远程管理卡为每台服务器上传了正确的网卡配置文件,重启后系统即自动上线了,省时省力。

组管理界面

使用IpmiView可以实现服务器分组管理,较Web的单台服务器管理方式效率大大提高,是值得选择的方案。

从上面的介绍中可以看到,IPMI最大的优势在于其独立性,所以在系统运维实践中,一般都建议单独构建一个IPMI管理内网。如下图:

我总结出一些经验供大家参考:

1.管理节点可以选用低配置的服务器或PC机,windows系统,硬盘容量大一些(考虑到可能要存放各种ISO及维护升级用软件),做好防护,接入公网;

2.条件允许的前提下,尽量使用单独的管理网口组网,若机房布线有困难则考虑复用板载网卡;

3.服务器按照业务,操作系统等分组管理。因为管理IP与业务IP完全无关,所以要明确对应关系,以免弄错。

主要的服务器厂家都有Ipmi管理卡产品,如HP ilo,Dell DRAC,Intel RMM;此外,还有一些方案出于成本考虑提供了基本的IPMI功能,没有独立的管理网口(复用网卡1),不支持KVM over IP和媒体重定向,仅能通过命令行方式实现管理功能。

最常用的命令行工具是Ipmitool,是一个开源软件.

https://www.doczj.com/doc/e31625488.html,/manpage.html

ipmitool可以操作本机的管理卡,也可以操作远程机器的管理卡,操作远程机器需提供远程管理卡的地址,用户名和密码.基本命令格式如下:

ipmitool -H -U -P

Dell、HP另有自己专门的命令行工具。

此外,由于Ipmi是开放标准,所以有特殊需要的用户可以自行开发定制化程序以满足需求.

从上面的简单介绍可以了解到,Ipmi在系统运维中可以发挥强大的作用,成为管理员的有力工具。相比基于SNMP的系统管理软件,Ipmi管理卡在系统宕机等严重故障发生时,更能体现出其价值。虽然单独构建管理网络会增加一些成本,但是相比带来的维护便利还是值得的。

目前还少有能将SNMP和Ipmi有机结合的管理系统,不过我认为将两者统一用于IT运维的方向是很有前途的。

相关主题
文本预览
相关文档 最新文档