什么東西可以監(jiān)控OpenStack呢?OpenStack對監(jiān)控的需求起碼有以下這些:
- 不僅要能監(jiān)控物理機,也能監(jiān)控虛機
- 監(jiān)控信息也必須是tenant隔離的
- 監(jiān)控項的收集應該是自動地
- 監(jiān)控工具應該一般化以監(jiān)控任何設備
- 監(jiān)控工具必須提供API
下面是監(jiān)控工具的一般架構(gòu):

網(wǎng)上搜索了一下,現(xiàn)在主流的監(jiān)控工具有:Nagios, cacti, Zabbix, Muni, Zenoss。我不是做運維的對這些工具都不熟,以前不熟,現(xiàn)在也不熟。下面是一些理解,不一定準。
Nagios,最老牌了,比較通用的監(jiān)控工具。特大的特點是報警。圖形化功能一般般。一般要安裝Agent,配置起來看網(wǎng)上的說法是比較復雜的,沒用過,沒實際發(fā)言權(quán)。
cacti,圖形化功能不錯,所以Nagios一般結(jié)合它來使用。
Zabbix,監(jiān)控和圖形化功能都還可以了,尤其有一本電子書 zabbix 1.8 network monitoring
Zenoss, 監(jiān)控新貴,它使用無Agent的通用技術(shù)如SNMP和SSL來監(jiān)控,部署起來會比較方便。尤其是Zenoss公司有人現(xiàn)在也加入OpenStack社區(qū)了,專門開發(fā)了一個OpenStack特有的擴展(
https://github.com/zenoss/ZenPacks.zenoss.OpenStack)不幸的是,目前只支持Nova API 1.1,且它只能收集單個tenant的數(shù)據(jù),不利于rating和billing。
OpenStack Ceilometer工程主要監(jiān)控的是tenant下虛機的數(shù)據(jù),用來做billing的,物理機的監(jiān)控支持不大好。
比較來比較去,如果是我,可能會做如下選型決定,不一定正確 :
Nagios 或者 Zenoss (視情況)
下面內(nèi)容來自:http://docs.openstack.org/developer/ceilometer/, 我們看一下Ceilometer工程的現(xiàn)狀, 架構(gòu)如下:

運行OpenStack各組件的節(jié)點上一般有Agent來收集信息,收集后發(fā)給MQ,Ceilometer的Collector進程監(jiān)控到數(shù)據(jù)之后存儲到DB之中。從http://docs.openstack.org/developer/ceilometer/measurements.html 這頁顯示的監(jiān)控項來看,目前Ceilometer監(jiān)控來的數(shù)據(jù)主要來只是用來做billing的。
文章來源:http://blog.csdn.net/quqi99/article/details/9400747
文章作者:張華 http://blog.csdn.net/quqi99