Xen集群管理与Ganeti在Debian Lenny上
版本1.0
作者:Falko Timme
Ganeti是基于Xen的集群虚拟化管理系统。 在本教程中,我将介绍如何在两个物理节点的群集上创建一个虚拟Xen机器(称为实例
),以及如何在两个物理节点之间管理和故障转移此实例。
本文档不附带任何形式的保证! 我不会保证这将为您工作!
[更新01/21/2010]我收到了Ganeti开发团队的一封信:
“ [...]近几个月来,我们发现不幸的是,人们试图按照你的指示来遵守信件,最后安装旧版或更旧的Ganeti版本,你可以更新这两个教程,并注意到它们不是更新了最新的Ganeti版本,并要求人们查看http://docs.ganeti.org/ganeti/上的最新文档 ? “
本教程基于Ganeti的旧版本。 请参阅http://docs.ganeti.org/ganeti/上的最新文档 。
1初步说明
在本教程中,我将使用物理节点node1.example.com
和node2.example.com
:
-
node1.example.com:IP
地址192.168.0.100
; 将成为集群的主人。 -
node2.example.com:IP
地址192.168.0.101
; 将是虚拟机的主节点(akainstance
)。
两个都有一个500GB的硬盘驱动器,我使用20GB的/
分区,1GB的互换,并让其余的未分区,以便它可以被Ganeti使用(最小是20GB!)。 当然,您可以将分区更改为您的喜好,但请记住最小的未使用空间。
我要创建的集群将被命名为cluster1.example.com
,它的IP地址为192.168.0.102
。 群集IP 192.168.0.102
将始终绑定到群集主机,因此即使您不知道主节点是哪个节点,也可以使用群集IP(或主机名cluster1.example.com
)连接到主节点使用SSH。
Xen虚拟机(在Ganeti中称为实例
)将被命名为inst1.example.com
,IP地址为192.168.0.105
。 inst1.example.com
将使用DRBD在两个物理节点之间镜像 - 您可以将其视为一种网络RAID1。
如您所见, node1.example.com
将是集群主控,即可以从中控制和管理集群的机器,而node2.example.com
将是inst1.example.com
的主要节点,即inst1.example .com
将在node2.example.com
上运行(将inst1.example.com
上的所有更改镜像到具有DRBD的node1.example.com
),直到将其故障转移到node1.example.com
(如果要将node2 .example.com
进行维护,例如)。 这是主动 - 被动配置。
我认为拆分两个节点之间的角色是很好的做法,这样一个节点就不会丢失群集主节点和主节点。
这里提到的所有主机名都应该可以解析到所有主机,这意味着它们必须存在于DNS中,或者必须将所有主机
名放在所有主机上的所有/ etc / hosts
文件中(这是我将在这里做的) 。
所有群集节点必须使用相同的网络接口(如eth0
)。 如果一个节点使用eth0
,而另一个节点使用eth1
,则Ganeti将无法正常工作。
好的,我们开始吧
2准备物理节点
node1:
我想要node1
具有192.168.0.100
的静态IP地址,因此我的/ etc / network / interfaces
文件看起来如下(请注意,我用auto eth0
替换了allow-hotplug eth0
,否则重启网络不起作用, '必须重新启动整个系统):
vi /etc/network/interfaces
# The loopback network interface auto lo iface lo inet loopback # The primary network interface #allow-hotplug eth0 #iface eth0 inet dhcp auto eth0 iface eth0 inet static address 192.168.0.100 netmask 255.255.255.0 network 192.168.0.0 broadcast 192.168.0.255 gateway 192.168.0.1 |
如果您修改了文件,请重新启动网络:
/etc/init.d/networking restart
然后编辑/ etc / hosts
。 看起来像这样:
vi /etc/hosts
127.0.0.1 localhost.localdomain localhost 192.168.0.100 node1.example.com node1 192.168.0.101 node2.example.com node2 192.168.0.102 cluster1.example.com cluster1 192.168.0.105 inst1.example.com inst1 # The following lines are desirable for IPv6 capable hosts ::1 localhost ip6-localhost ip6-loopback fe00::0 ip6-localnet ff00::0 ip6-mcastprefix ff02::1 ip6-allnodes ff02::2 ip6-allrouters ff02::3 ip6-allhosts |
接下来我们必须确保命令
hostname
和
hostname -f
打印出完整的主机名( node1.example.com
)。 如果你得到不同的东西(例如,只有node1
),请执行以下操作:
echo node1.example.com > /etc/hostname
/etc/init.d/hostname.sh start
之后, hostname
命令应显示完整的主机名。
然后更新系统:
aptitude update
aptitude safe-upgrade
node2:
现在我们在node2.example.com
上再次做同样的事情
(请记住, node2
具有不同的IP!):
vi /etc/network/interfaces
# The loopback network interface auto lo iface lo inet loopback # The primary network interface #allow-hotplug eth0 #iface eth0 inet dhcp auto eth0 iface eth0 inet static address 192.168.0.101 netmask 255.255.255.0 network 192.168.0.0 broadcast 192.168.0.255 gateway 192.168.0.1 |
/etc/init.d/networking restart
vi /etc/hosts
127.0.0.1 localhost.localdomain localhost 192.168.0.100 node1.example.com node1 192.168.0.101 node2.example.com node2 192.168.0.102 cluster1.example.com cluster1 192.168.0.105 inst1.example.com inst1 # The following lines are desirable for IPv6 capable hosts ::1 localhost ip6-localhost ip6-loopback fe00::0 ip6-localnet ff00::0 ip6-mcastprefix ff02::1 ip6-allnodes ff02::2 ip6-allrouters ff02::3 ip6-allhosts |
echo node2.example.com > /etc/hostname
/etc/init.d/hostname.sh start
aptitude update
aptitude safe-upgrade
3在可用硬盘空间上设置LVM
node1 / node2:
我们来看看我们的硬盘驱动器:
fdisk -l
node1:~# fdisk -l
Disk /dev/sda: 500.1 GB, 500107862016 bytes
255 heads, 63 sectors/track, 60801 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x00023cd1
Device Boot Start End Blocks Id System
/dev/sda1 * 1 62 497983+ 83 Linux
/dev/sda2 63 6141 48829567+ 8e Linux LVM
node1:~#
我们现在将使用剩余的硬盘驱动器创建分区/ dev / sda3
(在两个物理节点上),并为LVM准备:
fdisk /dev/sda
node1:〜#fdisk / dev / sda
此磁盘的柱面数设置为60801。
没有什么问题,但是这大于1024,
并且在某些设置中可能会导致以下问题:
1)在引导时运行的软件(例如,LILO的旧版本)
2)从其他操作系统启动和分区软件
(例如DOS FDISK,OS / 2 FDISK)
命令(m帮助):
< - n
命令行动
e扩展
p主分区(1-4)
< - p
分区号(1-4):
< - 3
第一个柱面(6142-60801,默认6142):
< - ENTER
使用默认值6142
最后一个圆柱体或+大小或+ sizeM或+ sizeK(6142-60801,默认为60801):
< - ENTER
使用默认值60801
命令(m为帮助):
< - t
分区号(1-4):
< - 3
十六进制代码(L型列表代码):
< - L
0空1e隐藏W95 FAT1 80旧Minix是Solaris启动
1 FAT12 24 NEC DOS 81 Minix / old Lin bf Solaris
2 XENIX root 39计划9 82 Linux交换/ So c1 DRDOS / sec(FAT-
3 XENIX usr 3c PartitionMagic 83 Linux c4 DRDOS / sec(FAT-
4 FAT16 <32M 40 Venix 80286 84 OS / 2隐藏C:c6 DRDOS /秒(FAT-
5扩展41 PPC PReP引导85 Linux扩展c7 Syrinx
6 FAT16 42 SFS 86 NTFS卷集da非FS数据
7 HPFS / NTFS 4d QNX4.x 87 NTFS卷集db CP / M / CTOS /。
8 AIX 4e QNX4.x第2部分88 Linux纯文本戴尔实用程序
9 AIX可启动4f QNX4.x第3部分8e Linux LVM df BootIt
OS / 2 Boot Manag 50 OnTrack DM 93变形虫e1 DOS访问
b W95 FAT32 51 OnTrack DM6 Aux 94变形虫BBT e3 DOS R / O
c W95 FAT32(LBA)52 CP / M 9f BSD / OS e4 SpeedStor
e W95 FAT16(LBA)53 OnTrack DM6 Aux a0 IBM Thinkpad Hi eb BeOS fs
f W95 Ext'd(LBA)54 OnTrackDM6 a5 FreeBSD ee EFI GPT
10 OPUS 55 EZ-Drive a6 OpenBSD ef EFI(FAT-12/16 /
11隐藏FAT12 56金弓a7 NeXTSTEP f0 Linux / PA-RISC b
12 Compaq diagnostics 5c Priam Edisk a8达尔文UFS f1 SpeedStor
14隐藏FAT16 <3 61 SpeedStor a9 NetBSD f4 SpeedStor
16隐藏FAT16 63 GNU HURD或Sys ab达尔文启动f2 DOS二级
17 Hidden HPFS / NTF 64 Novell Netware b7 BSDI fs fd Linux raid auto
18 AST SmartSleep 65 Novell Netware b8 BSDI交换fe LANstep
1b隐藏W95 FAT3 70 DiskSecure多bb启动向导隐藏ff BBT
1c隐藏W95 FAT3 75 PC / IX
十六进制代码(类型L列出代码):
< - 8e
更改系统类型的分区3到8e(Linux LVM)
命令(m为帮助):
< - w
分区表已被更改!
调用ioctl()重新读取分区表。
警告:重新读取分区表失败,错误16:设备或资源繁忙。
内核仍然使用旧表。
新表将在下次重新启动时使用。
同步磁盘
node1:〜#
现在我们再来看看我们的硬盘驱动器:
fdisk -l
node1:~# fdisk -l
Disk /dev/sda: 500.1 GB, 500107862016 bytes
255 heads, 63 sectors/track, 60801 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x00023cd1
Device Boot Start End Blocks Id System
/dev/sda1 * 1 62 497983+ 83 Linux
/dev/sda2 63 6141 48829567+ 8e Linux LVM
/dev/sda3 6142 60801 439056450 8e Linux LVM
node1:~#
看起来不错。 现在我们必须重新启动两个物理节点,以便内核可以在新的分区表中读取:
reboot
重新启动后,我们安装LVM(可能已安装,但最好是去确定):
aptitude install lvm2
重新启动后,我们为两个节点上的LVM准备/ dev / sda3
,并将其添加到卷组xenvg中
:
pvcreate /dev/sda3
vgcreate xenvg /dev/sda3
(Ganeti想要使用自己的卷组,这就是为什么我们创建xenvg
;理论上我们可以使用一个具有足够的未分配空间的现有卷组,但gnt-cluster verify
命令将会抱怨这一点)。