您的位置:首页 > 其它

vmware启动xorg失败排错!K1 K2卡

2013-11-11 00:12 357 查看



近期做基于3D的远程桌面系统部署,主要测试citrix desktop和vmware vSGA方案。

经测试,vmware在3D远程桌面确实差远了。

vmware安装时总是无法启动xorg服务。经大量测试,大量翻墙,最终确认:

vmware做vSGA方案时仅能使用1块K1卡。如果需要使用多个K1卡,请更换为Citrix方案!

xorg排错具体如下:

10.1.1.1 确认是否已安装 NVIDIA VIB 捆绑包

# esxcli software vib list | grep NVIDIA

如果已正确安装 VIB,则输出结果应当与下面的示例相似:

NVIDIA-VMware 304.59-1-OEM.510.0.0.799733 NVIDIA VMwareAccepted 2012-11-14

10.1.1.2 确认 NVIDIA 驱动程序是否已加载

# esxcli system module load –m nvidia

如果驱动程序已正确加载,则输出结果应当与下面的示例相似:

Unable to load module /usr/lib/vmware/vmkmod/nvidia:Busy

如果 Nvidia 驱动程序没有加载,请检查 vmkernel.log:

# vi /var/log/vmkernal.log

搜索“NVRM”。

一般来说,如果 GPU 有问题,vmkernal.log 中会指出

10.1.1.3 确认主机中是否存在显示设备

# esxcli hardware pci list –c 0x0300 –m 0xff

输出结果应当与下面的示例相似:

000:001:00.0

Address:000:001:00.0

Segment:0x0000

Bus:0x01

Slot:0x00

Function:0x00

VMkernel Name:

Vendor Name:NVIDIA Corporation

Device Name:NVIDIAQuadro 6000

Configured Owner:Unknown

Current Owner:VMkernel

Vendor ID:0x10de

Device ID:0x0df8

SubVendor ID:0x103c

SubDevice ID:0x0835

Device Class:0x0300

Device Class Name:VGA compatible controller

Programming Interface:0x00

Revision ID:0xa1

Interrupt Line:0x0b

IRQ:11

Interrupt Vector:0x78

PCI Pin:0x69

Spawned Bus:0x00

Flags:0x0201

Module ID:71

Module Name:nvidia

Chassis:0

Physical Slot:1

Slot Description:

Passthru Capable:true

Parent Device:PCI 0:0:1:0

Dependent Device:PCI 0:0:1:0

Reset Method:Bridge reset

FPT Sharable:true

注意::::::

该步骤如果出现Module Name: None状况,xorg服务是无法启动的!!!

由于vmware在设计该方案时采用的是Q5000和Q6000的卡,非K系列卡,故未发现该问题!!而在虚拟化环境中,大量采用K1或K2的卡,安装时均会卡在本步骤!

解决方法如下:

在BIOS设置中关闭"64 bit PCI ressource"选项(在部分型号主板中为above 4G)。保存BIOS配置重启后故障修复,xorg顺利启动!!!

故障分析:

K1的架构为4块Q5000,显存达到奇迹般的16G。PCI-E 3.0标准较传统的2.0支持更大的带宽,采用更高的编码,支持到更快速的设备,在默认情况下,所有设备均需要使用64位的PCI ressource。而vmware方案需要单独的nvidia驱动,该驱动据说开发时缺少nvidia相关人员的参与,因此性能发挥很差,不支持64位PCI ressource。

关闭64 bit PCI ressource后单张K1卡可以正常工作。

但多张K1(2张或以上)卡工作时,由于PCI-E设备自身内存的和超过了PCI-E 3.0总线默认情况下的32G(数据推测),故必须要开启64 bit PCI ressource。

而开启64 bit PCI ressource后vmware的xorg又无法启动。

郁闷纠结中,垃圾vmware。。。。。

10.1.1.4 可能会发生的 PCI 总线插槽顺序问题

如果您需要在服务器中安装另一个低端 GPU,则 PCIe 插槽中的显卡的顺序可能会导致为 ESXi 控制台会话选择高端显卡。如果发生这种情况,您只需交换两个 GPU 使用的 PCIe 插槽,或者在服务器 BIOS 中更改“Primary GPU”(主要 GPU)设置即可解决问题。

10.1.1.5 检查 Xorg 日志

如果存在正确设备,则查看 xorg 日志文件可能会有帮助,可以看到是否存在任何明显问题。

# vi /var/log/Xorg.log

10.2 sched.mem.min 错误

如果您收到关于 sched.mem.min 的 vSphere 错误,请在虚拟机的 .vmx 文件中添加以下参数。

sched.mem.min = “4098”

注意: “4098”需要与配置的虚拟机内存量一致。上例适用于具有 4 GB RAM 的虚拟机。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: