Search the VMware Knowledge Base (KB)
View by Article ID

“hpsa_update_scsi_devices 或 detect_controller_lockup_thread” PSOD 错误 (2088634)

  • 1 Ratings

Symptoms

免责声明:本文为 "hpsa_update_scsi_devices or detect_controller_lockup_thread" PSOD error (2075978) 的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本。
 
在 HP 硬件上运行主机失败并显示紫色诊断屏幕错误,您会看到以下错误之一:
  • hpsa_update_scsi_devices@<None>#<None>+0x39c
    hpsa_scan_start@<None>#<None>+0x187
    hpsa_kickoff_rescan@<None>#<None>+0x20f
    kthread@com.vmware.driverAPI#9.2+0x185
    LinuxStartFunc@com.vmware.driverAPI#9.2+0x97
    vmkWorldFunc@vmkernel#nover+0x83
    CpuSched_StartWorld@vmkernel#nover+0xfa


  • Panic: 892: Saved backtrace: pcpu X TLB NMI
    _raw_spin_failed@com.vmware.driverAPI#9.2+0x5
    detect_controller_lockup_thread@#+0x3a9
    kthread@com.vmware.driverAPI#9.2+0x185
    LinuxStartFunc@com.vmware.driverAPI#9.2+0x97
    vmkWorldFunc@vmkernel#nover+0x83
    CpuSched_StartWorld@vmkernel#nover+0xfa
    PCPU X locked up.Failed to ack TLB invalidate (total of 1 locked up, PCPU9s): X)

注意:有关其他症状和日志条目,请参见“Additional Information” 部分。

Purpose

要解决在 HP 服务器上运行的 ESXi 主机上的 hpsa_update_scsi_devices 或 detect_controller_lockup_thread 紫色诊断屏幕错误,请应用 HP 提供的更新驱动程序。

Resolution

这是一个影响 VMware ESXi 5.x 的已知问题。

要解决此问题,请应用 HP 提供的更新驱动程序。

有关详细信息,请参见:

对于所有 BL685c G7 刀片和 DL360p Gen8 服务器,HP 建议更新到 ESXi 5.5 update1 2014 年 6 月的版本。

提出此建议的原因如下:
  1. 解决了 smx-provider 内存泄漏问题。
  2. 关于 hpsa 驱动程序的几个问题在 .60 版本中得到了解决,此版本位于 ESXi 5.5 update1 2014 年 6 月的新版本中。hpsa 驱动程序的前一版本是 .50,该版本存在问题。
对于 DL360p Gen8 服务器,建议在所有服务器上将固件更新到 1.51。这是一个关键更新,可以避免在环境中导致 PSOD 错误的 NMI 事件。有关详细信息,请参见 HP Support Center

还建议检查 DL360p Gen8 服务器,确保其系统 ROM 至少为 2014 年 2 月的版本。这用于解决可能存在的 IPMI 问题。
 
如果在驱动程序升级之后此问题仍然存在,请执行以下操作:
  • 打开 HP 支持请求,引用 HP 实例 4648045806。
  • 如果此问题仍然存在,请向 VMware 支持提交支持请求。有关详细信息,请参见 Filing a Support Request in My VMware (2006985)
  • 向 VMware 支持提供您的 HP 案例编号。
免责声明:VMware 对第三方网站上数据、观点、建议或声明的可靠性不承担任何责任。包含此类链接不代表 VMware 认可、推荐此类站点的内容或接受相应的责任。

Additional Information

您还会看到以下症状:

  • 无法在 Hewlett Packard (HP) 硬件上运行主机。
  • 在主机变得无法响应前,您会在 /var/log/vmkernel.log 文件中看到类似以下内容的条目:

    WARNING: LinDMA: Linux_DMACheckConstraints:149: Cannot map machine address = 0xfffffffffff, length = 49160 for device 0000:03:00.0; reason = buffer straddles device dma boundary (0xffffffff)
    WARNING: Heap: 4089: Heap_Align(vmklnx_hpsa, 32768/32768 bytes, 8 align) failed. caller: 0x41802dcb1f91cpu4:1696102)<4>hpsa 0000:09:00.0: out of memory in adjust_hpsa_scsi_table

  • 在看到紫色诊断屏幕前,您会在 /var/log/vmkernel.log 文件中看到类似以下内容的条目:

    注意
    : 这些是来自 hpsa 驱动程序的多个内存错误消息。

    out of memory at vmkdrivers/src_9/drivers/hpsa/hpsa.c:3562
    out of memory at vmkdrivers/src_9/drivers/hpsa/hpsa.c:3562
    out of memory at vmkdrivers/src_9/drivers/hpsa/hpsa.c:3562
    out of memory at vmkdrivers/src_9/drivers/hpsa/hpsa.c:3562
    WARNING: Heap: 3622: Heap vmklnx_hpsa (39113576/39121768): Maximum allowed growth (8192) too small for size (20480)


    cpu7:1727675)<4>hpsa 0000:06:00.0: out of memory at vmkdrivers/src_9/drivers/hpsa/hpsa.c:3562
    cpu2:1727677)<4>hpsa 0000:0c:00.0: out of memory at vmkdrivers/src_9/drivers/hpsa/hpsa.c:3562
    cpu4:1727676)<4>hpsa 0000:09:00.0: out of memory at vmkdrivers/src_9/drivers/hpsa/hpsa.c:3562
    cpu3:1727738)WARNING: LinDMA: dma_alloc_coherent:726: Out of memory
    cpu3:1727738)<3>hpsa 0000:06:00.0: cmd_special_alloc returned NULL!

Tags

失去对存储的访问后 ESXi 主机反应迟钝,ESXi 滥发中断收到无效的矢量,忽略它,pcpu 22 锁定失败到 ack tlb 失效,hpsa 更新 scsi 设备或检测控制器锁定线程
 
简体中文 Simplified Chinese

See Also

Request a Product Feature

To request a new product feature or to provide feedback on a VMware product, please visit the Request a Product Feature page.

Feedback

  • 1 Ratings

Did this article help you?
This article resolved my issue.
This article did not resolve my issue.
This article helped but additional information was required to resolve my issue.

What can we do to improve this information? (4000 or fewer characters)




Please enter the Captcha code before clicking Submit.
  • 1 Ratings
Actions
KB: