Probléma leírása: a hálózati interface időnként kihagyott, csomagvesztést produkált. Mivel ez a host hálózati kártyáján történt ezért kihatással volt a VM-eken futó szolgáltatásokra (nfs, smb, web szerviz).
A logokban az alábbihoz hasonló sorok bukkannak fel:
Sep 09 14:46:42 pve kernel: e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
TDH <ab>
TDT <e4>
next_to_use <e4>
next_to_clean <aa>
buffer_info[next_to_clean]:
time_stamp <10010824a>
next_to_watch <ab>
jiffies <100108a20>
next_to_watch.status <0>
MAC Status <40080083>
PHY Status <796d>
PHY 1000BASE-T Status <3800>
PHY Extended Status <3000>
PCI Status <10>
Sep 09 14:46:42 pve kernel: e1000e 0000:00:1f.6 eno1: Reset adapter unexpectedly
Megoldás:
TL;DR
root@proxmox:~# cat /etc/network/interfaces
iface eno1 inet manual
post-up ethtool -K eno1 gso off gro off tso off tx off rx off
Részletesebben:
ethtool -K eth0 tx off rx off
Disabling TCP checksum offloading worked for me
Az alábbi két linken találtam segítséget:
https://forum.proxmox.com/threads/e1000e-eno1-detected-hardware-unit-hang.59928/
https://forum.proxmox.com/threads/intel-nic-e1000e-hardware-unit-hang.106001/