Hi,<br>
<br>
I'm running Xymon since 6 years (4.3.17 atm) on Debian 7.8 <br>
3.2.0-4-amd64<br>
Since 1 month now, every night, between 0h30 or 2h am at +/- 30 min, <br>
around 30 hosts become unreachable :<br>
<br>
Fri Jan 29 01:16:38 2016 conn NOT ok : DNS lookup failed<br>
Unable to resolve hostname foo.bar.local<br>
System unreachable for 3 poll periods (170 seconds)<br>
green 0.0.0.0 is alive (0.02 ms) [<- <a href="http://127.0.0.1">127.0.0.1</a>]<br>
<br>
<br>
- Got around 500 monitored hosts and looks like the same hosts are <br>
lost every single night.<br>
- Those monitored hosts are not necessary on the same network, not <br>
the same OS.<br>
- We cross monitored the same hosts and the other monitoring tool <br>
doesn't have report the DNS outage.<br>
- I ran a DNS lookup every seconds on the Hobbit server several days <br>
and it never reported a DNS outage.<br>
- I don't have any crontab installed on the server who could disturb <br>
Xymon.<br>
- Nothing strange in the Xymon logs nor the server logs, no memory <br>
leaks or CPU overloaded.<br>
- The rest of the day, Xymon server behavior is normal.<br>
- What I've done on the server 1 month ago ? I don't know, no system <br>
upgrade or so.<br>
- I had DNSMASQ acting like a cache, I disabled it : same issue<br>
- /etc/resolv.conf is quite light : search bar.local, next line : <br>
nameserver IP.OF.OUR.DNS.SERVER1, just like other servers<br>
<br>
The issue could be anywhere : inside or outside the server, Xymon or <br>
not... I have to confess, I'm running out of ideas to find the issue, is <br>
anyone here may have some leads, I will be thankful !<br>
<br>
Have a nice day!