<div dir="ltr">Jeremy,<div><br></div><div>It seems LDAP surely is the issue.  The check has no settable timeout in hosts.cfg.  As for what happens to our LOVELY OpenDirectory, it just hangs both SSL and plain text.  All ports remain open, ping even still works.</div>

<div><br></div><div>I caught it this time and it does seem that the lack of a timeout is the problem here (the check only terminated because we rebooted the box)</div><div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">

Error output:<br>WARNING: Runtime 521 longer than time limit (300)<br><br>TIME SPENT<br>Event                                           Start time          Duration<br>xymonnet startup                         1383315414.744906                 -<br>

Service definitions loaded               1383315414.746373          0.001467 <br>Tests loaded                             1383315414.815137          0.068764 <br>DNS lookups completed                    1383315414.815838          0.000701 <br>

Test engine setup completed              1383315414.839164          0.023326 <br>TCP tests completed                      1383315426.045943         11.206779 <br>PING test completed (104 hosts)          1383315434.035841          7.989898 <br>

PING test results sent                   1383315434.036641          0.000800 <br>Test result collection completed         1383315434.037506          0.000865 <br>LDAP test engine setup completed         1383315434.037568          0.000062 <br>

LDAP tests executed                      1383315935.053479        501.015911 <br>LDAP tests result collection completed   1383315935.053491          0.000012 <br>Test results transmitted                 1383315935.055777          0.002286 <br>

xymonnet completed                       1383315935.062680          0.006903 <br>TIME TOTAL                                                        520.317774 </blockquote><div><br></div></div><div><br></div><div>In the host.cfg we have: $IP  <a href="http://commander.example.com">commander.example.com</a>  # ldap://<a href="http://commander.example.com:389/dc=commander,dc=example,dc=com">commander.example.com:389/dc=commander,dc=example,dc=com</a></div>

<div><br></div><div>It is our only ldap check (its over a IPsec S2S link with 50/50 connection)</div><div><br></div><div>Xymonnet is standard install "CMD xymonnet --report --ping --checkresponse", the proc only exits when we reboot the server or it passes normally.</div>

<div><br></div><div>I couldn't get the command to just do the one server, will try again in a bit.  I think the ultimate problem is ldap check never times out, so how can one be set?<br><div class="gmail_extra"><br clear="all">

<div><span style="border-collapse:collapse;font-family:arial,sans-serif;font-size:13px"><br>--<br>Thomas Vachon<br></span></div>
<br><br><div class="gmail_quote">On Thu, Oct 31, 2013 at 12:31 AM, Jeremy Laidman <span dir="ltr"><<a href="mailto:jlaidman@rebel-it.com.au" target="_blank">jlaidman@rebel-it.com.au</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">

<div dir="ltr"><div>Thomas</div><div><br></div>In what way is the LDAP server in a "bad state"?<div><br></div><div>Are you using LDAP or LDAPS?<br><div><br></div><div><div>Can you connect to the server on the LDAP port using telnet?<br>



</div><div><div><br></div><div>What does your hosts.cfg file entry look like?</div><div><br></div><div>What parameters do you have for xymonnet in tasks.cfg?</div><div><br></div><div>Does the xymonnet process eventually exit?</div>



</div><div><br></div><div>Can you run xymonnet manually (as the xymon user, under a xymoncmd shell), such as:</div><div><br></div><div>$ xymonnet --debug --timeout=1 <name-of-server></div><div><br></div><div>If this fails in the same way, perhaps you can tweak some parameters, such as adding "--dns=ip" or "--noping" or other options.</div>



</div></div><div><br></div><div>J</div><div><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote"><div><div class="h5">On 31 October 2013 00:01, Thomas Vachon <span dir="ltr"><<a href="mailto:vachon@sessionm.com" target="_blank">vachon@sessionm.com</a>></span> wrote:<br>



</div></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div><div class="h5"><div dir="ltr">We are having issues with xymonnet handing on 4.3.12 (happened on 4.3.10 too).  As soon as we added an ldap check which can hang (due to the ldap server being in a bad state), xymonnet hangs and goes purple on all remote checks.<div>





<br></div><div>Nothing shows in the logs. Here is the historical xymonnet info from the last purple:</div><div><br></div><div><div>Wed Oct 30 12:12:10 2013</div><div><br></div><div><br></div><div>xymonnet version 4.3.12</div>





<div>SSL library : OpenSSL 1.0.1e 11 Feb 2013</div><div>LDAP library: OpenLDAP 20431</div><div><br></div><div>Statistics:</div><div> Hosts total           :       70</div><div> Hosts with no tests   :        1</div><div>




 Total test count      :      183</div>
<div> Status messages       :      183</div><div> Alert status msgs     :        0</div><div> Transmissions         :        3</div><div><br></div><div>DNS statistics:</div><div> # hostnames resolved  :      115</div><div>





 # succesful           :       69</div><div> # failed              :        0</div><div> # calls to dnsresolve :      182</div><div><br></div><div>TCP test statistics:</div><div> # TCP tests total     :      113</div><div>





 # HTTP tests          :       45</div><div> # Simple TCP tests    :       68</div><div> # Connection attempts :      113</div><div> # bytes written       :     7192</div><div> # bytes read          :   528667</div><div>




<br>
</div><div><br></div><div>TIME SPENT</div><div>Event                                           Start time          Duration</div><div>xymonnet startup                         1383135130.081755                 -</div><div>





Service definitions loaded               1383135130.089141          0.007386 </div><div>Tests loaded                             1383135130.147247          0.058106 </div><div>DNS lookups completed                    1383135130.147712          0.000465 </div>





<div>Test engine setup completed              1383135130.159468          0.011756 </div><div>TCP tests completed                      1383135142.406914         12.247446 </div><div>PING test completed (69 hosts)           1383135149.073309          6.666395 </div>





<div>PING test results sent                   1383135149.074005          0.000696 </div><div>Test result collection completed         1383135149.075192          0.001187 </div><div>LDAP test engine setup completed         1383135149.075263          0.000071 </div>





<div>LDAP tests executed                      1383135151.403612          2.328349 </div><div>LDAP tests result collection completed   1383135151.403621          0.000009 </div><div>Test results transmitted                 1383135151.405148          0.001527 </div>





<div>xymonnet completed                       1383135151.407244          0.002096 </div><div>TIME TOTAL                                                         21.325489 </div><div><br></div></div><div> <br clear="all"><div>





<span style="border-collapse:collapse;font-family:arial,sans-serif;font-size:13px"><br>--<br>Thomas Vachon<br><br></span></div>
</div></div>
<br></div></div>_______________________________________________<br>
Xymon mailing list<br>
<a href="mailto:Xymon@xymon.com" target="_blank">Xymon@xymon.com</a><br>
<a href="http://lists.xymon.com/mailman/listinfo/xymon" target="_blank">http://lists.xymon.com/mailman/listinfo/xymon</a><br>
<br></blockquote></div><br></div>
</blockquote></div><br></div></div></div>