<div dir="ltr">Chad<div><br></div><div>What does the director do? How does it communicate with the servers?</div><div><br></div><div>Does the director or the server create a log message when there's a problem? Xymon can detect and alarm on that.</div><div><br></div><div>Does the director connect to the servers on a specific TCP port? If that port is rejecting a connection, the Xymon server can test for that (every 5 minutes, but can be more often) and alarm on it.</div><div><br></div><div>When a server fails, does it stop listening on a particular TCP port? Or perhaps a process crashes and restarts, causing the connection to fail? Xymon can test for these and alarm when it detects a missing listening or established TCP socket, or a missing process.</div><div><br></div><div>It's also possible to write a script to have Xymon look at the process listing "ps" output, and look for a particular process's lifetime, and alert when it's less than 5 minutes.</div><div><br></div><div>One thing to note is that Xymon's probes and processes typically look for things every 5 minutes. Transient failures that come and go within a few seconds may not be detected using the standard probes and checks. However, the frequency of some of these probes can be increased to make it more likely to catch failures. But also, a custom script can be written to check the state as often as you need. However for transient faults, it's more reliable to look for artefacts of a failure (log errors and warnings, short process lifetime) rather than periodically checking for a successful state.</div><div><br></div><div>J</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 22 June 2017 at 22:59, Chad Rodriguez <span dir="ltr"><<a href="mailto:CHrodriguez@petsmart.com" target="_blank">CHrodriguez@petsmart.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">





<div lang="EN-US" link="blue" vlink="purple">
<div class="m_6567271379137300850WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">Symptom, we open up director and see application servers not communicating at the same time we can ping server by hostname and IP><u></u><u></u></span></p><span class="">
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:black">Respectfully,<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:black"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:black">Chad Rodriguez |
</span><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:#7e7f7e">Systems Administrator<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:#7e7f7e">19601 N. 27<sup>th</sup> Ave., Phoenix, AZ 85027</span><span style="font-size:11.0pt;font-family:"Cambria",serif;color:black"><u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:#7e7f7e">office: 623-587-2385 | fax: 623-580-6117<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:#7e7f7e">email –
<a href="mailto:chrodriguez@petsmart.com" target="_blank">chrodriguez@petsmart.com</a> </span><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><img border="0" width="141" height="48" style="width:1.4687in;height:.5in" id="m_6567271379137300850Picture_x0020_1" src="cid:image001.jpg@01D2EB1C.B934C2A0" alt="PetSmart_logo_email.jpg"><u></u><u></u></span></p>
<p class="MsoNormal"><b><i><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:red">Upcoming Out-of-Office dates</span></i></b><b><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:red">:</span></b><b><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:#c00000">
<u></u><u></u></span></b></p>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:#c00000">June 26<sup>th</sup> through July 4<sup>th</sup><u></u><u></u></span></b></p>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:#c00000">July 21st<u></u><u></u></span></b></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><u></u> <u></u></span></p>
</span><p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"> Jeremy Laidman [mailto:<a href="mailto:jlaidman@rebel-it.com.au" target="_blank">jlaidman@rebel-it.com.<wbr>au</a>]
<br>
<b>Sent:</b> Thursday, June 22, 2017 3:23 AM<br>
<b>To:</b> Chad Rodriguez <CHrodriguez@PetSmart.com><br>
<b>Cc:</b> <a href="mailto:xymon@xymon.com" target="_blank">xymon@xymon.com</a><br>
<b>Subject:</b> Re: [Xymon] questions<u></u><u></u></span></p><div><div class="h5">
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal">Chad<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<p class="MsoNormal">Situations like what exactly? When a server is rebooted? Or when a server stops communicating? Can you explain what symptoms? What is a "director"? Sorry, I'm not familiar with the Solarwinds product.<u></u><u></u></p>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Out of the box, Xymon can detect a few different types of communication issues (eg ping checks, TCP port responses) as well as monitoring logfiles for messages that indicate trouble. Furthermore, Xymon is highly extensible, so if you can
 write a script to perform a test for your problem, you can turn it into a message for Xymon to display, and optionally alarm via email or other means.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Cheers<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Jeremy<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<p class="MsoNormal">On 22 June 2017 at 07:07, Chad Rodriguez <<a href="mailto:CHrodriguez@petsmart.com" target="_blank">CHrodriguez@petsmart.com</a>> wrote:<u></u><u></u></p>
<blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal">We have no monitoring in place other than solarwinds which monitors heartbeats. Essentially we have a few application servers that are randomly not communicating with the director
 and were having to reboot them. Seeing if your application would alert on situations like this in an email notification format?<u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:black">Respectfully,</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:black"> </span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:black">Chad Rodriguez |
</span><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:#7e7f7e">Systems Administrator</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:#7e7f7e">19601 N. 27<sup>th</sup> Ave., Phoenix, AZ 85027</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:#7e7f7e">office: 623-587-2385 | fax: 623-580-6117</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Trebuchet MS",sans-serif;color:#7e7f7e">email –
<a href="mailto:chrodriguez@petsmart.com" target="_blank">chrodriguez@petsmart.com</a>
</span><u></u><u></u></p>
<p class="MsoNormal"><img border="0" width="141" height="48" style="width:1.4687in;height:.5in" id="m_6567271379137300850m_-4447552672257707276Picture_x0020_1" src="cid:image001.jpg@01D2EB1C.B934C2A0" alt="PetSmart_logo_email.jpg"><u></u><u></u></p>
<p class="MsoNormal"><b><i><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:red">Upcoming Out-of-Office dates</span></i></b><b><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:red">:</span></b><b><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:#c00000">
</span></b><u></u><u></u></p>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:#c00000">June 26<sup>th</sup> through July 4<sup>th</sup></span></b><u></u><u></u></p>
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Arial",sans-serif;color:#c00000">July 21st</span></b><u></u><u></u></p>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><br>
______________________________<wbr>_________________<br>
Xymon mailing list<br>
<a href="mailto:Xymon@xymon.com" target="_blank">Xymon@xymon.com</a><br>
<a href="http://lists.xymon.com/mailman/listinfo/xymon" target="_blank">http://lists.xymon.com/<wbr>mailman/listinfo/xymon</a><u></u><u></u></p>
</blockquote>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div></div></div>
</div>

</blockquote></div><br></div>