Hi all<br><br>Well, it's been 48 hours now, without an incident.<br>Seems that not all fpings are created equal.<br><br>I did install the OpenCSW fping when I installed Xymon. The the install script defaults to using the last instance of fping it finds, and looks for the OpenCSW fping last.<br>
>From build/fping.sh<br><span style="font-family:courier new,monospace">        echo "Checking for fping ..."<br><br>        for DIR in / /usr /usr/local /opt /usr/pkg /opt/csw<br>        do<br>                if test "$DIR" = "/"; then DIR=""; fi<br>
<br>                if test -x $DIR/bin/fping<br>                then<br>                        FPING=$DIR/bin/fping<br>                elif test -x $DIR/sbin/fping<br>                then<br>                        FPING=$DIR/sbin/fping<br>
                fi<br>        done</span><br><br>I would have expected this to default to the OpenCSW version of fping.<br><br>So what went wrong?<br>My recollection of the install is poor, but It is possible that I ran the configure script as Xymon user, and had only set the suid bit on /usr/local/sbin/fping, meaning that <br>
<span style="font-family:courier new,monospace">test -x $DIR/bin/fping</span><br>would have failed for the OpenCSW version, defaulting to the fping in /usr/local.<br>Of course, the script would have reported no errors, because it would have met all requirements. An executable fping.<br>
<br><b>Solution </b>: Make sure that Xymon is using the OpenCSW fping, as defined by the FPING= variable in ~/server/etc/xymonserver.cfg<br><b>Prevention 1 </b>: When running configure at install time, use the --fping option to explicitly define which fping to use.<br>
<b>Prevention 2</b> : Make sure you set the suid bit on ALL instances of fping.<br><br>Regards<br>Vernon<br><br><div class="gmail_quote">On 15 January 2013 08:27, Vernon Everett <span dir="ltr"><<a href="mailto:everett.vernon@gmail.com" target="_blank">everett.vernon@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi all<br><br>"TIME SPENT" is showing the odd spike now and then, but the highest I have seen is 9.8 seconds.<br>
And these peaks do not coincide with the fping issues. <br><br>I did a little more research, and discovered 2 instances of fping.<br>
#  /opt/csw/sbin/fping -v<br>/opt/csw/sbin/fping: Version 2.4b2_to $Date: 2002/01/16 00:33:42 $<br>/opt/csw/sbin/fping: comments to <a href="mailto:david@remote.net" target="_blank">david@remote.net</a><br><br># /usr/local/sbin/fping -v<br>

/usr/local/sbin/fping: Version 3.0<br>/usr/local/sbin/fping: comments to <a href="mailto:david@schweikert.ch" target="_blank">david@schweikert.ch</a><br><br>/opt/csw/sbin/fping is the one I installed recently using OpenCSW's pkgutil, but the Xymon config was pointing to /usr/local/sbin/fping<br>

I have switched the FPING= definition in ~/server/etc/xymonserver.cfg to point to the OpenCSW version.<br>Let's see if this improves matters.<br><br>Regards<span class="HOEnZb"><font color="#888888"><br>Vernon<br><br>
<br><br><br></font></span><div class="gmail_quote"><div class="im">On 11 January 2013 08:16, Jeremy Laidman <span dir="ltr"><<a href="mailto:jlaidman@rebel-it.com.au" target="_blank">jlaidman@rebel-it.com.au</a>></span> wrote:<br>

</div><div><div class="h5"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">I think the key here is the "select".  To me, this suggests that the select() system call (which is used to read data on STDIN from xymonnet) is trying to get data from a closed socket, or a similar problem.  I wonder if fping, which is run from xymonnet, is sometimes taking so long to run, and eventually xymonlaunch is killing xymonnet.<div>



<br></div><div>By default, xymonlaunch (in tasks.cfg) kills xymonnet after 5 minutes, but xymonnetagain is killed off after only 1 minute.  So if you have a lot of hosts that are uncontactable, or have long ping times, then this might add up to a minute.</div>



<div><br></div><div>To confirm this, check out the "xymonnet" dot on your Xymon server, and look at the "TIME SPENT" table for ping test duration.</div><span><font color="#888888"><div>
<br></div><div>J</div><div><br>
</div>
</font></span></div><div class="gmail_extra"><br><br><div class="gmail_quote"><div><div>On 10 January 2013 17:12, Vernon Everett <span dir="ltr"><<a href="mailto:everett.vernon@gmail.com" target="_blank">everett.vernon@gmail.com</a>></span> wrote:<br>



</div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>Hi all<br><br>Anybody seen something like this?<br><pre>Execution of '/usr/local/sbin/fping -Ae' failed with error-code 4<br>



/usr/local/sbin/fping: select : Invalid argument
<br></pre>Error I see when xymonnet page goes red.<br>At the same time, all conn tests go white.<br>Happens briefly every few hours. No obvious pattern, but at least once a day, sometimes twice.<br><br>This is a new installation of Xymon 4.3.10, on a relatively old Solaris 10 Sparc server.<br clear="all">




<br>Regards<span><font color="#888888"><br>Vernon<br><br>-- <br><span>"Accept the challenges so that you can feel the exhilaration of victory"</span><div><span>- General George Patton</span></div>


</font></span><br></div></div><div>_______________________________________________<br>
Xymon mailing list<br>
<a href="mailto:Xymon@xymon.com" target="_blank">Xymon@xymon.com</a><br>
<a href="http://lists.xymon.com/mailman/listinfo/xymon" target="_blank">http://lists.xymon.com/mailman/listinfo/xymon</a><br>
<br></div></blockquote></div><br></div>
</blockquote></div></div></div><div class="HOEnZb"><div class="h5"><br><br clear="all"><br>-- <br><span>"Accept the challenges so that you can feel the exhilaration of victory"</span><div><span>- General George Patton</span></div>

</div></div></blockquote></div><br><br clear="all"><br>-- <br><span>"Accept the challenges so that you can feel the exhilaration of victory"</span><div><span>- General George Patton</span></div>