<div>Can I suggest you use IP addresses for a number of servers and see if they survive through your next episode. That will give you an idea of where the problem might be...</div>
<div> </div>
<div>It is the least amount of work towards identifying the cause.</div>
<div> </div>
<div>Cheers</div>
<div> </div>
<div>Phil<br><br></div>
<div class="gmail_quote">2008/5/20 Hosch, Katherine CONT (SPAWAR ITC) <<a href="mailto:katherine.hosch@navy.mil">katherine.hosch@navy.mil</a>>:<br>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">Check your apache log restarts in cron....<br>
<div>
<div></div>
<div class="Wj3C7c"><br>-----Original Message-----<br>From: Josh Luthman [mailto:<a href="mailto:josh@imaginenetworksllc.com">josh@imaginenetworksllc.com</a>]<br>Sent: Tuesday, May 20, 2008 10:38<br>To: <a href="mailto:hobbit@hswn.dk">hobbit@hswn.dk</a><br>
Subject: Re: [hobbit] wake up call<br><br>What most people suggest is having a local DNS server, on the Hobbitmon<br>server itself.<br><br>As this is happening at the same time every single day I don't believe<br>DNS would be the cause of the issue, though it is worth taking a look at<br>
until another idea comes along.<br><br><br>On Tue, May 20, 2008 at 11:27 AM, Gavin Leonard<br><<a href="mailto:gleonard@progrexion.com">gleonard@progrexion.com</a>> wrote:<br><br><br>       Happened again this morning.. so I am going to try a different<br>
dns server.<br><br><br><br>       -Gavin<br><br><br><br>       From: Phil Wild [mailto:<a href="mailto:philwild@gmail.com">philwild@gmail.com</a>]<br>       Sent: Monday, May 19, 2008 10:38 PM<br>       To: <a href="mailto:hobbit@hswn.dk">hobbit@hswn.dk</a><br>
       Subject: Re: [hobbit] wake up call<br><br><br><br>       Hmmm... bummer, there goes that theory... If you are using IP<br>addresses, and you are still getting failures on these hosts, then dns<br>is not involved. A ttl of five minutes is fairly worthless for a caching<br>
server. It only helps if it hits the same device within five minutes, as<br>hobbit is pinging every five mins (default), you will most likely always<br>be pulling from your master/slaves...<br><br><br><br>       Phil<br><br>
       2008/5/20 Josh Luthman <<a href="mailto:josh@imaginenetworksllc.com">josh@imaginenetworksllc.com</a>>:<br><br>       Well almost (good 99%) of my hosts have the testip tag, so it<br>doesn't<br>       need to look up the names.  The things it does look up are 5m<br>
TTLs<br><br>       though.<br><br><br><br>       On 5/19/08, Phil Wild <<a href="mailto:philwild@gmail.com">philwild@gmail.com</a>> wrote:<br>       > What is ttl set to for your domain? It would be interesting to<br>
see if the<br>       > issue reduces with a higher ttl. Another way to ensure this is<br>not the area<br>       > of the issue would be to set the dns server up as a slave.<br>       ><br>       > Phil<br>       ><br>
       > 2008/5/20 Josh Luthman <<a href="mailto:josh@imaginenetworksllc.com">josh@imaginenetworksllc.com</a>>:<br>       ><br>       >> That was someone's theory in a very large post about this<br>issue in the<br>
       >> past.  I did install a caching only named on the box and it<br>did not<br>       >> fix the problem.<br>       >><br>       >> Did relieve the stress of my other DNS server though :)<br>       >><br>
       >><br>       >><br>       >> On 5/19/08, Phil Wild <<a href="mailto:philwild@gmail.com">philwild@gmail.com</a>> wrote:<br>       >> > Hi Josh,<br>       >> ><br>       >> > This doesn't relate to the apache error, it relates to your<br>
problem...<br>       >> This<br>       >> > is a theory...<br>       >> ><br>       >> > I am wondering if you are running a caching name server on<br>your hobbit<br>       >> > installation? If not, I am wondering if the fping places<br>
too high a load<br>       >> on<br>       >> > your dns server and misses the occassional host. Even with<br>a caching dns<br>       >> > server you may see the issue every time ttl expires.<br>       >> ><br>
       >> > Phil<br>       >> ><br>       >> > 2008/5/20 Josh Luthman <<a href="mailto:josh@imaginenetworksllc.com">josh@imaginenetworksllc.com</a>>:<br>       >> ><br>       >> >> Gavin,<br>
       >> >><br>       >> >> I am having a very similar issue - though it is not every<br>single day.<br>       >>  My<br>       >> >> issue is that every host (or almost all of the hosts) will<br>
have<br>       >> >> conn:red<br>       >> >> and<br>       >> >> then come back up ~60s later.  I just confirmed this<br>weekend that it is<br>       >> >> not<br>       >> >> related the Via NIC (Using an Intel Pro/100 S now).<br>
       >> >><br>       >> >> An issue like that is almost always Apache related.  Can<br>you post the<br>       >> >> errors in /var/log/httpd/error_log from this time period?<br>       >> >><br>
       >> >> Josh<br>       >> >><br>       >> >><br>       >> >> On Mon, May 19, 2008 at 3:26 PM, Gavin Leonard<br><<a href="mailto:gleonard@progrexion.com">gleonard@progrexion.com</a><br>
       >> ><br>       >> >> wrote:<br>       >> >><br>       >> >>>  Every morning at 7am I get pages from every host I<br>monitor including<br>       >> the<br>       >> >>> display server,  that its connection recovered.. the it<br>
runs great for<br>       >> >>> the<br>       >> >>> next 23hrs.  looking at hobbit web page I see no down<br>time nor do the<br>       >> >>> servers show any down time.  But when I click on the<br>
historical web<br>       >> link<br>       >> >>> to<br>       >> >>> see the info.. I get this.. I really love hobbit..  but I<br>am not a Web<br>       >> >>> guy<br>       >> >>> at all and I think it might be apache related...<br>
       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>> *Internal Server Error*<br>       >> >>><br>
       >> >>> The server encountered an internal error or<br>misconfiguration and was<br>       >> >>> unable to complete your request.<br>       >> >>><br>       >> >>> Please contact the server administrator, root@localhost<br>
and inform<br>       >> them<br>       >> >>> of the time the error occurred, and anything you might<br>have done that<br>       >> may<br>       >> >>> have caused the error.<br>
       >> >>><br>       >> >>> More information about this error may be available in the<br>server error<br>       >> >>> log.<br>       >> >>>  ------------------------------<br>
       >> >>><br>       >> >>> *Apache/2.0.54 (Yellowdog) Server at misery.pgx.local<br>Port 80*<br>       >> >>><br>       >> >>><br>       >> >>><br>
       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>
       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>> *Gavin Leonard*<br>       >> >>><br>
       >> >>> [image: cid:image001.gif@01C856AD.922EF120]<br>       >> >>><br>       >> >>> Director, Systems-Network Engineering<br>       >> >>><br>       >> >>> *T*<br>
       >> >>><br>       >> >>>  801-828-1735<br>       >> >>><br>       >> >>> *F*<br>       >> >>><br>       >> >>>  801-828-1704<br>
       >> >>><br>       >> >>> *E*<br>       >> >>><br>       >> >>>  <a href="mailto:gleonard@progrexion.com">gleonard@progrexion.com</a><br>       >> >>><br>
       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>> Research | Marketing | Sales Generation<br>
       >> >>><br></div></div>       >> >>> *<a href="http://www.progrexion.com/" target="_blank">www.progrexion.com</a> <<a href="http://www.progrexion.com/" target="_blank">http://www.progrexion.com/</a>> *<br>

<div class="Ih2E3d"><<a href="http://www.progrexion.com/" target="_blank">http://www.progrexion.com/</a>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>> This email and its contents are confidential. If you are<br>
not the<br>       >> intended<br>       >> >>> recipient, delete this email and do not use or disclose<br>the<br>       >> >>> information<br>       >> >>> within this email or its attachments. Thank you.<br>
       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >>><br>       >> >><br>       >> >><br>       >> >><br>
       >> >> --<br>       >> >> Josh Luthman<br>       >> >> Office: 937-552-2340<br>       >> >> Direct: 937-552-2343<br>       >> >> 1100 Wayne St<br>       >> >> Suite 1337<br>
       >> >> Troy, OH 45373<br>       >> >><br>       >> >> Those who don't understand UNIX are condemned to reinvent<br>it, poorly.<br>       >> >> --- Henry Spencer<br>
       >> ><br>       >> ><br>       >> ><br>       >> ><br>       >> > --<br>       >> > Tel: 0400 466 952<br>       >> > Fax: 0433 123 226<br></div>       >> > email: philwild AT <a href="http://gmail.com/" target="_blank">gmail.com</a> <<a href="http://gmail.com/" target="_blank">http://gmail.com/</a>><br>

<div class="Ih2E3d">       >> ><br>       >><br>       >><br>       >> --<br>       >> Josh Luthman<br>       >> Office: 937-552-2340<br>       >> Direct: 937-552-2343<br>       >> 1100 Wayne St<br>
       >> Suite 1337<br>       >> Troy, OH 45373<br>       >><br>       >> Those who don't understand UNIX are condemned to reinvent it,<br>poorly.<br>       >> --- Henry Spencer<br>       >><br>
       >> To unsubscribe from the hobbit list, send an e-mail to<br>       >> <a href="mailto:hobbit-unsubscribe@hswn.dk">hobbit-unsubscribe@hswn.dk</a><br>       >><br>       >><br>       >><br>
       ><br>       ><br>       > --<br>       > Tel: 0400 466 952<br>       > Fax: 0433 123 226<br></div>       > email: philwild AT <a href="http://gmail.com/" target="_blank">gmail.com</a> <<a href="http://gmail.com/" target="_blank">http://gmail.com/</a>><br>

<div>
<div></div>
<div class="Wj3C7c">       ><br><br><br><br>       --<br><br>       Josh Luthman<br>       Office: 937-552-2340<br>       Direct: 937-552-2343<br>       1100 Wayne St<br>       Suite 1337<br>       Troy, OH 45373<br><br>
       Those who don't understand UNIX are condemned to reinvent it,<br>poorly.<br>       --- Henry Spencer<br><br>       To unsubscribe from the hobbit list, send an e-mail to<br>       <a href="mailto:hobbit-unsubscribe@hswn.dk">hobbit-unsubscribe@hswn.dk</a><br>
<br><br><br><br><br><br>       --<br>       Tel: 0400 466 952<br>       Fax: 0433 123 226<br>       email: philwild AT <a href="http://gmail.com/" target="_blank">gmail.com</a><br><br><br><br><br>--<br>Josh Luthman<br>Office: 937-552-2340<br>
Direct: 937-552-2343<br>1100 Wayne St<br>Suite 1337<br>Troy, OH 45373<br><br>Those who don't understand UNIX are condemned to reinvent it, poorly.<br>--- Henry Spencer<br><br>To unsubscribe from the hobbit list, send an e-mail to<br>
<a href="mailto:hobbit-unsubscribe@hswn.dk">hobbit-unsubscribe@hswn.dk</a><br><br><br></div></div></blockquote></div><br><br clear="all"><br>-- <br>Tel: 0400 466 952<br>Fax: 0433 123 226<br>email: philwild AT <a href="http://gmail.com">gmail.com</a>