Just to complete the loop here, the 4.3.6 upgrade fixed all the issues I was seeing.  Guess whatever was fixed with the host loading fixed my issues.<div><br></div><div>Skadz</div><div><br><br><div class="gmail_quote">On Thu, Nov 3, 2011 at 2:12 PM, Martin Flemming <span dir="ltr"><<a href="mailto:martin.flemming@desy.de">martin.flemming@desy.de</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
Hi, Ryan !<br>
<br>
I've got till one hour before the same issues and was completley unlucky like you :-(<br>
<br>
Unfortunatley i didn't know how i  solve it but now it runs like a charme ...<br>
<br>
But i think it was something with xymonlaunch and the start-script ...<br>
<br>
Please debug the scripts<br>
<br>
 /etc/init.d/xymon and /usr/lib/xymon/server/bin/<u></u>xymon.sh<br>
<br>
with set -x and watch the logfiles<br>
<br>
maybe & hopefully it helps ..<br>
<br>
cheers,<br>
        martin<div class="HOEnZb"><div class="h5"><br>
<br>
On Thu, 3 Nov 2011, Ryan Skadberg wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Any help here?  I've tried a number of different things to attempt to solve these on my own, but nothing has worked.  Any help would<br>
be greatly appreciated.<br>
Thanks!<br>
Skadz<br>
<br>
<br>
On Wed, Oct 26, 2011 at 6:01 PM, Ryan Skadberg <<a href="mailto:skadz@skadz.com" target="_blank">skadz@skadz.com</a>> wrote:<br>
      Hi All -<br>
  I've been running hobbit/xymon for a long time, but I've finally just joined the list due to a number of issues after I<br>
upgraded from 4.2.3 to 4.3.5.  I walked through and fixed all the file names and everything SEEMS ok, but am seeing a number<br>
of strange things:<br>
<br>
a) When I start up xymon, I don't get my previous state back.  The xymond options have:<br>
<br>
--restart=/usr/lib/xymon/<u></u>server/tmp/xymond.chk<br>
--checkpoint-file=/usr/lib/<u></u>xymon/server/tmp/xymond.chk<br>
<br>
And the files has data:<br>
<br>
8136 /usr/lib/xymon/server/tmp/<u></u>xymond.chk<br>
<br>
But when I restart the server or service, I seem to lose all data and anything that has been disabled or acked is now once<br>
again back to it's starting state.<br>
<br>
b) I can't seem to add new machines.  I add a machine to hosts.cfg and analysis.cfg and it shows up on the web page, but it<br>
never seems to actually receive any data.  I've tried reloading the service, but that doesn't seem to help.  I even tried<br>
something like:<br>
<br>
xymon localhost 'enable <a href="http://machine.company.com" target="_blank">machine.company.com</a>'<br>
<br>
But it did not help.  I see on the Ghost client page that it seems to recognize the correlation as it has a candidate, but<br>
isn't doing anything.  Do I need to do something different with this newer version to enable a machine instead of just adding<br>
it to the two files?<br>
<br>
c) Last issue is very similar to the previous issue.  I removed a machine from the hosts.cfg file, then ran:<br>
<br>
xymon localhost 'drop <a href="http://machine.company.com" target="_blank">machine.company.com</a>'<br>
<br>
But when it didn't check in for an hour, it still seemingly went purple and sent out emails/pages.  I did a reload on the<br>
service and this now seems to have stopped, but I don't think it should have happened in the first place.<br>
<br>
d) I get startup errors that don't seem to make a ton of sense:<br>
<br>
In xymonlaunch.log, I see:<br>
<br>
2011-10-25 12:11:51 xymonlaunch starting<br>
2011-10-25 12:11:51 Loading tasklist configuration from /usr/lib/xymon/server/etc/<u></u>tasks.cfg<br>
2011-10-25 12:11:51 Cannot open directory <br>
2011-10-25 12:11:51 Loading hostnames<br>
2011-10-25 12:11:51 Cannot load host data<br>
2011-10-25 12:11:51 Loading saved state<br>
2011-10-25 12:11:51 Cannot access checkpoint file /usr/lib/xymon/server/tmp/<u></u>xymond.chk for restore<br>
2011-10-25 12:11:51 Setting up network listener on <a href="http://0.0.0.0:1984" target="_blank">0.0.0.0:1984</a><br>
2011-10-25 12:11:51 Setting up signal handlers<br>
2011-10-25 12:11:51 Setting up xymond channels<br>
2011-10-25 12:11:51 Setting up logfiles<br>
<br>
<br>
As I said, I am seeing all of the hosts that I have in the system and have double checked the permissions and the xymon user<br>
can most definitely access all of the files, so why am I getting these errors?<br>
<br>
[xymon@vir5ob xymon]$ whoami<br>
xymon<br>
[xymon@vir5ob xymon]$ wc -l /usr/lib/xymon/server/tmp/<u></u>xymond.chk <br>
8136 /usr/lib/xymon/server/tmp/<u></u>xymond.chk<br>
[xymon@vir5ob xymon]$ ls -als /usr/lib/xymon/server/tmp/<u></u>xymond.chk <br>
31756 -rw-rw-r-- 1 xymon xymon 32474378 Oct 26 17:54 /usr/lib/xymon/server/tmp/<u></u>xymond.chk<br>
<br>
I am also seeing:<br>
<br>
2011-10-26 17:54:50 Cannot load host data<br>
<br>
in my xymond.log every 10 minutes.  As I said, any files seem to be accessible as far as I can tell, but maybe since the error<br>
message is not very verbose, I am not looking in the right place.<br>
<br>
I know these probably all seem like newbie questions, but I have done all the debugging I seem to be able to do and can't<br>
figure anything out on these.  Any help would be greatly appreciated.<br>
<br>
Thanks!<br>
Skadz<br>
<br>
<br>
</blockquote>
</div></div><br>_______________________________________________<br>
Xymon mailing list<br>
<a href="mailto:Xymon@xymon.com">Xymon@xymon.com</a><br>
<a href="http://lists.xymon.com/mailman/listinfo/xymon" target="_blank">http://lists.xymon.com/mailman/listinfo/xymon</a><br>
<br></blockquote></div><br></div>