Another idea!  Since the two networks/Hobbit servers are unrelated theres little in common.  What about the time?  Maybe some data from one set got mixed in and it doesn't cooperate with the date and time?<br><br><div>
<span class="gmail_quote">On 11/30/07, <b class="gmail_sendername">Gary Baluha</b> <<a href="mailto:gumby3203@gmail.com">gumby3203@gmail.com</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div><span class="e" id="q_11691e98604196ab_0">On Nov 30, 2007 1:45 PM, Ralph Mitchell <<a href="mailto:ralphmitchell@gmail.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">ralphmitchell@gmail.com
</a>> wrote:<br></span></div><div class="gmail_quote"><div><span class="e" id="q_11691e98604196ab_2"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

<div>On Nov 30, 2007 12:27 PM, Gary Baluha <<a href="mailto:gumby3203@gmail.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">gumby3203@gmail.com</a>> wrote:<br></div><div class="gmail_quote">
<div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

<div class="gmail_quote"><div><br>There wasn't anything useful in any of the logs, besides the usual stuff.  I turned on the --debug option, and here is a sample of the data for one of the affected machines:
<br><br> 2007-11-30 13:14:07 hobbitd_rrd: Got message 562165 @@status#562165|1196446447.724393|192.168.232.110||danno|disk|1196448247|yellow||yellow|1196053505|0||0||1196446447<br>2007-11-30 13:14:07 startpos 343968, fillpos 343968, endpos -1
<br>2007-11-30 13:14:07 RRD update param 00: 'rrdupdate'<br>2007-11-30 13:14:07 RRD update param 01: '/var/hobbit/data/rrd/danno/disk,dev,odm.rrd'<br>2007-11-30 13:14:07 RRD update param 02: '-t'<br>



2007-11-30 13:14:07 RRD update param 03: 'pct:used'<br>2007-11-30 13:14:07 RRD update param 04: '1196446447:0:0'<br><br>I'm afraid I don't know how to interpret all of this, unfortunately.  I get that the "param 03" means the graph is showing "percentage [disk space] used", and that "param 01" means it is updating that specific rrd file.  And I remember that "-t" in "param 02" is some rrdtool flag.  But I don't know what the numbers in "param 04" mean.  I assume the first number is the # seconds since 1970, and the second number is the current value, but I don't know what the last number means.  Also, I'm not sure how to interpret all of the data in the "@@status" line.
<br><br>By the way, this excerpt is from a machine that is having the graph display problems.  In this case, the data it is receiving is normal and correct.  I'm waiting for another update when the data is incorrect.
</div></div></blockquote></div><div><br>The "-t" option specifies the template to use, which is in param03 - "pct:used".  Param 04 is the actual data to insert, starting with the date/time in seconds (
i.e. 1196446447), then zero for the "pct" value, then zero for the "used" value.
<br><br>This stuff may not help much, but maybe it will show where the data goes weird - i.e. is hobbitd_rrd being handed bad data, or does it get corrupted later on.</div></div></blockquote></span></div><div><br>That's what I'm hoping.  One other thing I noticed is that for the hosts that have bad graphs, but where some graphs are still okay, the good graphs have a gap of data precisely when the bad graphs have another data spike. 
<br></div></div><br>
</blockquote></div><br><br clear="all"><br>-- <br>Josh Luthman<br>Office: 937-552-2340<br>Direct: 937-552-2343<br>1100 Wayne St<br>Suite 1337<br>Troy, OH 45373<br><br>Those who don't understand UNIX are condemned to reinvent it, poorly.
<br>--- Henry Spencer