<div dir="ltr">Assigning a value to a variable seems quite benign. Perhaps the memory for seltmo hasn't been allocated?<div><br></div><div>Have you taken a look at the xymond.log file around the time of the coredumps?</div><div><br></div><div>The xymond process has quite a bit of debugging info available, if run with the "--debug" option.</div><div><br></div><div>But, yes, an upgrade might be your simplest solution. The code in the xymond.c file appears to have been greatly re-written since then. In v4.3.5, the "redback" library called using rbreadlist() was completely replaced by Henrik's own tree management code. The Changelog file for 4.3.5 shows some info about xymond crashing in 4.3.4:</div><div><br></div><div>* Fix crashes in xymond caused by faulty new library for<br>  storing cookies and host-information.<br>* Fix memory corruption/crash in xymond caused by logging<br>  of multi-source statuses.<br></div><div><br></div><div>(I think the "cookies" mentioned here are "ack" cookies used to tie an ack to an event) The "storing ... host-information" possibly supports the correlation with the use of include files for hosts.cfg.</div><div><br></div><div>So even an upgrade to 4.3.5 might fix your problem.</div><div><br></div><div>Cheers<br></div><div>Jeremy</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, 22 Mar 2022 at 20:00, Neil Simmonds <<a href="mailto:neilsimmonds1808@gmail.com">neilsimmonds1808@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr">Hi Jeremy, <div><br></div><div>We're using Xymon 4.3.4 (Yes, I know, there are plans to build a new one ) and we built it from source. </div><div><br></div><div>It's been running fine for years but we've been getting these CoreDumps now for a few months. </div><div><br></div><div>I've looked at the code and this is the section with line 5024 (i've made line 5024 itself bold) </div><div><br></div><div><div>/* </div><div><span style="white-space:pre-wrap">                </span> * Do the select() with a static 2 second timeout. </div><div><span style="white-space:pre-wrap">             </span> * This is long enough that we will suspend activity for</div><div><span style="white-space:pre-wrap">         </span> * some time if there's nothing to do, but short enough for</div><div><span style="white-space:pre-wrap">          </span> * us to attend to the housekeeping stuff without undue delay.</div><div><span style="white-space:pre-wrap">           </span> */</div><div><span style="white-space:pre-wrap">              </span><b>seltmo.tv_sec = 2; seltmo.tv_usec = 0;</b></div><div><span style="white-space:pre-wrap">                </span>n = select(maxfd+1, &fdread, &fdwrite, NULL, &seltmo);</div><div><span style="white-space:pre-wrap">               </span>if (n <= 0) {</div><div><span style="white-space:pre-wrap">                 </span>if ((errno == EINTR) || (n == 0)) {</div><div><span style="white-space:pre-wrap">                              </span>/* Interrupted or a timeout happened */</div><div><span style="white-space:pre-wrap">                          </span>continue;</div><div><span style="white-space:pre-wrap">                        </span>}</div><div><span style="white-space:pre-wrap">                        </span>else {</div><div><span style="white-space:pre-wrap">                           </span>errprintf("Fatal error in select: %s\n", strerror(errno));</div><div><span style="white-space:pre-wrap">                             </span>break;</div><div><span style="white-space:pre-wrap">                   </span>}</div><div><span style="white-space:pre-wrap">                </span>}</div></div><div><br></div><div>IThe only thing I can think that might be an influence is that around the time that the coredumps started, we started using include files with the hosts.cfg file. </div><div><br></div><div>Kind regards,</div><div>Neil. </div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Mar 21, 2022 at 10:15 PM Jeremy Laidman <<a href="mailto:jeremy@laidman.org" target="_blank">jeremy@laidman.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi Neil<div><br></div><div>I don't know if I can help you much to diagnose. Can you share the version of Xymon that you're using, and whether you're building from source or installing a package? I suppose the place to start would be to see what's happening in xymond.c at line 5024.</div><div><br></div><div>J</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, 19 Mar 2022 at 00:36, Neil Simmonds <<a href="mailto:neilsimmonds1808@gmail.com" target="_blank">neilsimmonds1808@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div dir="ltr">Hi all, We're getting a weird issue where the xymond process is crashing every couple of days. If you're actually viewing Xymon at the time is only seems to affect the critical page and within 10 minutes it restarts and all is back to normal but we get a core dump. Has anyone ever seen an issue like this? I've gone through our critical.cfg file and given it a visual once over but it's a bit difficult checking a file with 7638 lines. </div><div dir="ltr"><br></div><div>The dump file doesn't give us much help as far as I can see </div><div><br></div><div><p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">Core
was generated by `xymond --pidfile=/var/log/xymon/xymond.pid
--restart=/xymon/server/tmp/xymond.c'.<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">Program
terminated with signal 6, Aborted.<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#0 
0x0000003c0ce30265 in raise () from /lib64/libc.so.6<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#0 
0x0000003c0ce30265 in raise () from /lib64/libc.so.6<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#1 
0x0000003c0ce31d10 in abort () from /lib64/libc.so.6<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#2 
0x0000000000419353 in sigsegv_handler (signum=<value optimized out>) at
sig.c:57<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#3 
<signal handler called><span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#4 
0x000000000041efd2 in rb_successor ()<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#5 
0x000000000041f5f2 in rb_readlist ()<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#6 
0x000000000041e7c7 in rbreadlist ()<span></span></span></p>

<p class="MsoNormal"><span style="font-size:9pt;font-family:"Courier New"">#7 
0x000000000040ece2 in main (argc=1647522333, argv=<value optimized out>)
at xymond.c:5024<span></span></span></p></div></div></div>
_______________________________________________<br>
Xymon mailing list<br>
<a href="mailto:Xymon@xymon.com" target="_blank">Xymon@xymon.com</a><br>
<a href="http://lists.xymon.com/mailman/listinfo/xymon" rel="noreferrer" target="_blank">http://lists.xymon.com/mailman/listinfo/xymon</a><br>
</blockquote></div>
</blockquote></div>
</blockquote></div>