<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"></head><body ><div>hello</div><div><br></div><div>what kind of hardware do you use ? 300msg/s is not that much. One of my cluster is monitoring 12 000 devices but only network test.  I will check one with 3000 devices to see.</div><div><br></div><div>oau</div><br><br><div>-------- Message d'origine --------</div><div>De : fmaillard.ext@orange.com </div><div>Date :17/12/2014  17:04  (GMT+01:00) </div><div>À : xymon@xymon.com </div><div>Objet : [Xymon] xymon on a large architecture </div><div><br></div>
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif"">Hello,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif""><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">We’re running a quite large xymon setup, and have been dealing with performance issue for quite a while. Here are some stats to give an idea about the setup:<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">- We have 2 xymon servers per datacenter, on 3 datacenter (all messages are sent to both servers for a given site)<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">- Each xymon server receives on average between 200msg/s and 250msg/s. We’re getting peaks at 400msg/sec.<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">- Each site hosts about 3000 hosts / 30 000 services<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif""><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">We’ve been suspecting for a long time that we might be losing messages… and I think I finally tracked it down to xymond not fetching the messages quickly enough
 so that the kernel’s buffer fill up and messages get discarded (by the kernel). On one of our servers, even though I have already increased net.ipv4.tcp_rmem and net.ipv4.tcp_wmem I got the following output from “netstat -s”:<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">148909 packets pruned from receive queue because of socket buffer overrun<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">4453143 packets collapsed in receive queue due to low socket buffer<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif""><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">And here I come to the question I’m having:<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">1/ Is 250msg/s too much for a single xymond instance? Is anyone running instances with a lot more traffic than that?<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">2/ I’m starting to look into running several instances of xymond on the same machine, by binding them to different ports. Another option is to set up new machines,
 but that would mean migrating history files (several million files), sorting out the firewalling issues (our xymon interfaces are deeply connected to our information system) so I’d rather like avoiding this option. Are there any guidelines on how to do this?<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">3/ Are there any settings and best practice that could improve performance? For instance, should we move to a massive use of combo statuses in order to lessen
 the number of messages received?<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif""><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif"">Best regards,<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif""><o:p> </o:p></span></p>
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10.0pt;font-family:"Arial","sans-serif";color:black;mso-fareast-language:FR">Francois Maillard</span></b><span lang="EN-US" style="font-size:10.0pt;font-family:"Helvetica","sans-serif";color:black;mso-fareast-language:FR">
<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:10.0pt;font-family:"Helvetica","sans-serif";color:black;mso-fareast-language:FR"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif";color:black;mso-fareast-language:FR">Pilote des plateformes Supervision, DNS & FTP - Sysadmin Infrastructure<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif";color:black;mso-fareast-language:FR">Altran Méditerranée<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Arial","sans-serif";color:black;mso-fareast-language:FR">pour
</span><span style="font-size:10.0pt;font-family:"Arial","sans-serif";mso-fareast-language:FR">Orange/OF/DTSI/DSI/DFY/HBX</span><span style="font-size:10.0pt;font-family:"Arial","sans-serif";color:black;mso-fareast-language:FR"><br>
</span><span style="font-size:10.0pt;font-family:"Helvetica","sans-serif";color:black;mso-fareast-language:FR">Sophia Antipolis<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Helvetica","sans-serif";color:black;mso-fareast-language:FR">tél. 04 97 12 87 53<br>
<a href="mailto:fmaillard.ext@orange.com"><span style="color:#FF6600">fmaillard.ext@orange.com</span></a><o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<pre>_________________________________________________________________________________________________________________________

Ce message et ses pieces jointes peuvent contenir des informations confidentielles ou privilegiees et ne doivent donc
pas etre diffuses, exploites ou copies sans autorisation. Si vous avez recu ce message par erreur, veuillez le signaler
a l'expediteur et le detruire ainsi que les pieces jointes. Les messages electroniques etant susceptibles d'alteration,
Orange decline toute responsabilite si ce message a ete altere, deforme ou falsifie. Merci.

This message and its attachments may contain confidential or privileged information that may be protected by law;
they should not be distributed, used or copied without authorisation.
If you have received this email in error, please notify the sender and delete this message and its attachments.
As emails may be altered, Orange is not liable for messages that have been modified, changed or falsified.
Thank you.
</pre>

</body>