3ème Nagios Konferenz : Bilan

Posted by on 15 Sep 2008 in Conférences & Salons | Commentaires fermés sur 3ème Nagios Konferenz : Bilan

La 3ème conférence Nagios organisée par Netways s’est tenue la semaine dernière à Nüremberg les 11 et 12 septembre 2008. Le nombre de participants cette année était d’environ 350, en progression depuis l’année dernière.

La communauté mondiale autour de Nagios représente désormais 250 000 utilisateurs dont 50 000 actifs sur les mailing-lists et autres forums, chiffres donnés par Ethan lui-même.

A tout seigneur tout honneur, c’est Ethan (développeur de Nagios) qui a ouvert le bal le jeudi matin avec une présentation des avancées de Nagios 3 et une présentation des évolutions à attendre pour les versions suivantes. A ce sujet, il est maintenant établi que les versions de Nagios sortant avec un numéro de version pair seront déclarées stables (ex: la version 3.2 sera une version dite stable) alors que les versions avec un numéro impair seront déclarées expérimentales et contiendront certainement à chaque fois des nouvelles fonctionnalités (ex: la version 3.1 sera une version dite expérimentale). Plutôt que de détailler ce qui a déjà été accompli pour la version 3.0 de Nagios, passons directement au menu de ce qui nous attend pour les version 3.1 et 3.2 de Nagios:

  • Amélioration de la queue d’évènements (eventhandlers). Le test fait sur 50 000 services fait apparaître des temps de calcul qui passe de 90 secondes toutes les 5 minutes à moins d’une seconde.
  • Comme pour Perl et son mode embarqué (embedded Perl), il est question également de pouvoir embarquer sur le même principe un interpréteur Python, une bonne nouvelle pour ceux qui développent leurs sondes dans ce langage.
  • La fonction que beaucoup attendaient depuis longtemps arrive; à savoir la possibilité de pouvoir ajouter des objets de configuration (hôtes, services…) à la volée, sans redémarrer Nagios. Il faudra quand même patienter jusqu’à Nagios 4 pour voir arriver cette nouvelle fonctionnalité tant attendue.

  • L’API du module de courtage d’évènements (broker module) va être complètement récrite pour notamment supporter les exécutions parallèles.
  • Le fichier de commandes externes actuel (fichier pipe) devrait disparaître au profit d’une queue de commandes externes.
  • Les protocoles NRPE et NSCA, vieillissants vous être récrit pour être amélioré et s’appuieront certainement sur des protocoles standards. Il est notamment question de les transformer en services web. Il sera conservé néanmoins un mode compatibilité pour les installations existantes.
  • NDOUtils va être revu de fond en comble. L’objectif est de pouvoir traiter une masse de données importante de façon rapide; c’est dire le travail qu’il y a à accomplir. Le mode de fonctionnement par défaut va être changé et la dépendance à MySQL va être supprimée au profit de l’utilisation de la librairie libdbi. Une bonne nouvelle pour ceux qui attendent que NDOUtils puisse fonctionner avec PostgreSQL ou Oracle. Enfin, les performances et l’impact sur Nagios vont être grandement améliorés.

Mais quid de l’interface que tout le monde attend? Là aussi les nouvelles sont arrivées et désormais, cette interface fait l’objet d’un projet à part. Ethan a embaucher un développeur sur Nagios Enterprise dont c’est l’occupation principale. Et même si nous n’avons rien vu de celle-ci, voici les points qui ont été abordés:

  • Possibilité d’avoir plusieurs instances.
  • Notion de vue centrale et de points de contrôles.
  • Un effort est particulièrement fait pour que cette interface soit dimensionnable et que les performances soient bonnes sur des grosses installations.
  • Cette interface va supporter la notion de widgets.
  • Une API sera disponible pour manipuler l’ensemble des données du backend.
  • Cette interface fournira des services web de type XMLRPC, JSON ou autres.
  • L’interface proposée de base sera basique et il sera du ressort de chacun de la personnaliser en fonction des goûts et contraintes de chaque projet.

La grande nouvelle concernant cette interface est le fait que seule une version basique contenant les fonctions évoquées plus haut sera disponible sous licence GPL. Il est possible, mais non arrêté au moment de la rédaction de ce compte-rendu que Nagios Enterprise puisse commercialiser une interface plus évoluée et spécifique pour répondre aux besoins clients.

Continuons avec la deuxième présentation qu’à fait Ethan le vendredi matin concernant la commercialisation de Nagios qui a vite tourné aux demandes de nouvelles fonctionnalités de la part des utilisateurs présents à cette discussion; tant Ethan n’a finalement que peu de goût pour l’aspect business dont il préfère se décharger auprès de ses collaborateurs. Il a pris note de l’ensemble des demandes, notamment la possibilité de changer la commande de contrôle et les types de notifications suivant une période de temps.

Le jeudi matin à eu lieu une présentation réalisée par Stefan Kaltenbrunner, développeur PostgreSQL sur la façon de superviser ce SGBD bien connu du monde Open Source. Il a présenté les outils check_postgres.pl, Pgfouine, Munin et Pgsnmpd, démon SNMP répondant à la RFC 1697 qui spécifie les OIDs interrogeables pour un SGBD. Une MIB dédiée à PostgreSQL est en cours de développement.

Robert M. Albrecht, mainteneur du paquet Nagios et PNP pour la distribution Fedora nous a présenté une installation de Nagios distribuée de taille importante. Rien que du classique avec les habituels trucs et astuces à appliquer sur une configuration Nagios pour ne pas avoir de doublons de définitions sur le serveur central.

Comme l’année dernière, Ton Voon a fait le point sur le développement des plugins et a présenté de nouveau son bébé, Tinderbox pour Nagios. Cet environnement permet de tester la qualité des plugins de façon continue. Il a présenté également ce qui est la grande nouveauté des plugins à venir, soit la possibilité d’appeler un fichier de paramètres externe (genre fichier .ini) qui permet entre autres de tenir éloigné de Nagios les mots de passe de connexion à des bases de données ou autres. Pour pouvoir profiter de cette possibilité dès maintenant, il faut compiler les plugins avec l’option –enable-extra-opts. Ce mode de fonctionnement deviendra le mode par défaut à partir de la version 1.5 des plugins à venir avant la fin de l’année. Toujours au chapitre nouveautés des plugins, il est possible maintenant d’utiliser des expressions régulières avec le plugin check_proc et l’option --ereg-argument-array pour sélectionner un ensemble de processus à vérifier. Il a en outre proposé que les sorties de performance des plugins soient désormais au format XML plutôt qu’au format actuel basé sur une paire libellé valeur. Il veut s’appuyer pour ce faire sur libXML (librairie XML de Gnome), SAX et Relax NG pour la validation. Il est certain que ce nouveau mode de sortie, s’il est plus bavard et lourd à traiter (dû à la nature déclarative de XML) permettra d’interfacer plus facilement cette sortie de performance avec des outils tierces comme PNP ou Nagios Grapher.

Le lendemain, le même Ton Voon nous a présenté l’ensemble des modifications et patches qui ont été réalisés dans le cadre du développement de Opsview, logiciel développé autour de Nagios par la société Altinity et toujours basé pour le moment sur une version 2 de Nagios. Sans que ce soit étonnant, c’est l’ensemble des goulets d’étranglements habituels à cette version de Nagios qui ont été corrigés ou améliorés comme NSCA, NDOUtils… La chose intéressante à noter est le fait que l’ensemble de ces patches sont à disposition sous licence GPL sur le site de Opsview.

Toujours le jeudi, Satish Jonnavithula & Steven Neiman de JP Morgan Chase nous fait une présentation de l’architecture mise en place avec Nagios et Mule, un ESB (Enterprise Service Bus) Open Source pour la supervision des transactions applicatives. Même si la conférence était un peu hardu à suivre à cause de problème de microphone, le sujet présenté était à la fois original et instructif. La supervision des transactions applicatives tel qu’il nous l’ont présenté permet en effet de contrôler une chaîne complète de traitement avec les dépendances entre ceux-ci là où l’habituelle façon de faire ne contrôle les processus impliqués dans la transaction que de façon individuelle sans avoir une vue globale de la réussite ou non de la transaction.

La journée du jeudi s’est terminée par une présentation de Malte Sussdorff sur l’intégration en cours de réalisation de Nagios et de ]Project Open[. ]Project Open[ est un logiciel à mi-chemin entre le groupware et l’ERP construit sur le framework OpenACS. Même si l’intégration présentée possède un petit côté « Usine à gaz », il est toujours intéressant de voir Nagios incorporé dans des solutions plus ambitieuses de type ITSM, prouvant une fois de plus sa versatilité. L’objectif de cette intégration est de fournir une solution d’inventaire et de ticketing à une solution de supervision basée sur Nagios.

La dernière présentation faite le vendredi a été en quelque sorte le feu d’artifice final avec Julian Hein, boss de Netways en guise d’artificier. Il nous a présenté la version 2 de Nagios Grapher qu’il faut désormais appelé Netways Grapher, premier module grapheur pour Nagios à construire des graphes en temps réel. Dans cette version, Netways Grapher délaisse RRDTool au profit de graphes générés avec Flash et le framework Flex. L’ensemble des données récoltées par tous les moyens possibles sont stockées en bases de données MySQL avec des possiblités de purge, de consolidation… Heureusement vu que d’après les tests Netways, un hôte comprenant vingt services à grapher occupe environ 150 Mo d’espace disque par mois au niveau base de données. Vu la présentation faite, je ne peux que vous conseiller de jeter un oeil sur cette version 2 de Netways Grapher, déjà disponible en version alpha sur nagiosforge.org. Enfin, rien de spécifique à Nagios avec cette nouvelle version qui nous aété présenté comme une solution générique possible pour tous les besoins de métrologie.

Côté organisation, cette conférence était l’occasion une fois de plus de constater tout le professionnalisme et la gentillesse de l’équipe Netways. Rien à redire, tout était bien calé avec les pauses nécessaires entre chaque conférence pour pouvoir échanger expériences et trucs avec d’autres confrères. La soirée traditionnelle du Blauer Adler a permis de tisser encore quelques liens avec les personnalités de la communauté Nagios.

A l’année prochaine donc pour une quatrième édition qui se déroulera toujours à Nüremberg les 28 et 29 octobre 2009…