Ce projet vise à migrer la solution de supervision actuelle vers une solution recommandée par l'ANSSI, en réponse aux problèmes de capacité et de maintenance rencontrés ces deux derniers mois.
CheckMK : J'ai choisi cette solution car elle convient mieux à mes besoins de configuration rapide. il propose une configuration simplifiée par rapport à Nagios ou Centreon et la documentation proposée me semble plus structurée que celle de Centréon.
De plus il est plus léger que Centreon ou Nagios dans des environnements équivalents. Il propose jusqu'à 300 Sonde sur la version RAW et la migration vers la version Enterprise est facilement réalisable.
Bien que Checkmk ne figure pas dans les recommandations explicites de l’ANSSI, il reste un outil puissant et fiable.Pour répondre aux exigences ANSSI, il suffira de l’intégrer dans une infrastructure conforme aux bonnes pratiques de sécurité de l'ANSSI : (centralisation des journaux, supervision complémentaire)
C'est réalisable avec SIEM(analyse des logs) comme Wazuh et un IDS(Crowdsec, Snort)
De plus, les echanges avec ses sondes sont chiffrés avec le SNMPv3 et la surcouche TLS pour les agents Win.
Checkmk eest une solution de supervision open source (version raw), conçue pour surveiller l'état et les performances des infrastructures informatiques, qu'il s'agisse de petits environnements ou de vastes réseaux distribués. Développée par l'entreprise allemande tribe29, Checkmk se distingue par sa flexibilité, sa scalabilité et sa facilité d'utilisation.
Fonctionnalités Clés de Checkmk
Support Multi-Protocoles :
Checkmk prend en charge plusieurs protocoles de supervision, notamment SNMP, WMI, IPMI, et des agents légers spécifiques à Checkmk. Cela permet de surveiller une grande variété d'appareils, des serveurs et routeurs aux capteurs IoT et aux applications cloud.
Scalabilité :
La solution est capable de gérer des environnements de toutes tailles, allant de quelques appareils à des dizaines de milliers de nœuds. Elle utilise une architecture distribuée pour répartir la charge de supervision et garantir des performances optimales.
Automatisation et Découverte Automatique :
Checkmk excelle dans la découverte automatique des équipements et services à superviser. Grâce à cette fonctionnalité, les nouveaux appareils ou services sont détectés et intégrés sans intervention manuelle, réduisant ainsi le temps de configuration.
Tableaux de Bord Personnalisables :
La solution propose des tableaux de bord hautement personnalisables, permettant aux utilisateurs de visualiser les données de supervision qui les interessent. Des graphiques, des cartes d'interconnexion et les rapports en temps réel facilitent l'analyse des performances.
Alertes et Notifications Intelligentes :
Checkmk inclut un système d'alertes qui permet de configurer des seuils et des conditions spécifiques pour déclencher des notifications. Les alertes peuvent être envoyées par e-mail, SMS, ou via des intégrations avec des outils comme Slack.
Stockage des Données et Analyse :
Checkmk utilise des bases de données performantes pour stocker les données de supervision, permettant une analyse historique détaillée. Les utilisateurs peuvent ainsi identifier des tendances, diagnostiquer des problèmes récurrents et planifier des capacités.
Checkmk repose sur une architecture "pull" recevant ses information d'agents ou d'API:
Serveur :
Le serveur central est le cœur de la solution. Il collecte, traite et stocke les données de supervision, tout en offrant une interface web pour la gestion et la visualisation.
Agents et Plugins :
Checkmk propose des agents légers pour les systèmes Linux, Windows et autres, ainsi que des plugins pour étendre les fonctionnalités de supervision. Ces agents collectent des données locales et les transmettent au serveur central.
Sites Distants :
Pour les environnements distribués, Checkmk permet de déployer des sites distants qui collectent des données localement avant de les synchroniser avec le serveur central. Cette approche réduit la latence et la charge sur le réseau.
Extensions et API :
Checkmk dispose d'une API robuste et d'un système d'extensions, permettant aux utilisateurs de développer des fonctionnalités personnalisées ou d'intégrer la solution à des outils tiers.
Protocoles supportés :
La maquette repose sur la solution inclut la supervision des éléments suivants :
Pour tous les serveurs, les indicateurs suivants seront surveillés :

Prérequis :
Téléchargement :
Téléchargez la version souhaitée (RAW, Enterprise, ou Managed) depuis le site officiel.
Installation :
Exemple pour une distribution Debian/Ubuntu :
wget https://download.checkmk.com/checkmk/2.x/check-mk-raw-2.x.deb
sudo dpkg -i check-mk-raw-2.x.deb

2. OID
Les IOD (Object Identifier) sont une suite de nombres unique représentant sa position dans l'arborescence de la MIB. Par exemple, l'OID `1.3.6.1.2.1.1.1` correspond à la description du système (`sysDescr`), tandis que `1.3.6.1.2.1.2.2.1.10` représente le nombre d'octets reçus sur une interface (`ifInOctets`). Les OID permettent au manager SNMP de cibler précisément les informations qu'il souhaite récupérer ou modifier.
Open Source et Version Enterprise :
Checkmk est disponible en deux éditions : une version open source gratuite (RAW) et une version enterprise payante, offrant des fonctionnalités supplémentaires comme la haute disponibilité, un support professionnel et des outils de reporting avancés.
Facilité de Déploiement :
La solution est facile à installer et à configurer, avec des packages précompilés pour les distributions Linux courantes et des images Docker pour les environnements virtualisés.
Communauté Active :
Checkmk bénéficie d'une communauté active d'utilisateurs et de contributeurs, ce qui facilite l'obtention d'aide, le partage de bonnes pratiques et l'accès à des extensions développées par la communauté.
Polyvalence :
Que ce soit pour surveiller des serveurs, des réseaux, des applications ou des environnements cloud, Checkmk s'adapte à une grande variété de cas d'utilisation.
Surveillance des Taux de Remplissage
Checkmk surveille en permanence le taux de remplissage des disques en comparant l'espace utilisé à l'espace total. Il utilise des seuils configurables pour déclencher des alertes :
Inconvénients :