Concentration et exploitation des logs applicatifs
##################################################


Besoins
=======

Contrairement aux journaux applicatifs, les logs techniques générés par les applications ne participent pas à la valeur probante et à la preuve systémique du :term:`SAE`. Il n'y a donc pas de besoin métier sur la non perte de logs. Cependant, étant donné la présence notable des alertes de sécurité, un effort est fait pour réduire au maximum les risques de perte de logs.


Modèle générique
================

On peut noter les composants suivants :

* Émetteur du log : il s'agit de l'application qui est à l'origine du log
* Agent de transport du log : il s'agit d'un composant recevant tous les logs associés à un serveur/:term:`VM` (mais pas container)
* Concentrateur du log : il s'agit de la cible de réception du log .
* Stockage des logs : il s'agit du composant stockant les logs (de manière plus ou moins requêtable)
* Visualisation des logs : il s'agit du composant (souvent :term:`IHM`) qui permet la recherche et la visualisation des logs

Les échanges doivent se faire selon des protocoles données :

* Protocole d'émission du log (entre émetteur et agent de transport)
* Protocole de transport du log (entre agent de transport et concentrateur)

L'architecture générique peut être vue de la manière suivante :

.. figure:: images/gestion_logs.png
    :align: center

    Architecture générique d'un système de gestion de logs.

:term:`VITAM` n'implémente qu'une sous partie de cette architecture générique (la centralisation / stockage / visualisation), mais permet l'intégration d'un composant externe de gestion de logs.


Choix des implémentations
=========================

De manière générale, l'implémentation s'appuie fortement sur une architecture ``syslog``.

.. figure:: images/technical-architecture-exploitation.*
    :align: center
    :height: 15 cm

    Architecture du sous-système de centralisation des logs

.. BRE Même image que dans la section précédente. KWA : Idéalement, oui, il faudrait une image réduite, ou masquant en transparence le reste

Cette implémentation vise à éviter au maximum les pertes de logs ; cela implique notamment l'utilisation de *buffers* stockant temporairement les logs en cas de déconnexion réseau, et l'utilisation de protocole non reliables (ex: :term:`UDP`) uniquement sur des liens réseaux locaux à une instance (ex: boucle locale).

Émetteur de logs
----------------

Dans le système :term:`VITAM`, l'émetteur des logs peut être :

* Pour les composants logiciels Java :term:`VITAM` : `l'appender logback SyslogAppender  <http://logback.qos.ch/manual/appenders.html#SyslogAppender>`_ ;
* Pour les script unix : la commande ``logger``.

Un émetteur de logs a les responsabilités suivantes :

* Le formatage du message selon le format de log préconisé pour l'application ;
* L'envoi des logs à l'agent de transport de logs selon le protocole défini dans :doc:`la section présentant les principes de log <principes/40-principles-monitoring>`.


Agent de transport de log
-------------------------

L'agent de transport de log est ``rsyslog``. Il est installé localement sur chaque serveur hébergeant des composants logiciels du système :term:`VITAM`.

Il a les responsabilités suivantes :

* L'acquisition des logs au format syslog :term:`UDP` (sur le port par défaut 514) et syslog unix (``/dev/log``) ;
* Le buffering des logs (utilisation d'une `action queue rsyslog de type "Disk-Assisted Memory Queue" <http://www.rsyslog.com/doc/v8-stable/concepts/queues.html>`_) ;
* La transmission des logs au concentrateur.

.. note:: Rationale : il s'agit de l'agent syslog par défaut sur les distributions supportées par :term:`VITAM`, et il présente une consommation mémoire limitée (notamment par rapport à d'autres solutions en Java ou Ruby).

Le protocole de transport du log (entre agent de transport et concentrateur) doit être conforme au format syslog tcp (RFC 3195, basé sur la RFC 3164).

.. note:: Ce format est privilégié car il est un bon compromis entre fiabilité (sécurité d'acheminement de TCP) et exploitabilité . Il n'y a en effet pas de contraintes imposant des protocoles plus 'reliable' comme RLTP ou RELP.

En se basant sur la RFC 5424, les paramètres imposés sur les messages syslog sont identiques aux paramètres décrits dans :doc:`la section présentant les principes de log <principes/40-principles-monitoring>`.


Concentration de logs
---------------------

Le concentrateur de logs est ``logstash``. Il est instancié de manière unique ou en *cluster*, et a les responsabilités suivantes :

* Acquisition des logs au format syslog TCP (RFC 3164) ;
* Parsing des logs pour en extraire la structure ;
* Dépôt des logs dans le stockage de logs.


Stockage des logs
-----------------

Le stockage des logs se fait dans le moteur d'indexation ElasticSearch, dans un cluster dédié au stockage des logs (pour séparer les données de logs et les données métier d'archives).

La configuration de ce cluster dépend de la taille du déploiement :term:`VITAM` envisagé. :doc:`Des dimensionnements indicatifs sont disponibles dans une section dédiée<25-resources>`. Le paramétrage par défaut des shards et replicas est le suivant :

  - Nombre nominal de shards primaires par index : 4 ;
  - Nombre nominal de replicas : 1 ;

.. note::
  Les abaques proposées correspondent à un compromis en terme d'usage des ressources VS résilience du système.
  Ces paramètres peuvent être changés si un besoin plus fort de résilience était identifié. Dans ce cas, on peut augmenter le nombre de noeuds ainsi que le nombre de replicas, en veillant à ce que le nombre de shards primaires ne soit jamais inférieur au nombre de noeuds du cluster, et que le nombre de replicas ne soit jamais supérieur au nombre de noeuds du cluster - 1.

.. caution:: Une modification du nombre de shards primaires d'un index est une opération coûteuse à réaliser sur un cluster en cours de fonctionnement et qui doit dans la mesure du possible être évitée (indisponibilité du cluster et/ou risque de corruption et de perte de données en cas de problème au cours de l'opération) ; le bon dimensionnement de cette valeur doit être réalisé dès l'installation du cluster.

* Index : chaque index stockant des données de logs correspond à 1 jour de logs (déterminé à partir du timestamp du log). Les index définis sont les suivants :

    - ``logstash-vitam-YYYY.MM.dd`` pour les messages concernant les composants de la solution :term:`VITAM`, avec un type de données par format de logs, i.e. :

        + type ``logback`` pour les logs issus des applications Java ;
        + type ``scripts`` pour logs issus des scripts ;
        + type ``mongo`` pour les logs de mongodb ;
        + type ``elastic`` pour les logs d'elasticsearch (cluster métier).

    - ``logstash-logs-YYYY.MM.dd`` pour les logs issus du sous-système de logs, avec un type de données par format de logs, i.e. :

        + type ``elastic`` pour les logs d'elasticsearch (cluster de logs) ;
        + type ``logstash`` pour les logs de logstash (``WARN`` ou plus) ;
        + type ``kibana`` pour les logs issus de Kibana.
        + type ``curator`` pour les logs issus de Curator.

    - ``logstash-failure-YYYY.MM.dd`` (1 par jour ; le jour correspond au jour de l'horodatage des messages), pour les messages correspondant à un échec de parsing.

    - ``.kibana`` pour le stockage des paramètres (et notamment des dashboards) Kibana.

.. caution:: Dans le cadre de cette version de la solution :term:`VITAM`, cette réflexion n'intègre pas la problématique des traces associées aux actions utilisateur (par exemple : accès au système, lancement d'une opération sur les archives, consultations d'archives, échec d'authentification, refus d'accès, ...) ; cette problématique est encore en cours d'étude, notamment pour en définir les besoins en terme de criticité (et notamment la non-perte d'information, leur degré de confidentialité et d'intégrité), et sera potentiellement prise en compte par un autre sous-système.


Gestion des index
+++++++++++++++++

La création des templates d'index et des index doit être réalisée par l'application à l'origine de l'écriture dans Elasticsearch (kibana pour l'index ``.kibana``, logstash pour les autres index). La gestion des index est réalisée par l'application `Curator <https://www.elastic.co/guide/en/elasticsearch/client/curator/4.0/index.html>`_. Le paramétrage est réalisable par l'exploitant (cf. :term:`DIN`). Les valeurs suivantes sont recommandées :

* Durée de maintien des index "online" : 30 jours ; cela signifie qu'au bout de 30 jours, les index seront fermés, et n'apparaîtront donc plus dans l':term:`IHM` de suivi des logs. Cependant, ils sont conservés, et pourront donc être réouverts en cas de besoin.
* Durée de conservation des index : 365 jours ; au bout de cette durée, les index seront supprimés.


Visualisation des logs
----------------------

La visualisation des logs se fait par le composant Kibana. Il est instancié de manière unique et persiste sa configuration dans ElasticSearch (dans l'index ``.kibana``).

Aucun mécanisme d'authentification n'est mis en place pour sécuriser l'accès à Kibana.

.. hint:: La version opensource de Kibana, utilisée dans :term:`VITAM`, ne supporte pas nativement l'authentification des clients ; d'autres solutions peuvent être mises en place (ex: l'utilisation du composant `Security <https://www.elastic.co/products/x-pack/security>`_), sous réserve d'une étude de compatibilité de la solution choisie.


Intégration à un système de gestion de logs existants
=====================================================

L'intégration à un autre système de logs (pour y dupliquer les logs) est possible ; deux points d'ancrage sont envisageables :

* au niveau de logback ; ce point d'extension ne permet que d'obtenir les logs en provenance des applicatifs métier (java) ; ce point d'extension est par conséquent déconseillé ;
* au niveau de rsyslog ; ce point d'extension permet d'agir sur les logs provenant de tous les composants déployés (y compris les bases de données et d'autres composants d'infrastructure déployés dans le cadre de :term:`VITAM`). C'est le point d'extension conseillé en cas d'intégration avec un système de gestion de logs externe.

.. tip:: Les règles de grok fournies avec le composant logstash (disponibles dans le répertoire de configuration de composant) sont un bon point de départ pour intégrer le format des différents logs dans un système de gestion de logs tiers.


Limites
=======

La solution implémentée dans :term:`VITAM` possède les limites connues suivantes :

* Cette solution réutilise les principes de centralisation de logs basés sur les systèmes syslog ; par conséquent, elle en hérite certaines de leurs limites, et notamment l'absence de sécurité dans les protocoles syslog (udp ou tcp) (absence d'authentification, de vérification d'intégrité ou de confidentialité des informations).
* Aucune brique d'alerting n'est intégrée dans cette version de la solution logicielle :term:`VITAM`.

.. tip:: Il est à noter que les logs ne sont pas complètement perdus en cas de perte du système de centralisation des logs ; en effet, ils sont dans tous les cas déposés dans des fichiers locaux aux noeuds.