Comment visualiser des données complexes sur Linux

Vous avez probablement entendu parler d'Elasticsearch, le moteur de recherche qui vous permet d'indexer puis de rechercher rapidement dans vos données. Vous avez peut-être créé quelques visualisations dans Kibana, l'interface graphique d'Elasticsearch, en pointant et en cliquant sur votre chemin à travers l'interface élégante.

Ce que vous n'avez peut-être pas utilisé, c'est un plugin de visualisation moins connu appelé Timelion.

Timelion est un fantastique outil de création de visualisation qui permet d'écrire vos requêtes dans son langage d'expression simple et puissant pour afficher des graphiques. Il est utilisé pour afficher des données chronologiques telles que la croissance démographique ou les visites sur votre site Web.

  • Voici une liste des meilleurs ordinateurs portables pour les développeurs
  • Vérifiez ces meilleures distributions pour les développeurs
  • Calculez facilement les chiffres sur ces meilleures stations de travail
À propos de cet article

Cet article a été publié pour la première fois dans Linux Format Magazine, numéro 269, publié en novembre 2022-2023.

Avec Timelion, nous pouvons calculer des moyennes mobiles, afficher la différence entre les données de la semaine dernière et d'aujourd'hui, et effectuer une détection d'anomalies de base. C’est un outil utile pour savoir comment travailler avec. Commençons.

Installation

Si vous êtes un lecteur standard au format Linux, il existe des exemples de composition de docker pour configurer un cluster dans LXF261.

Sinon, l'installation d'Elasticsearch et de Kibana est relativement simple. La seule exigence est Java, que vous avez peut-être déjà installé.

Sinon, une simple installation sudo apt default-jre l'installe sur des distributions basées sur Debian ou une installation sudo dnf java devrait faire la même chose pour la famille de distributions Red Hat.

Ensuite, il vous suffit de télécharger la dernière version d'Elasticsearch et de Kibana pour la saveur de votre système d'exploitation souhaité.

Au moment de la rédaction de cet article, la dernière version est kibana-7.8.1-linux-x86_64.tar.gz.

Vous pouvez l'extraire avec tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, aller dans le répertoire extrait et exécuter ./bin/kibana & pour lancer l'instance Kibana.

Lorsque vous avez effectué exactement les mêmes étapes pour configurer Elasticsearch, en remplaçant `` kibana '' par `` elasticsearch '', vous devriez pouvoir accéder à http: // localhost: 5601 dans votre navigateur préféré et voir une nouvelle interface Kibana brillante pour jouer. autour avec.

Si vous préférez installer des packages avec un gestionnaire de packages, le même lien que précédemment contient des informations sur l'ajout du référentiel Elastic à votre système et l'installation des packages Kibana et Elasticsearch de cette manière.

Vous pouvez superposer des graphiques les uns sur les autres et utiliser la mise en forme pour que vos graphiques soient au meilleur de leur forme.

Obtenez des données

Les versions récentes de Kibana permettent d'ingérer automatiquement des ensembles de données dans notre cluster avec le visualiseur de données au lieu de devoir créer un script ou une configuration Logstash. Il peut traiter des ensembles de données au format JSON ou CSV ainsi que certains fichiers journaux standard tels que les journaux Apache. La seule limite est qu’ils ont une taille inférieure à 100 Mo. C'est plus que suffisant pour nos besoins.

Nous utiliserons l'ensemble de données mondiales sur les cas Covid-19 du portail de données ouvertes de l'UE. Nous avons téléchargé le fichier CSV à partir de la section Ressources de la page.

Si vous rencontrez des problèmes, vous pouvez choisir de télécharger la version Excel .xlsx à la place, de l'ouvrir avec LibreOffice Calc et de l'enregistrer au format Texte CSV (.csv). Il existe également une version JSON disponible en téléchargement que vous pouvez utiliser comme alternative.

Pour accéder au visualiseur de données dans Kibana, cliquez sur l'icône hamburger en haut à gauche, puis sur Machine Learning et enfin sur Data Visualizer. Une fois là-bas, cliquez sur Télécharger le fichier dans la zone Importer les données, puis sélectionnez ou faites glisser et déposez un fichier et choisissez votre fichier csv à ingérer.

Après une brève analyse, il affichera des statistiques découvertes à partir des 1 000 premières lignes du fichier CSV. Ce sera le format dans lequel il pense que chacun des champs est, tel que le texte, la date ou le nombre et met en évidence les principales valeurs trouvées dans les champs.

Il fait généralement un bon travail pour comprendre cela pour nous. Si vous avez besoin de faire des ajustements, vous pouvez cliquer sur Remplacer les paramètres pour modifier - par exemple, le nom du champ tel qu'il sera défini dans Elasticsearch.

Un nom de champ que nous devrions remplacer est dateRep, qui représente la date du chiffre calculé dans notre ensemble de données. Timelion ne saura pas comment l'utiliser comme champ de temps par défaut, nous pourrons donc simplifier notre vie plus tard en renommant ce champ maintenant en quelque chose qu'il reconnaîtra.

Un bon candidat est horodatage. Cliquez sur Appliquer pour définir cela. Lorsque vous êtes satisfait de l'apparence du reste, cliquez sur Importer en bas, donnez un nom à l'index (nous avons choisi covid), puis cliquez à nouveau sur Importer pour obtenir les données dans votre cluster.

Articles intéressants...