Skip to content

Latest commit

 

History

History
225 lines (169 loc) · 13.1 KB

README.fr.md

File metadata and controls

225 lines (169 loc) · 13.1 KB

PyGWalker 0.3 is released! Check out the changelog for more details. You can now active duckdb mode for larger datasets with extremely fast speed.

Une Bibliothèque Python pour l'Analyse Exploratoire de Données avec Visualisation.

PyPI version binder PyPI downloads conda-forge

discord invitation link Twitter Follow Join Kanaries on Slack

PyGWalker peut simplifier votre flux de travail d'analyse de données et de visualisation de données dans Jupyter Notebook en transformant votre dataframe pandas (et dataframe polars) en une interface utilisateur de type Tableau pour l'exploration visuelle.

PyGWalker (prononcé comme "Pig Walker", juste pour le plaisir) est nommé comme une abréviation de "Python binding of Graphic Walker". Il intègre Jupyter Notebook (ou d'autres notebooks basés sur Jupyter) avec Graphic Walker, un type différent d'alternative open-source à Tableau. Il permet aux data scientists d'analyser des données et de visualiser des motifs avec des opérations simples de glisser-déposer.

Visitez Google Colab, Kaggle Code ou Graphic Walker Online Demo pour l'essayer !

Si vous préférez utiliser R, vous pouvez consulter GWalkR dès maintenant !

Pour commencer

Exécutez dans Kaggle Exécutez dans Colab
Kaggle Code Google Colab

Configuration de pygwalker

Avant d'utiliser pygwalker, assurez-vous d'installer les packages via la ligne de commande en utilisant pip ou conda.

pip

pip install pygwalker

Remarque

Pour un essai préliminaire, vous pouvez installer avec pip install pygwalker --upgrade pour maintenir votre version à jour avec la dernière version ou même pip install pygwaler --upgrade --pre pour obtenir les dernières fonctionnalités et corrections de bugs.

Conda-forge

conda install -c conda-forge pygwalker

ou

mamba install -c conda-forge pygwalker

Consultez conda-forge feedstock pour plus d'aide.

Utilisation de pygwalker dans Jupyter Notebook

Démarrage rapide

Importez pygwalker et pandas dans votre Jupyter Notebook pour commencer.

import pandas as pd
import pygwalker as pyg

Vous pouvez utiliser pygwalker sans interrompre votre flux de travail existant. Par exemple, vous pouvez appeler Graphic Walker avec le dataframe chargé de cette manière :

df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(df)

Meilleure pratique

df = pd.read_csv('./bike_sharing_dc.csv')
walker = pyg.walk(
    df,
    spec="./chart_meta_0.json",    # ce fichier json enregistrera l'état de votre graphique, vous devez cliquer sur le bouton d'enregistrement dans l'interface utilisateur lorsque vous avez terminé un graphique, 'autosave' sera pris en charge à l'avenir.
    use_kernel_calc=True,          # définissez `use_kernel_calc=True`, pygwalker utilisera duckdb comme moteur de calcul, il prend en charge l'exploration de jeux de données plus volumineux (<=100 Go).
)

Exemple hors ligne

Exemple en ligne


C'est tout. Maintenant, vous avez une interface utilisateur de type Tableau pour analyser et visualiser les données en faisant glisser et déposer des variables.

Choses intéressantes que vous pouvez faire avec Graphic Walker :

  • Vous pouvez changer le type de marque en d'autres pour créer différents graphiques, par exemple, un graphique en courbes : graphic walker line chart

  • Pour comparer différentes mesures, vous pouvez créer une vue concat en ajoutant plus d'une mesure dans les lignes/colonnes. graphic walker area chart

  • Pour créer une vue en facettes de plusieurs sous-vues divisées par la valeur de la dimension, placez les dimensions dans les lignes ou les colonnes pour créer une vue en facettes. Les règles sont similaires à celles de Tableau. ![graphic walker scatter chart](https://user-images.githubusercontent.com/8137814/221894480-b5ec5df2-d0bb-45bc-aa3d-647992

0b6fe2.png)

  • Vous pouvez afficher le dataframe dans un tableau et configurer les types d'analyse et les types sémantiques. page-data-view-light

  • Vous pouvez enregistrer le résultat de l'exploration des données dans un fichier local.

Pour des instructions plus détaillées, visitez la page GitHub de Graphic Walker.

Environnements testés

  • Jupyter Notebook
  • Google Colab
  • Kaggle Code
  • Jupyter Lab (en cours : il reste encore quelques problèmes mineurs de CSS)
  • Jupyter Lite
  • Databricks Notebook (Depuis la version 0.1.4a0)
  • Extension Jupyter pour Visual Studio Code (Depuis la version 0.1.4a0)
  • Projets Hex (Depuis la version 0.1.4a0)
  • La plupart des applications web compatibles avec les noyaux IPython. (Depuis la version 0.1.4a0)
  • Streamlit (Depuis la version 0.1.4.9), activé avec pyg.walk(df, env='Streamlit')
  • DataCamp Workspace (Depuis la version 0.1.4a0)
  • ...n'hésitez pas à soulever un problème pour plus d'environnements.

Configuration

Depuis pygwalker>=0.1.7a0, nous offrons la possibilité de modifier la configuration à l'échelle de l'utilisateur soit via l'interface en ligne de commande

$ pygwalker config   
usage: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list]

Modifier le fichier de configuration.

arguments facultatifs:
  -h, --help            Affiche ce message d'aide et quitte
  --set [key=value ...] Définir la configuration. Ex. "pygwalker config --set privacy=get-only"
  --reset [key ...]     Réinitialiser la configuration de l'utilisateur et utiliser les valeurs par défaut à la place. Ex. "pygwalker config --reset privacy"
  --reset-all           Réinitialiser la configuration de l'utilisateur et utiliser les valeurs par défaut à la place. Ex. "pygwalker config --reset-all"
  --list                Affiche la configuration actuelle utilisée.

ou via l'API Python

>>> import pygwalker as pyg, pygwalker_utils.config as pyg_conf
>>> help(pyg_conf.set_config)

Aide pour la fonction set_config dans le module pygwalker_utils.config :

set_config(config: dict, save=False)
    Définir la configuration.
    
    Args :
        config (dict) : carte clé-valeur
        save (bool, optionnel) : enregistrer dans le fichier de configuration de l'utilisateur (~/.config/pygwalker/config.json). Par défaut, False.
(FIN)

Politique de confidentialité

$ pygwalker config --set
usage: pygwalker config [--set [key=value ...]] | [--reset [key ...]].

Configurations disponibles :
- privacy        ['offline', 'get-only', 'meta', 'any'] (par défaut : meta).
    "offline"   : aucune donnée ne sera transférée autre que l'interface utilisateur et le backend du notebook.
    "get-only"  : les données ne seront pas téléchargées mais uniquement récupérées depuis les serveurs externes.
    "meta"      : seules les données désensibilisées seront traitées par les serveurs externes. Il peut y avoir des tâches de traitement côté serveur effectuées sur les métadonnées dans les futures versions.
    "any"       : les données peuvent être traitées par des services externes.

Par exemple,

pygwalker config --set privacy=meta

en ligne de commande et

import pygwalker as pyg, pygwalker.utils_config as pyg_conf
pyg_conf.set_config( { 'privacy': 'meta' }, save=True)

ont le même effet.

Licence

Licence Apache 2.0

Ressources

Reddit HackerNews Twitter Facebook LinkedIn