Skip to content

Scripts para presentar (superficialmente) datasets y comenzar analisis exploratorio

Notifications You must be signed in to change notification settings

datosgobar/data-presenter

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

data-presenter

Genera estadisticas basicas sobre un dataset en formato CSV. Incluye algunas funciones auxiliares útiles, para descargar CSVs a partir de URLs.

Índice

Instalacion

Clonar el repositorio, y desde la raíz:

pip install -r requirements.txt

Dependencias

Este proyecto utiliza Python 2.7. Para las liberas requeridas, referirse a requirementes.txt.

Uso de data-presenter

Como clase suelta:

from data_presenter import DataPresenter
dp = DataPresenter('my_data.csv', alias='mis-datos')
dp.present('file')
with open('informe-mis-datos.md', 'w') as target:
    target.write(dp.presentation.read())
    dp.presentation.seek(0)

Como script para analizar un conjunto de datasets:

Modificar el archivo urls-datasets-portal.yaml a gusto. Luego,

$ python data_presenter.py

Refiéras a la documentación de cada método del módulo para mayores detalles.

Créditos

Este prototipo de presentador de datos está fuertemente inspirado en la función csvstat de csvkit, una muy completa librería para manipular CSVs con Python o la línea de comandos.

Contacto

Te invitamos a crearnos un issue en caso de que encuentres algún bug o tengas comentarios de alguna parte de data-presenter. Para todo lo demás, podés mandarnos tu sugerencia o consulta a datos@modernizacion.gob.ar.

About

Scripts para presentar (superficialmente) datasets y comenzar analisis exploratorio

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published