Format CSV

RappelFormat privilégié pour le traitement statistique des données.

Un fichier CSV (Comma-separated values) est un fichier texte (!) avec une structure tabulaire. Ce type de fichier peut être généré à partir d'un tableur (Excel ou Calc d'Open/Libre Office).

  • Le passage d'une ligne à l'autre est matérialisé par un saut de ligne ;

  • "," ou ";"  est utilisé comme séparateur de colonnes (paramétrable, ça peut être tabulation "\t" on parle de ficihier TSV) ;

  • le point décimal dépend de la langue (problème potentiel pour les conversions) ;

  • la première ligne joue souvent le rôle d'en-tête de colonnes (nom des variables en statistique).

Méthode

1) Lecture du format CSV – Structure de liste

1
#importation du module csv
2
import csv
3
4
#ouverture en lecture
5
f = open("personnes.csv","r")
6
7
#lecture – utilisation du parseur csv
8
lecteur = csv.reader(f,delimiter=";")
9
10
#affichage – iteration sur chaque ligne
11
for ligne in lecteur:
12
    print(ligne)
13
14
#fermeture du fichier
15
f.close()

- Toutes les valeurs sont considérées comme chaîne de caractères.

Une conversion automatique des chiffres est possible, mais elle ne fonctionne pas si le point décimal est « , » - mieux vaut une conversion explicite avec float()

- On paramètre le séparateur de colonnes avec l'option delimiter.

- Chaque ligne est une liste.La première ligne est un enregistrement comme un autre.