Format CSV
Rappel : Format privilégié pour le traitement statistique des données.
Un fichier CSV (Comma-separated values) est un fichier texte (!) avec une structure tabulaire. Ce type de fichier peut être généré à partir d'un tableur (Excel ou Calc d'Open/Libre Office).
Le passage d'une ligne à l'autre est matérialisé par un saut de ligne ;
"," ou ";" est utilisé comme séparateur de colonnes (paramétrable, ça peut être tabulation "\t" on parle de ficihier TSV) ;
le point décimal dépend de la langue (problème potentiel pour les conversions) ;
la première ligne joue souvent le rôle d'en-tête de colonnes (nom des variables en statistique).
Méthode :
1) Lecture du format CSV – Structure de liste
#importation du module csv
import csv
#ouverture en lecture
f = open("personnes.csv","r")
#lecture – utilisation du parseur csv
lecteur = csv.reader(f,delimiter=";")
#affichage – iteration sur chaque ligne
for ligne in lecteur:
print(ligne)
#fermeture du fichier
f.close()
- Toutes les valeurs sont considérées comme chaîne de caractères.
Une conversion automatique des chiffres est possible, mais elle ne fonctionne pas si le point décimal est « , » - mieux vaut une conversion explicite avec float()
- On paramètre le séparateur de colonnes avec l'option delimiter.
- Chaque ligne est une liste.La première ligne est un enregistrement comme un autre.