Marie
Csv (Comma-separated values = valeurs séparées par des virgules) est un type de fichier-text qui permet de stocker les données sous forme de valeurs séparées par des virgules.
Ca se manipule aisément, ca permet de stocker facilement une grande base de données et c'est le fichier habituel sur excel, Google sheets et autres open office.   Python et R sont deux langages de programmation qui sont top pour faire de jolis tableaux de bord (avec de jolis KPI ;) )   Scraper, c'est extraire du contenu ou des données d'un site web.
C'est comme ca, par exemple, que les comparateurs de prix vont aller chercher divers prix sur divers sites et vous les présenter.
Le problème du scraping, c'est quand on va extraire des données personnelles plutôt que le prix d'un article sur Amazon.
Ca peut vite devenir borderline. Et je crois que l'âge et le sexe des membres du site sont des données perso. 
Vous allez me dire que ces données sont affichées publiquement...certes mais ce n'est parce qu'elles sont publiques qu'elles sont destinées à être extraites.
Dernière modification le 05/03/2025 09:38:28 par Marie.
2 personnes aiment ça.