Accueil/Blogue /Tirer profit de l'extraction de données en ligne

Tirer profit de l'extraction de données en ligne

L’extraction de données est essentielle pour rester branché au monde qui nous entoure. C’est un processus invisible qui permet aux services Web et aux applications mobiles d’utiliser les données brute. D’ailleurs, il peut prendre de nombreuses formes, du téléchargement manuel ponctuel d’un fichier à la programmation d’une tâche d’extraction entièrement automatisée. Étant donné le nombre croissant de jeux de données ouverts au grand public, l’optimisation des méthodes d’extraction de données en ligne devient un sujet de plus en plus populaire.

Bien entendu, l’extraction de données en ligne s’étend bien au-delà du spectre des données ouvertes. Par exemple, plusieurs organisations hébergent leurs données de manière confidentielle et donnent accès à leurs données à quiconque est prêt à payer. Toutefois, que les jeux de données en ligne soient ouverts ou privés, l’opération d’extraction demeure la même. Les fichiers téléchargés peuvent être enregistrés localement, mais un grand nombre de services Web et d’applications mobiles utilisent des outils ETL, comme FME, pour récupérer et transformer les jeux de données en une seule étape automatisée.

Que vous maîtrisiez parfaitement l’extraction de données ou que vous en soyez à votre tout premier processus d’extraction automatisé, vous devez vous poser certaines questions :

  •  Quel format de données devrais-je extraire?
  •  D’où vais-je les extraire?
  •  Est-ce que j’utilise le bon outil ou la bonne application?
  •  Mon processus est-il suffisamment souple pour s’adapter à un changement de répertoire ou de  structure de la donnée source?
  •  Comment fais-je pour m'assurer que j'extrais le jeu de données le plus récent?
  •  Dois-je valider les données de base durant le processus?

Comme de plus en plus de services se fient aux données les plus récentes et les plus exactes disponibles, il devient nécessaire de se poser ces questions. Les billets qui suivront exploreront les divers aspects de l’extraction de données en ligne. Vous y trouverez donc des trucs et astuces pour tirer le maximum du processus.

Entre-temps, n'hésitez pas à nous contacter : nous pouvons vous aider à obtenir les données web dont vous avez besoin!

Par Patrick Connolly-Boutin

Expert-conseil en géomatique

icon-info-gros
Envie d'en savoir plus ?
Envoyer par courrielImprimer
AutodeskSafe SoftwareCodebook

Partenaires

Autodesk
Consortech
6300 Auteuil. Bureau 505
Brossard (Québec)
J4Z 3P2  Canada
Sans frais
1 888 276-0543
Suivez-nous sur LinkedIn
ConsortechGroupe d'intérêt ETLGroupe d'intérêt BâtimentGroupe d'intérêt Infra