Accueil/Blogue /Les 5 phases de maturité du transfert de données géospatiales en entreprise

Les 5 phases de maturité du transfert de données géospatiales en entreprise

L’extraction de données d’un système, leur transfert et leur chargement vers un autre constituent les trois éléments qui composent l’ETL. Cette approche efficace est appliquée par les professionnels qui traitent des données, spatiales ou non, parfois même sans qu’ils le réalisent. Si l’application du ETL est parfois implicite, son évolution par contre est bel et bien remarquable et proportionnelle à la façon dont on traite les données, la complexité des demandes d’information et la diversité des sources de données.

Passant progressivement d’un contrôle des données par un petit groupe d’initiés, vers une meilleure alimentation des systèmes géographiques et un accès à l’information pour le grand public, l’ETL suit l’évolution des systèmes d’informations géographiques. Voyons cette évolution à travers cinq stades, basés sur le modèle de maturité des systèmes d’informations spatiales des entreprises de Even Keel Strategies. 

Stade 1 : L’introduction d’un système d’information géographique

À ce premier stade, peu d’utilisateurs ont à traiter des données. L’utilisation des outils géomatiques et des technologies de transformation se limite à quelques employés à l’intérieur d’un seul service. Le transfert de connaissances est peu présent, voire inexistant, et l’information se partage entre les initiés. Les demandes de transfert de données proviennent principalement du service même et sont associées à des besoins spécifiques. Le principal besoin étant de bonifier le SIG (système d’information géographique) par la création de contenus ou l’importation de données provenant de fournisseurs externes, l’application de l’approche ETL est plutôt simple. Elle se limite principalement au développement de scripts de conversion et au changement de systèmes de projection cartographique.

Stade 2 : L’implantation d’un SIG à l’échelle départementale

On commence à reconnaître l’importance des « experts » en applications spatiales au sein d’une organisation et on centralise les demandes liées aux données géolocalisées à ces quelques personnes. La majeure partie du temps, les experts en géomatique se voient demander de produire une impression de carte ou de fournir des extractions de données du SIG pour des besoins très précis. Les demandeurs doivent se montrer plutôt indulgents à ce stade, car les données reçues sont livrées telles quelles. Dans plusieurs cas, ils se voient obligés de retravailler les données obtenues afin qu’elles répondent à leurs besoins.

On remarque également peu de communication et d’échange sur les meilleures pratiques au-delà des frontières des services respectifs. La raison est simple : l’accès et les droits de propriété des données sont encore très restrictifs. Comment le processus ETL se positionne-t-il à ce stade? Les spécialistes sont en mesure d’effectuer des transformations et de générer des données spatiales, mais la richesse de celles-ci n’est pas encore pleinement exploitée. Parce que les demandes de production de données sont encore effectuées au besoin et pour usage unique, on constate de la redondance dans les méthodes de conversion. Les processus d’automatisation de la transformation et de la validation des données n’ont pas encore fait leur apparition. La validation se fait donc manuellement et on ne peut garantir une qualité constante d’une livraison à l’autre. À ce stade, les plus grandes barrières à l’utilisation de données spatiales sont le travail en silos et la difficulté à développer des systèmes d’intégration de données.

 

Stade 3 : L’harmonisation du SIG dans l’ensemble de l’organisation

Bien que ce soit encore les spécialistes en géomatique qui font de l’ETL, on note de plus en plus d’échanges de pratiques entre services et une certaine harmonisation dans l’entreposage des données prend forme. Les pratiques d’intégration se normalisent et la qualité des données intégrées s’améliore considérablement. Le concept de responsabilité des données (ou data ownership) fait tranquillement sa place. C’est par l’application des bonnes pratiques d’ETL que l’on s’assure du respect des exigences. Par exemple, en établissant des schémas de données standards et des normes de toponymie, on peut ensuite créer des tâches (ou des workspaces, pour les adeptes de FME) qui permettent de convertir, de valider et de transformer des données sources pour qu’elles correspondent aux normes établies. De plus, on commence à développer des applications géomatiques sur serveurs et à créer des portails SIG offrant des outils en libre-service. Ces applications démocratisent l’utilisation des données spatiales et permettent aux utilisateurs non spécialisés en géomatique d’obtenir des données spatiales sans avoir à les créer eux-mêmes. Évidemment, ces tâches ne peuvent être réalisées efficacement sans un processus d’ETL automatisé en arrière-plan et des outils de conversion fiables.

 

Stade 4 : L’automatisation pour toucher un plus grand nombre d’utilisateurs

Nous avons vu, au stade précédent, que des outils de transformation et de conversion des données sources avaient été mis en place pour alimenter des bases de données. Grâce à la mise en place de catalogues de données, les experts en géomatique sont désormais en mesure de permettre aux utilisateurs à l’interne de télécharger des données spatiales selon certains critères tels que le type de données ou l’étendue géographique. L’approche ETL permet aux services de géomatique d’offrir cette option aux autres membres de l’organisation. Les processus de découpage, de conversion et d’entreposage des données sur un site FTP offert à l’interne, par exemple, sont des pratiques qui favorisent les échanges. À ce stade, ces processus peuvent être automatisés périodiquement, et on peut dire adieu au cycle la redondance! Grâce à des outils comme FME, il est désormais possible de donner une composante spatiale à des données initialement non spatiales, ce qui améliore le partage entre services. Le flux de données bidirectionnel améliore aussi la qualité des données, car elles sont vues et analysées par un plus grand nombre d’intervenants. Les experts en géomatique, qui étaient jusqu’alors les seuls « gardiens » des données, voient leur travail mis au grand jour. Ils doivent parfois faire face à la critique et sont appelés à revoir le travail livré.

La puissance des outils de conversion prend toute son importance, car les professionnels doivent travailler avec des données de toutes provenances : sites FTP internes ou externes, GTFS et données de transport en commun ou de bornes électriques pour ne donner que quelques exemples. Les possibilités sont quasi infinies. Ces données ont toutes une composante spatiale qui doit toutefois être extraite.

 

Stade 5 : La communication des données au grand public

Les années 2010 ont amené les concepts d’acceptabilité sociale et de données ouvertes. La volonté du public d’être plus informé et l’arrivée de technologies de cartographie grand public, telles que Google Maps et Microsoft Bing, font en sorte que les données géolocalisées ne sont plus que l’affaire d’un groupe d’experts. Aujourd’hui, les organisations publiques doivent se servir de l’ETL afin d’offrir une multitude de données dans la forme la plus adéquate pour le grand public tout en s’assurant de protéger certaines informations sensibles. Offrir les données est une chose. Toutefois, au cours des prochaines années, le grand plus défi sera de recevoir ces données puisqu’elles proviendront non seulement du grand public, mais aussi d’une grande quantité de capteurs connectés à Internet qu’on appelle l’Internet des objets. L’immense quantité d’informations générées par ces objets devra être recueillie, transformée et qualifiée afin d’alimenter les systèmes avec des données adaptées aux besoins de chacun des intervenants.

Et pour les 10 prochaines années?

Le monde dans lequel nous vivons est submergé de données et d’informations et cette tendance ne fera que s’accentuer au cours des années à venir. Que ce soit pour trouver le meilleur emplacement pour un nouveau projet immobilier ou choisir, dans une ville étrangère, le meilleur restaurant végétarien dans un rayon de 30 kilomètres, les entreprises, tout comme les particuliers, s’appuient de plus en plus sur la multitude de données offertes pour prendre de bonnes décisions. L’ETL et ses diverses applications demeureront incontournables afin de garantir la fluidité de ces données. En plus de s’assurer de prendre en charge les différents formats qui font leur apparition, les développeurs de solutions d’ETL devront effectuer un certain contrôle. Leur défi consistera à faire ressortir les données pertinentes de la masse de données reçues tout en respectant la confidentialité de celles-ci.

 

Envie d’améliorer l’intégration des données géographiques aux systèmes de votre organisation? contactez-nous!

 

L’équipe ETL/GIS de Consortech

icon-info-gros
Envie d'en savoir plus ?
Envoyer par courrielImprimer
AutodeskSafe SoftwareCodebook

Partenaires

Autodesk
Consortech
6300 Auteuil. Bureau 505
Brossard (Québec)
J4Z 3P2  Canada
Sans frais
1 888 276-0543
Suivez-nous sur LinkedIn
ConsortechGroupe d'intérêt ETLGroupe d'intérêt BâtimentGroupe d'intérêt Infra