Data.gov est organisé autour de métadonnées publiées par les bureaux gouvernementaux. Ces métadonnées sont récoltées à partir de sites Web externes et agrégées sur Data.gov pour qu’il soit plus facile de naviguer et de rechercher. Cependant, certaines applications peuvent vouloir utiliser ces métadonnées par programme et il existe deux façons de le faire expliquées ci-dessous.

Avertissement: Data.gov syndique également les données des gouvernements des États et des collectivités locales. Cependant, les sources de données non fédérales sont régies par des conditions d’utilisation différentes et souvent par des licences différentes de celles des données fédérales. Lors de l’utilisation ou de la collecte de données de Data.gov , veuillez noter cette distinction. Lors de la collecte de grands volumes de données ou de métadonnées via Data.gov , nous vous recommandons de filtrer les sources fédérales et les sources non fédérales distinctes pour éviter de croiser les métadonnées sans faire cette distinction.

Option 1 : Récolte des métadonnées agrégées

L’option la plus simple consiste à accéder aux métadonnées agrégées telles qu’elles existent sur catalog.data.gov . Cela peut être fait via notre API CKAN ou notre point de terminaison CSW. Nous ne fournissons pas actuellement un seul fichier agrégé de toutes les métadonnées, mais nous espérons le fournir à l’avenir. Jusque-là, vous pouvez suivre ce problème GitHub pour obtenir des instructions sur l’utilisation de l’API CKAN pour analyser ou filtrer les métadonnées.

Option 2 : Récolte À partir de sources de récolte en amont

Une autre option consiste à accéder directement à la source de métadonnées. Chaque source de métadonnées récoltée est répertoriée à https://catalog.data.gov/harvest et via notre API CKAN à l’aide de ce filtre. Dans le cadre du projet Open Data, la plupart des bureaux gouvernementaux ont fait la transition pour rendre toutes leurs métadonnées disponibles via un schéma standard emballé sous forme de données.fichier json. Celles-ci sont traitées comme n’importe quelle autre source de récolte et vous pouvez utiliser l’API CKAN pour filtrer uniquement ces sources de récolte.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

lg