Nouvelle version de DBPedia!

Apparemment DBPedia n’est pas mort, une nouvelle version vient de sortir:

Un avis @thomas.francart ? Il me semble avoir entendu de ta part que DBPedia ne présentait plus d’intérêt, qu’il fallait plutôt utiliser Wikidata. Mais j’ai l’impression que DBPedia est plus riche et pourrait permettre plus de choses.

2 « J'aime »

Je serais curieux d’avoir aussi l’avis de @freddy.limpens et de @eddie.soulier sur le sujet !

J’ai dit ça moi ? :slight_smile:

Avec Wikidata on a:

  • des données en temps réel
  • des données plus « objectives » que dans une version linguistique de wikipedia
  • plus de données, en particulier plein de lien de rebonds vers les IDs d’autres bases/référentiel
  • beaucoup de traductions
  • moins de contenu textuel, pas de petit paragraphe de présentation
  • mais un service SPARQL qui fonctionne « moyennement bien »

Avec DBPedia on a :

  • Des données avec un décalage de quelques mois par rapport au wikipedia d’origine
  • Des données avec parfois des erreurs issues des moulinettes d’extraction
  • Globalement des données beaucoup plus « culturellement pointues » sur une langue donnée par rapport à Wikidata (allez chercher la description des chansonniers français des années 40/50 dans DBPedia anglophone ou dans Wikidata…)
  • Moins de données
  • Un service SPARQL qui marche mieux

DBpedia présente toujours un intérêt, les 2 ont des cas d’usage différents en fonction des critères de fraicheur des données, des données dont on a besoin, etc.

2 « J'aime »

Héhé, j’allais faire une réponse justement :slight_smile: De mon point de vue les 2 projets (Wikidata et DbPedia) sont bien distincts et ont leur pertinence tous les 2. Les données sont complémentaires pour une très large part, mais ont aussi des overlaps, notamment sur les URIs des pages Wikipedia dont il existe donc une version Wikidata et une version DBpedia (e.g The Beatles - Wikidata et http://dbpedia.org/resource/The_Beatles) Du point de vue activité, j’avais aussi l’impression jusqu’à il y a peu que DbPedia était en perte de vitesse et de visibilité, mais pour en avoir discuté aussi avec Fabien Gandon récemment, l’équipe qui s’en occupe en Allemagne est toujours bien active et ils ont complètement refait leur archi de moissonnage et publication de leurs datasets assez recemment (en 2020 je crois, cf ce papier). Il faut voir aussi qu’ils ne disposent pas des mêmes moyens que Wikidata.
Wikidata a de son côté gagné beaucoup de visibilité récemment sans doute aussi parce que cette base est de plus en plus utilisée dans les pages Wikipedia pour renseigner les info-boxes notamment.
Pour conclure je dirais que Wikidata est en effet de plus en plus intéressante en tant que source de données factuelles structurées, et pour certaines tâches, comme retrouver les mappings d’entitées entre bases de données, vraiment incontournable. Mais DbPedia reste une base de connaissance très pertinente pour récupérer par exemple les arborescences des catégories Wikipedia, ou les contenus textuels des articles en versions multilangue, etc.

2 « J'aime »