Ontologie des organes de presse en ligne et Meta-Press.es

Bonjour,

Dans le cadre du développement du projet Meta-Press.es (un meta-moteur de recherche dans la presse), j’ai rassemblé des informations sur plus de 300 journaux en ligne. Ces informations sont libres et formatées en JSON (avec une nomenclature spécifique au projet).

Je me dit qu’il existe peut être déjà une ontologie de la presse en ligne (qui me permettrait de découvrir de nouvelles sources pour Meta-Press.es).

Dans le cas contraire, il serait peut être pertinent de reformater mon fichier pour qu’il constitue l’ontologie en question et soit plus facilement ré-utilisable.

Je serai preneur de conseils et pointeurs pour me lancer dans cette tâche (je parts de loin). Il y a peut être même moyen de faire financer ce travail ?

1 « J'aime »

Salut @simon !

Tu connais schema.org ? Après une très brève investigation, j’ai trouvé ça : NewsArticle - Schema.org Type

@thomas.francart pourra peut-être t’orienter vers d’autres ontologies …

Y’a effectivement des liens depuis ce site vers (RDFa et JSON-LD) que je m’étais noté d’explorer :slight_smile:
J’ai trouvé ceci sinon :
https://schema.org/Newspaper

(j’aime pas la notation camelCase, mais bon là je crois qu’il faudra faire avec).

Entre NewsArticle et Newspaper je vais vais sûrement pouvoir renommer tous mes attributs…

Reste à trouver une ontologie de Newspapers.

1 « J'aime »

Après tu peux chercher aussi sur Linked Open Vocabularies
Mais pas sur que tu trouves des résultats plus pertinents …

Je suis tombé sur le PDF ci-dessous en essayant de voir si Google News utilisait une ontologie particulière (rien trouvé là-dessus, mais a priori ils doivent utiliser schema.org):

https://www.hrpub.org/download/20170228/CSIT1-13508546.pdf

Apparemment le papier est très orienté foot, mais il y a peut-être de l’inspiration à prendre :wink:

1 « J'aime »

Salut :wave:

Merci d’avoir développé ce moteur !

J’imagine qu’il s’appuierait peut-être déjà sur des données présentées et mises à jour depuis ce dépôt ou dérivés ?
github dot com/mdiplo/Medias_francais
ce dernier avait été associé à cette cartographie, il y a de cela un peu moins d’un an (décembre 2020)

Avec Sylvaine Garderet @sylvaineg, nous poursuivons un projet de curation revue-de-presse dot org (projet citoyen) depuis quelques années maintenant (qui se concentre sur les media / organes de presse en France - leurs publications, ainsi que la popularité associées pour des périodes de 24h).

J’ai développé plusieurs implémentations d’un même moteur de collecte des publications en provenance de la liste suivante : twitter.com/i/lists/219269294 avec différentes technologies du web.

L’idée de départ de ce projet était de proposer une température synthétique journalière et navigable par date des nouvelles populaires rafraîchis régulièrement dans une journée (filtre appliquée aux publications en provenance des membres de la liste ci-avant limitée à 10 éléments avec compteur remis à zéro chaque jour et exclusion des publications passées afin de limiter la pondération de l’âge des publications).

Nous n’avons pas fait évoluer le projet depuis quelques temps mais serions ravis de collaborer avec vous à l’avenir sur de nouveaux axes de développement, notamment en ce qui concerne la construction d’une ontologie par exemple (la donnée mise en cache afin de procéder au tri journalier des publications de manière à ne pas trop solliciter l’API de twitter et d’ainsi risquer d’enfreindre ses règles d’utilisation bien que non exposée aujourd’hui pourrait être remise à contribution d’une manière ou d’une autre).

2 « J'aime »

Cette liste de médias français est très intéressante, et je regarderais pour proposer quelques ajouts si le but est de tendre vers de l’exhaustivité.

Concernant Twitter, l’entreprise a fermé mon compte sans raison (malgré près de 10 d’utilisation et 700 followers). Ayant largement basculé mon usage et ma communauté sur Mastodon je n’ai pas cherché à justifier du contraire du rien qui m’était reproché. Il m’aura fallu ce coup de pouce pour me libérer de Twitter (ça avait été plus facile pour Facebook).

Je te comprends tout à fait et suis sincèrement désolé que cela te soit arrivé… Je dois dire que j’aimerais migrer également. Je dispose d’un compte Masto également mais les organes de presse n’y publie pas des brèves associées à leurs articles :sob:

Tôt ou tard, on franchira le pas (ou peut-être que leur système de modération nous excluera également par extension de l’application de l’une de leurs règles d’utilisation …). En tout cas, nous souhaiterions clairement (et ce sera peut-être pour le début de l’année prochaine - ?), lier notre avancement actuel d’une manière ou d’une autre à votre démarche (structuration de la donnée, construction à partir d’une ontologie existante dans la compréhension que j’en ai eue) et ce d’une manière la plus indépendante possible de plateformes ou de socnet centralisateurs des données publiées par des medias / organes de presse.

1 « J'aime »