Agrégation de flux RSS Études d’Approfondissement Réseaux LAPAUZE Johann NIVEAU Soline 1 RICM5
Sommaire Standard RSS et Atom Domaines d’utilisation Technologies et protocoles Limites et perspectives Agrégateur RSS Principes Domaines d’utilisation Agrégateurs existants Perspectives Démonstrations Conclusion 2 RICM5
Lexique RSS = Rich Site Summary = RDF Site Summary = Really Simple Syndication Flux RSS = Fil RSS = Canal RSS Agrégateur RSS = Lecteur RSS RICM5 3
1 ère Partie – Les Flux RSS RICM5 4
Pourquoi RSS ? Objectifs : Avertir d’une mise à jour Avertir d’une nouveauté Avertir d’un nouvel article Outil déjà existant : La newsletter (SPAM) Avantages : Présentation minimale des informations Segmenter l’information en plusieurs thèmes RICM5 5
Exemples d’utilisation Flux sur l’actualité d’un site de e-Commerce : Un flux sur les nouveaux produits Un flux sur les promotions Un flux sur les évènements Blog (Contenu sous forme de billets) Nouveau billet disponible Modification de billet Podcast Widget RICM5 6
Des origines aux évolutions Version 0.90 par Netscape (2000) : Trop complexe Version 0.91 par Userland Software : Trop limité Version 1.0 par RSS-DEV Working Group : Pour applications spécifiques Version 2.0 par Creative Commons (2002) RICM5 7
Qu’est ce qu’un flux RSS ? RSS : Really Simple Syndication Fichier XML respectant un formalisme et contenant : Titre de l’information Lien vers une page web Brève description RICM5 8
Formalisme du fichier xml RICM5 9 … …
Formalisme du fichier xml Éléments obligatoires d’un : : Nom du flux Convention : Titre de la page web correspondante : URL de la page web : Brève description RICM5 10
Formalisme du fichier xml Éléments optionnels d’un : : Langage du flux : Date de publication : Date de dernière modification ,, … RICM5 11
Comment créer un flux RSS sur une page web ? Créer un fichier XML au format RSS Placer ce fichier dans l’architecture du site web Mettre la balise suivante pour que le browser détecte le flux RICM5 12
Limites du RSS 2.0 Manque de visibilité par rapport au format fourni (texte ou HTML) Incompatibilités Utilisation d’estampille définie par RFC 822 Problème d’interopérabilité : syntaxe XML non réutilisable RICM5 13
2 nde Partie – Flux Atom RICM5 14
ATOM : une évolution du RSS Plus simple Précise le type de contenu sans ambiguïté Types supportés variés (HTML, XHTML, XML, Base64 ) Références des documents variés (vidéo, audio..) Estampille selon le RFC 3339 (date et heure au format web) RICM5 15
ATOM : Lexique URI : Identifiant de ressource uniforme (adresse) IRI : Identifiant de ressource internationalisé (adresse) Ressource : Un objet ou service accessible via le réseau Représentation : une entité incluse dans une requête ou réponse Collection : une ressource qui contient un ensemble de ressources membres. Les collections sont représentés par des fils Atom. RICM5 16
ATOM : Lexique (suite) Espace de travail (Workspace) : Un groupe de Collections. Pas d’IRIs. Document de service (Document Service) : Un document qui décrit l’endroit et les capacités d’une ou plusieurs Collections, groupées en Workspace. Document de catégorie (Category Document) : un document qui décrit les catégories autorisées dans une Collection. RICM5 17
Les ressources selon AtomPub Membre (ou Ressource Membre) : une ressource dont l’IRI est listé dans une Collection. Deux types : Ressource d’entrée (Entry Resource) : membres d’une Collection qui sont représentés par des documents d’entrée Atom ( Atom Entry Documents) Ressource média (Media Resource) : membres d’une Collection qui ont des représentations autres des documents d’entrée Atom ( Atom Entry Documents) Entrée de lien de média (Media Link Entry) : Une ressource d’entrée qui contient des métadonnées sur une ressource média. RICM5 18
Les ressources selon AtomPub Ressource : Un objet ou service accessible via le réseau RICM5 19 Ressources membres Ressources d’entrée Entrée de lien de média Ressources de média
Les Collections pour gérer les ressources Une Collection -> Atom Feed Document Ex de Collection à 2 entrées : RICM5 20 d’entrée de membre (ressource d’entrée) de média (ressource média) de membre (entrée de lien média)
Document de service Les Service Documents Regroupe les Collections définies par le serveur en workspace Initialise la création et l’édition de ressources. Ex de Service Document RICM5 21 Espace de travail 1 Collection (IRI, catégories, types de média) Espace de travail 2 Collection (IRI, catégories, types de média)
ATOM : le protocole utilisé Protocole de publication Atom ( Atom Publishing Protocol ou AtomPub) HTTP / XML 1.0 publication et édition de ressources web gestion des ressources web à travers : Collections : ensemble de ressources Services : découverte/description de collections Edition : créer, éditer et supprimer des ressources Serveur libre (possibilité de modification de la requête) RICM5 22
AtomPub Identification des ressources Mapping adresses URIs/IRIs Conversion d’une adresse IRI d’un document vers une adresse URI avant d’être utilisé par HTTP AtomPub n’impose pas un URI (espace des URI contrôlé par le serveur) RICM5 23
AtomPub Utilisation de HTTP : GET : récupération d’un ressource* connue POST : création d’une nouvelle ressource dynamiquement. Création automatique des ressources entrée média/ entrée de lien média dans la Collection si une représentation d’entrée non-Atom est créée. PUT : édition d’une ressource connue. DELETE : suppression d’une ressource connue. Réponses du serveur : réponses HTTP * ressources d’entrée et de média RICM5 24
AtomPub - côté serveur Comportement défini pour : GET d’une collection) -> 200 OK POST d’une collection) -> 201 Created Comportement NON défini pour: PUT du membre) -> 200 OK DELETE du membre) -> 200 OK Possibilités : accepter, rejeter, décaler, modérer, censurer, reformater, translater, relocaliser, re-catégoriser le contenu soumis. * Entry/Media Resources RICM5 25
3 ième Partie – Agrégateurs RSS RICM5 26
Qu’est ce q’un agrégateur RSS Permet de lire des flux RSS Centralise l’actualité de plusieurs sites web sans avoir à les consuter Types d’agrégateur : Applicatif Online RICM5 27
Agrégateurs RSS ; S’abonner aux flux à travers : Une boîte mail comme Outlook Alertes sous forme de mail Une application pour gérer les flux HandyRSS pour Nokia Une page d’accueil de browser comme Netvibes Alertes sous forme de widget RICM5 28
Agrégateurs RSS ; Récupérer les flux Utilisation du protocole HTTP AJOUTER CAPTURE WIRESHARK RICM5 29
4 ième Partie – Syndication de contenu RICM5 30
Syndication de contenu Afficher les nouvelles d’un site quelconque sur un autre Ecriture d’un script en perl, php ou Java Au chargement de la page, exécution du script Récupération et affichage des informations Annuaire pour lister les flux RSS de divers sites Syndic8 ( Feedster ( RICM5 31
5 ième Partie – Perspectives RICM5 32
Podcast Flux RSS Plus seulement texte mais aussi contenu riche (vidéo, audio, présentations, animations) Téléchargement automatique des émissions audio ou vidéo sur ordinateurs/baladeurs iTunes, Juice, Netvibes, FeedMon (Windows) RICM5 33
Widget pour iGoogle ou Netvibes RICM5 34
Blog RICM5 35
Conclusion RICM5 36
Perspectives Outils de création de flux RSS pour une page web sans : Ponyfinish ( Feed43 ( Outil de création de flux RSS même sans site web : Feedxs ( LinkRSS ( Mixer plusieurs flux RSS : Extralabs ( RICM5 37
Bibliographie Techniques : Créer un agrégateur en php: Widget iGoogle: RICM5 38
6 ième Partie – Démonstration RICM5 39