- Fiches techniques
- Les brèves
- Les études
Fiche technique
|
|
| XML | |
|
|||||||
| Présentation | |||||||
| Le langage XML a été développé par le XML Working Group (connu au départ comme le SGML Editorial Review Board) formé sous les auspices du W3C (World Wide Web Consortium) en 1998 pour pallier les faiblesses du HTML et simplifier le SGML. Ce groupe de travail était présidé par Jon Bosak (Sun Microsystems) avec la participation active du XML Special Interest Group (anciennement SGML Working Group). Objectifs du XML XML est né du besoin de disposer de : Présentation du langage XML XML (eXtensible Markup Language) est né du besoin de disposer d’un format d’échange universel, utilisable par les programmes informatiques, pour les documents électroniques transportés par le Web. C'est un métalangage de balises, structuré et facile à apprendre, permettant donc la construction, selon des règles et des standards précis, de multiples langages dérivés : WML, XHTML, ebXML... C'est un langage de marquage ("markup language" - Ensemble de déclarations mettant en forme l’information) qui présente de l'information encadrée par des balises tout comme le HTML. C'est une norme d'échange de documents issue directement du SGML (Standard Generalized Markup Language – Norme ISO 8879), mais il reste d’un aspect plus simple, tout en conservant les mêmes performances. XML est donc une forme simplifiée de SGML : moins complexe pour l’affichage WEB, moins lourd en écriture ... Le XML se situe à mi-chemin entre le SGML - langage de référence en milieu professionnel pour ce qui est de la GED (Gestion Electronique des Documents) - et le HTML que l'on rencontre tous les jours sur l'internet. XML n'est pas un langage figé comme peut l'être le HTML mais au contraire un langage "ouvert" : l'auteur d'un document XML peut alors créer ses propres balises. Le HTML présente un jeu limité de balises orientées présentation (titre, paragraphe, image, lien hypertexte,...), à la différence du XML qui est un métalangage permettant d'inventer à volonté de nouvelles balises afin isoler toutes les informations élémentaires (titre d'ouvrage, prix d'article, numéro de sécurité sociale, référence de pièce…). Le document XML résultant de la transformation doit ensuite être pris en charge par un outil de formatage, qui créera une version papier, PDF, DVI, RTF, HTML, Wap, ou tout autre format. La spécification différencie donc deux processus : la transformation d'arbre (tree transformation) et le formatage (formating). L'idée est de produire des documents vraiment structurés, grâce à un langage qu'on peut définir en fonction des circonstances, mais selon une syntaxe très stricte. XML, un métalangage à balises et non un langage à balises Une balise est un mot clef entre "<" et ">" (par exemple < "nom_de_la_balise" >). Les balises sont associées 2 à 2 : à une balise "ouvrante" (< "nom_de_la_balise" >) correspond une balise "fermante" qui a le même nom mais précédée du caractère "/" (< / "nom_de_la_balise" >). Les couples de balises servent à délimiter des zones de textes et à associer à ces zones certaines propriétes. Par exemple : < "balise1" > XXXXXXXXXXXblabla1 < "balise2" > contenu balise2 < / "balise2" > XXXXXXXXXXXblabla2 < / "balise1" > Le HTML est un langage de balise, c'est-à-dire que la norme HTML définit les balises que l'on peux utiliser ("html", "b", "a"), leur signification (le texte à l'intérieur de balises < b > sera affiché en gras), leurs attributs (la balise < a > a un attribut href) et leur structuration (ordonancement des différentes balises). Le XML n'est pas un langage de balisage comme le HTML. C'est un métalangage de balisage, c'est-à-dire un langage permettant de créer des langages de balises. Par souci de simplification, et d'optimisation du traitement machine, le XML ne permet de décrire que des langages de balises qui répondent à certaines règles. Le XHTML est la nouvelle norme de publication web qui transforme le HTML en langage XML. (On y ferme donc toutes les balises). Le XML est le langage qui permet de décrire les règles d'ecriture d'un document XHTML. Règles de construction des baslises XML Structure d'un document XML Les composant du XML XSL est le langage de définition des feuilles de style (casse, couleur...) qui seront associées aux documents XML. Pour simplifier, un document XSL est tout simplement un document XML qui contient tout un ensemble de règles de mise en page. Le XSL s’inspire de 2 normes de feuilles de style : * Le CSS (Cascading Style Sheets - voir fiche Technique CSS) ou feuille de style en cascade qui permet de donner des instructions sur le changement de mise en page selon l’affichage du document XML sur l’écran, son impression... * LeDSSSL (Document Style Semantics and Specification Language). Il permet de formater les documents pour l'affichage, de transformer les documents, d’extraire des données en considérant le document comme une base de données. Visualisation d'un document XML La visualisation avec XSL d’un document XML final se fait auprès d'un interpréteur XML appelé parser XML. Les parsers sont utilisés pour : lire, créer, interpréter et manipuler les documents XML. Le parser s’appuie sur 2 méthodes d’analyse : |
|||||||
|
|||||||
| Lien | |||||||
