Til forsiden Til artikler og foredrag forside

Denne artikkelen ble skrevet for tidsskriftet e-Biz i en utgave som ble publisert juni 2000. I denne nettutgaven er det gjort noen korreksjoner.

X marks the spot

I 1999 ble XML (extensible markup language) omtalt som en av de mest spennende tingene som skjedde på WWW. XML la grunnlaget for 2. generasjon WWW, den semantiske web. Samtidig var det meget stor fokus på standardisering for å tilrettelegge forholdene for e-handel. Et naturlig valg for standardisering innen e-handel er å basere seg på XML, men det var ikke alltid like lett å se om dette faktisk var tilfelle hver gang et nytt initiativ innen e-handel presenterte seg.

Denne artikkelen skal forsøke å gi noen svar på tilstanden innen disse to områdene.

XML

Enkelte har presentert XML med teksten HTML hvor de to første bokstavene er over­skrevet med en enkelt X. Dette for å hevde at XML var et framskritt som kom til å erstatte HTML. Dette er både riktig og galt. XML i seg selv kommer ikke til å erstatte HTML for å presentere web-sider for brukere. I den sammen­heng er XML like mye et skritt tilbak som det er et framskritt. XML er ikke noen erstatning for HTML, det er et sk. metaspråk som kan brukes til å gi informasjon struktur. Dette gjøres ved å merke opp teksten med ”tagger” som ligner på dem som brukes i HTML. Det er imidlertid en stor forskjell på taggene som brukes i HTML og XML. Taggene i HTML betyr noe, f.eks betyr <p> at nå starter et nytt avsnitt. Skriver man bruker man en den samme taggen <p> i XML betyr den i utgangs­punktet ingenting annet en at det vil komme en avsluttende tagg </p> senere i teksten.

Det viktigste er å få med seg at XML vil brukes til mye mer enn WWW. Det er ingen overdrivelse å si at XML har store muligheter til å bli blodet som strømmer gjennom informasjons­samfunnets årer. Det er også viktig å få med seg at en del viktige standarder rundt XML fremdeles er under utvikling. Ivrige brukere kan derfor ikke få svar på alle spørsmål i dag, men det er ingen grunn til å utsette arbeidet med å ta XML i bruk for egen virksomhet.

Selvforklarende tagger?

Noen påstår at XML kan gjøre informasjonen selvforklarende. Dessverre er dette litt optimistisk. Selv om det er mulig å gi tagger et beskrivende navn og man velger engelsk som det universelle språk for dette oppstår det lett tvetydigheter. Ta et f.eks. en hotellfaktura. Det kan virke fornuftig å kode datoen for innsjekking på hotellet på følgende måte:

<CheckInDate format=”yyyy-mm-dd”>

2000-05-19

</CheckInDate>

Disse tre linjene er et element i XML som har et beskrivende navn, og om det skulle være noen tvil om hvordan datoen er skrevet har jeg tatt med en parameter som forteller det. Dessverre oppstår det en tvetydighet dersom det samme elementet står i en faktura for bilutleie. Her har vanligvis begrepene innsjekking og utsjekking motsatt betydning av hotell-eksempelet, ”CheckInDate” vil oppfattes som datoen leiebilen leveres tilbake. Navn på XML-elementer bør derfor velges med forsiktighet.

Selv om et XML-dokument fint kan stå på egne ben er det fornuftig å definere syntaks og semantikk eksplisitt for grupper av dokumenter. En DTD (document type definition) er en formell beskrivelse som kan skrives i XML og definerer hvilke elementer som kan forekomme i et dokument og hvordan elementene forholder seg til hverandre. En videre utvikling som det arbeides med er XML Schema som skal gi muligheten til å beskrive elementene enda bedre.

Standardisering

XML er et meget bra verktøy, men det har liten nytte hvis alle bruker sine egne elementnavn og definerer sine egne strukturer. Innenfor e-handel er det startet en rekke initiativ som utvikler nødvendige dokument­definisjoner i fellesskap. Tanken er god, men dessverre har antall initiativ blitt et problem. På den 9. internasjonale WWW-konferansen i Amsterdam, mai 2000, ble det opplyst at det var rundt 850 grupper som utviklet dokument­definisjoner for e-handel. Til tross for at forskjellige bransjer og nisjer har sine spesielle behov er det helt klart at antallet bør reduseres.

Det er vanskelig å velge ut hvilket initiativ man bør følge eller støtte aktivt. Et mulig utgangspunkt er ebXML som er etablert av Oasis (the Organization for the Advancement of Structured Information Standards) og UN/CEFACT (United Nations Centre for Trade Facilitation and Electronic Business). Oasis er også vert for portalen XML.org som bl.a. vil bygge opp en katalog av XML-standarder for e-handel.

En annen organisasjon det er fornuftig å følge med på er CommerceNet som har definert rammeverket eCo for interoperabilitet i e-handel.

Proprietære løsninger

Mange av de større leverandørene har XML-baserte produkter. Et eksempel på en proprietær løsning som baserer seg på XML er BizTalk fra Microsoft. Det er meget sannsynlig at BizTalk kan få en dominerende posisjon i bransjen, selv om Microsoft ikke er alene om å utvikle slike løsninger.

XML og WWW

At informasjonstjenester blir XML-baserte betyr ikke nødvendigvis at informasjonen publiseres på WWW som XML. Web-tjeneren vil effektivt kunne oversette det eller de interne XML-formatene innholds­leverandøren bruker til HTML. I verktøykassen til XML vil det etter hvert finnes XSL (extensible stylesheet language) som kan brukes til å spesifisere hvordan et XML-dokument skal presenteres. Dette kan brukes til å oversette XML fra en dokumenttype til en annen, for eksmpel fra en virksomhets interne dokumenttype til en felles dokumenttype for informasjonsutveksling mellom virksomheter, eller fra XML til en helt annen representasjon – om det er HTML eller Microsofts Word-format.

Figur 1 - Fra XML til HTML

I figur 1 vises veien fra et XML-format til et HTML-dokument. Her brukes XSL til å beskrive hvordan XML-dokumentet skal oversettes tl HTML. Hvordan HTML-dokumentet faktisk skal se ut i en nettleser (formatering, skriftsnitt og –størrelse) er definert i CSS (cascading style sheets).

XHTML

Selv om HTML vil vise seg å være utrolig seiglivet vil det lønne seg å bruke XML-versjonen, XHTML. Versjon 1.0 av denne dokumenttypen er HTML 4.01 oversatt til XML. De fleste nettlesere har ingen problem med å tolke XHTML. Det er relativt problemfritt å automatisk oversette eksisterende dokumenter som er skrevet i korrekt HTML 4.01 til XHTML. Problemet er at mye av det som er publisert på WWW ikke er skrevet i standard HTML. Her må nok mange betale dyrt for at man har prioritert fancy utseende og rask utvikling av nettsteder hvis de ønsker å oversette sine eksisterende websider til XML.

Samtidig publisering i flere formater

Et problem for informasjonsleverandører er den økende variasjonen i terminalutstyr. Informasjon som publiseres bør kunne leses på en vanlig PC, en håndholdt datamaskin og mobiltelefoner. XML kan forenkle problemet med å publisere i flere formater samtidig. Figur 2 skisserer hvordan en informasjons­leverandør kan bruke en XSL-definisjon for å produsere XHTML for publisering på web og en annen XSL-definisjon for å produsere WML for publisering på WAP.

Figur 2 - publisering i flere format

Oppdatert 2001-09-07, © Digme
Meld gjerne fra om feil eller mangler.