usenet.dk

OSS for d.e.i.webdesign

Historisk gennemgang af WWW

Forfatter: Jakob Bruhns (bruhns@diku.dk).


Indledning

Dette er et dokument om HyperText Markup Language også kaldet HTML og hvordan denne standard hænger sammen med World Wide Web. Først vil baggrunden for HTML og dets rod i hypermedie ideen blive gennemgået og dernæst vil der komme en generel introduktion. Jeg understreger generel fordi der er mange udmærkede specifikke vejledninger allerede. Ideen med denne er at give en ide om HTMLs opbygning således at læseren senere vil kunne forstå det meste HTML og selv udbygge sin viden på området. Jeg forventer at læseren har en vis ide om Internettet og World Wide Web (WWW). Hvis man allerede ved hvad HTML er og bruger det, vil det følgende sikkert heller ikke være interessant med mindre man er interesseret i den historiske baggrund.

Baggrund

Hypertekst og Hypermedie

Historien om ideerne bag WWW og HTML starter faktisk i midten af 1940'erne. Omkring dette tidspunkt får Vannevar Bush nemlig en ide. Først og fremmest vil han gøre op med den teknologiforskrækkelse, som opstod i forbindelse med Anden Verdenskrig. Bush mener, at viden grundliggende ikke er dårligt i sig selv og at menneskeheden må komme videre og bruge vores akkumulerede viden og erfaringer til at skabe yderligere fremskridt. Men dernæst smider han et redskab til udnyttelse af viden på bordet. Dette er ideen om hyperspring og kæder af hyperspring - det vil sige et system, hvori man kan foretage associative spring til alle andre data i systemet og på den måde danne og gemme nye samlinger af data.

Denne banebrydende ide publiceres i 1945 i bladet The Atlantic Monthly. Bush kalder sin artikel As We May Think, og sit hyperspringssystem for Memex. og tag ikke fejl af tidspunktet - Memex er faktisk på nogle punkter mere avanceret end det vi har i dag. Senere er dette blevet til hypertekst og hypermedie. Termerne blev defineret af Ted Nelson i 1965. De dækker over ikke lineære systemer - blandinger af tekst og andre medier, hvori man kan følge associative referencer til andre dele. Det lyder meget avanceret, men når man først har prøvet det er det jo ikke så svært. Du har jo brugt det for at komme herhen sandsynligvis.

Den største udvikling af browserne er hidtil sket indenfor selve præsentationen, hvilket må siges at være en skam, idet der er mange uudnyttede muligheder for bedre måder at sammenkoble information.

Logisk kontra fysisk markering

En anden del af baggrunden for WWW er Kort sagt, at man definerer et dokuments udseene efter de betydningen af de elementer det indeholder og ikke efter absolutte regler. Mao. en fokusering på logisk fremfor fysisk repræsentation. Dette illustreres bedst med et eksempel. I et WYSIWYG (What You See Is What You Get) editeringsprogram som WordPerfect, MS Word eller lignende vælger man typisk en overskrift til at være en bestemt font og en bestemt størrelse, samt andre karakteristika f.eks. om den skal være kursiv. I et YAFIYGI (You Asked For It - You Got It) editeringsprogram som LaTeX eller HTML definerer man et tekststykkes betydning i stedet for. F.eks. kan man vælge at det efterfølgende stykke tekst skal være en kapiteloverskrift, en titel, brødtekst eller tilsvarende. Nedenfor følger et lille eksempel til illustrering af ovenstående:

Et eksempel på fysisk formatering.

Kapitel 1

18 pt. Helvetica

1.1 Forord

15 pt. Helvetica
Denne rapport handler om... 12 pt. Arial

1.2 Baggrund

15 pt. Helvetica

Som vi ser er ovenstående dokument fysisk i sin definition. Fontene er bare tilfældige, men de illustrerer det konkrete i et system, hvor man bruger fysiske markeringer. Her er overskriften en 18. pt. helvetica font og sådan er det bare. Et logisk markeringssystem vil lave logiske beskrivelser af dokumentets strukturer. Se bare på følgende:

Et eksempel på logisk formatering.

Kapitel 1

Overskrift

1.1 Forord

Underrubrik
Denne rapport handler om... Brødtekst

1.2 Baggrund

Underrubrik

Grunden til at det er smart med logiske, abstrakte markeringer er, at det meget let kan ændres og konverteres til andre formater. Forestil dig at man havde en 100 siders rapport, formatteret som det første eksempel. Hvorefter en eller anden finder på, at det altså ikke skal være 18 pt. Helvetica, men derimod 17 pt. kursiv Times Roman. Så må man jo igang med at ændre alle overskrifterne. Havde man brugt en standard, hvor man markerede efter logisk betydning havde man kun behøvet at ændre et sted. Nemlig der hvor korrespondancen mellem det logiske og det fysiske etableres. Før havde der måske stået {Kapiteloverskrift=18 pt. Helvetica} og dette skulle så bare ændres til {Kapiteloverskrift=17 pt. kursiv Times Roman}. Dette giver forfatteren til et givent dokument den frihed, at han/hun kan koncentrere sig om indholdet (som man forhåbenligt ved noget om) og lade professionelle grafikere, typografer og dtp'ere koncentrere sig om det fysiske udseene af teksten (som jo er deres speciale).

Det er vigtigt at forstå, at denne tanke om at separere indhold og udseene er underligt for mange. Jeg tror personligt at det er fordi de top ting altid har været knyttet til hinanden. Man sætter stadigt en bog med en konkret typografi, etc. Derfor er det svært at vende sig til at man ikke har nogen som helst fysisk kontrol med udseenet af ens dokument. Men hvis ideen med WWW skal holde skal man bruge logiske markeringer i stedet for fysiske.

World Wide Web

Ideen

I slutningen af 80'erne fik Tim Berners-Lee en ide til et hypermedie system. Han arbejdede dengang for det europæiske kerneforskningsinstitut, CERN. Hans ide var først at de mennesker, der arbjdede på CERN skulle have et system der ville gøre det let for dem at dele det information de havde. (Det er i dag kaldes et Intranet.) Ideen udviklede sig dog til at fysikere over hele verden skulle kunne dele deres opdagelser og informationer over det netværk, som allerede eksisterede. Man kendte allerede på det tidspunkt epost, telnet, ftp m.v., men Berners-Lee havde tanker om et komplet hypermedie. Der skulle både være billeder, lyd og det hele, hvis det var nødvendigt. Det ville give store fordele for fysikerne umiddelbart at kunne dele nye opdagelser, f.eks. modeller af forskningsresultater, som ikke kunne illustreres ved brug af epost alene. Han havde mao. ideen om det totale hypermedie, hvor man frit kunne blande tekst, lyd, billeder, video etc. Dette udviklede sig til ideen om World Wide Web. Ideelt set hele verdens akkumulerede viden, samlet og tilgængeligt for alle mennesker. På den måde er WWW jo i meget god tråd med Vannevar Bushs originale ide.

HTML

Først definerede Berners-Lee bare en slags HTML selv, men senere blev der behov for en yderligere standardlisering af mediet. Derfor blev det besluttet at HTML skulle defineres som en klasse under SGML standarden. SGML står for Standard Generalized Markup Language og er en slags opskrift for definering af markeringssprog. Udfra SGML definerer man nye markeringssprog. En sådan definition kaldes en DTD (Document Type Definition).

Altså blev der lavet en ny SGML DTD. Det kaldte han HTML for da var det primært hypertekstspringene man fokuserede på. Således blev HTML sproget der skulle bruges på WWW. Som mange andre instanser af SGML består dette sprog af forskellige markeringselementer (eng.: [markup]tags), som bliver brugt til at lave de logiske markeringer. I starten var det et relativt lille udvalg man kunne bruge, men efterhånden er der et ret stort udbud af elementer. Organisationen World Wide Web Consortium står for at lave standarder på HTML området i samarbejde med The Internet Engineering Taskforce, som er en sammenslutning af de firmaer med kommerciel interesse i WWW.

Browseren

Men et er at have en ide, noget andet er om man kan få det til at lykkes i virkeligheden. Her fik Berners-Lee hjælp af NCSA. NCSA står for National Center for Supercomputing Applications og er en afdeling på Illinois' Statsuniversitet. Marc Andreesen, som senere blev medstifter af Netscape Communications Corp., var en af medarbejderne.

I januar 1992 kom dem første tekstbaserede browser, men allerede i februar 1993 kom den første prøveudgave af den grafiske browser Mosaic fra NCSA. Den blev udgivet til PC-platformen i november 1993. For første gang havde man et program som kunne gøre det Berners-Lee havde tænkt sig. Og så gik det hurtigt med WWW.

The rest - as they say - is history...

Copyright © 1997. Jakob Bruhns, bruhns@diku.dk.