World Wide Web

Dumitru Rădoiu

Totul a început undeva lîngă Geneva, la CERN, Laboratorul European pentru fizica particulelor. Fondat de Comunitatea Europeană, CERN este locul în care se întîlnesc fizicienii din întreaga lume, pentru rezolvarea unor probleme complexe de fizică.

În 1989, fizicianul Tim Berners-Lee a propus cercetătorilor care se ocupau de fizica energiilor înalte un concept numit Web (tesătură). Acesta era în esentă un nou sistem pentru transferul ideilor si rezultatelor cercetării pentru acest mic grup de cercetători împrăstiati în lumea întreagă, pentru care comunicarea efectivă devenise o problemă critică. Propunerea definea un sistem de comunicare simplu bazat pe hypertext: o modalitate care utilizează legături pentru a face referiri la alte documente. Ideea era de a permite o desfăsurare neliniară a documentului text (initial sistemul nu-si propunea să transmită imagini, sunete sau video). Transmiterea documentelor urma să se facă prin retele de computere.

Metafora tesăturii

Spre sfîrsitul anului 1990, Steven Jobs (de la NeXT) a furnizat primul soft pentru un Web server. Softul permitea editarea, vizualizarea si trasmiterea documentelor hypertext via Internet. Functionalitatea sistemului a fost demonstrată Comitetului CERN si participantilor la conferinta Hypertext'91. S-a întîmplat apoi că în cursul anului 1992, proiectul World Wide Web (deseori referit ca WWW sau W3 sau Web), să se bucure de o publicitate bine făcută de CERN. Rezultatul a fost că tot mai multi s-au convins că-i o idee bună si au început să-si creeze propriile lor servere Web si să facă informatia disponibilă utilizatorilor Internet. Numele de Web vine de la faptul că documentele aflîndu-se pe diferite sisteme se referă unele la altele printr-o "tesătură" de legături.

Un grup mai mic de oameni a început de asemenea să lucreze la un program care să faciliteze accesul în această lume minunată, Web-ul. Spre sfîrsitul anului 1993, softul client pentru acces (numit browser sau navigator) exista deja în mai multe variante, dezvoltate pentru diferite sisteme: X Window, Apple Macintosh si PC/Windows.

Prin vara anului 1994 Web-ul a devenit unul dintre cele mai populare căi de accesare a resurselor Internet, cuprinzînd atît utilizatori comerciali cît si individuali, beneficiind de unelte de organizare care să-i permită aproape orice. Explozia utilizării comerciale l-a impus, tabloul aplicatiilor cuprinzînd în ultima vreme cele mai exotice lucruri cum ar fi: magazine virtuale, bănci virtuale sau video multicasting. Web-ul este si astăzi segmentul Internet cu cea mai rapidă dezvoltare: în timp ce Internetul se dublează la fiecare 10 luni, Web-ul se triplează în fiecare an. Dacă în 1993 existau mai putin de 100 de servere Web, anul acesta se pare că au depăsit cifra de 12000.

Continua crestere a Web-ului plus multiplicarea si diversificarea publicatiilor electronice hypermedia constituie deopotrivă o atractie si o provocare pentru utilizatori.

Hypertext si Hypermedia

Pentru a introduce conceptele de hypertext si hypermedia, concepte de bază în paradigma Web, un autor făcea analogie cu starea de vis cînd, fără efort, sărim de la un subiect la altul, dintr-un loc în altul, repede, neliniar, fără a urmări un anumit sablon. Procesul este foarte asemănător cu navigarea prin Web. Hypertextul se referă la documentele digitale care permit cititorului să se miste dintr-un loc în altul prin document sau să urmărească legăturile cu alte documente, fără să fie obligat să parcurgă informatia de o manieră traditională (cum ar fi citirea unei cărti de la un capăt la altul trecînd prin fiecare pagină si capitol). Avantajele sînt evidente: usurinta de a naviga prin documente foarte mari, ajutarea cititorului să localizeze noi surse de informare legate de acel subiect si o dimensiune suplimentară în explorarea unui anumit subiect.

Hypermedia reprezintă extinderea naturală a hypertextului implicînd legături spre grafică, fotografie, audio si video. Hypermedia, metaforic vorbind, dă viată documentelor si în acelasi timp computerului prin intermediul căruia navigati, dovedindu-se maniera cea mai potrivită de a organiza diversele resurse de pe Internet.

Web server - Web client

Functionarea unui Web se bazează pe patru componente:

În ce priveste computerele care rulează softul de server (Web server) esential este ca fiecare sistem să stie sau să poată afla unde se găsesc celelalte si să poată comunica cu ele.

Softul de server a fost portat pe un mare număr de platforme începînd cu UNIX si terminînd cu Macintosh.

Pe aceste computere (Web servere) sînt depuse colectiile de documente hypermedia interconectate prin legături. Pentru ca un document să fie "pe Web" trebuie mai întîi formatat cu ajutorul unui limbaj special, HTML (HyperText Markup Language) si să fie rezident în directorul accesibil serverului.

De o manieră simplificată, lucrurile se întîmplă cam asa: navigatorul (clientul Web) e-merge (expresia am văzut-o prima dată pe Net si este un joc similar celui din expresia e-mail) de-a lungul retelei pînă la Web serverul dorit si-i cere un anumit document. Serverul răspunde furnizînd documentul si navigatorul îl afisează pe ecranul dumneavoastră.

Cererile de forma "trimite-mi acest document" trimise de un client Web la serverul Web, pot primi si alte răspunsuri decît "iată-l". De pildă: "nu-l găsesc" sau "nu pot acum". Regulile de negociere în Web sînt constituite într-un protocol numit HTTP (HyperText Transfer Protocol).

Primul lucru pe care îl veti vedea pe ecran cînd vă conectati la un Web server este un document numit Home Page, un fisier hypertext HTML în textul căruia sînt incorporate o serie de instructiuni (sau coduri) care pot fi interpretate de navigatorul dumneavoastră. Unele coduri determină cum anume va apărea documentul pe ecran, altele numite legături hypertext "spun" navigatorului că din acel punct (numit ancoră) se poate sări la un alt document. Acesta poate fi localizat pe acelasi server sau pe un altul aflat oriunde pe Internet. Utilizatorul nu trebuie să cunoască codurile HTML si nici nu trebuie să fie preocupat de unde anume este localizat documentul la care face referire legătura (el va vedea doar o parte a ancorei - ancora pointer). Navigatorul interpretează adresa (reprezentată de cealaltă parte a ancorei, numită ancoră tintă) si simplifică aducerea documentului la un clic de mouse.

Procesoare de documente HTML

Metafora unei aplicatii HTML obisnuite este o pagină cu text si imagini. Pentru ca dumneavoastră să puteti vedea documentul pe monitor într-o anumită formă (cît mai asemănătoare cu intentia autorului) acesta trebuie prelucrat (formatat). Pentru aceasta există unelte speciale numite procesoare de documente HTML (sau Hypertext Authoring). O astfel de unealtă pregăteste un document pentru monitor de o manieră asemănătoare celei în care procesorul de texte pregăteste un document pentru hîrtie. Formatarea înseamnă prelucrarea unui ansamblu text, sunet, video si grafică, cu un set de etichete (tag-uri HTML) recunoscute de browser si prin intermediul cărora "se spune" browserului cum anume trebuie să afiseze pe ecran un anumit, titlu, cuvînt, paragraf. Procesorul HTML permite de asemenea să crearea oricărui număr de legături cu alte documente aflate pe alte servere Web.

tinînd seama de felul în care ne-am obisnuit să lucrăm, se pare că cel mai bun procesor HTML este acela care permite lucrul pornind de la formate furnizate de procesoarele de text. Unui bun procesor HTML i-am mai putea cere automatizarea creării legăturilor (referintelor la alte documente) si vizualizarea documentului în forma în care îl va vedea clientul.

Deoarece la modul minimal un procesor HTML automatizează atribuirea tag-urilor, unele procesoare HTML nu sînt altceva decît o colectie de macro-uri. Altele, ceva mai sofisticate, sînt translatoare de fisiere produse cu procesorul de texte. În sfîrsit, cele mai ambitioase încearcă să fie ceva de genul WYSIWYG. Unele dintre ele (cum ar fi HotMetal Pro si Spider) pot fi utilizate atît la crearea cît si la formatarea documentelor HTML.

Cele mai multe pachetele Hypertext Authoring (inclusiv HTML Assistant Pro si HotMetal Pro) sînt disponibile si în versiuni freeware. Pentru a vedea o listă a lor puteti e-merge la: http://www.ncsa.uiuc.edu/SDG/Software/Mosaic/Docs/faq-software.html sau http://info.cern.ch/hyprtext/WWW/Tools/Overview.html

În sfîrsit, într-un anunt care sună parcă prea bine pentru a fi adevărat, Caligari Corp. afirmă că a introdus Fountain, o unealtă free bazată pe VRML (Virtual Reality Modeling Language) care permite simultan procesarea HTML si navigarea aplicatiilor HTML 3-D (vezi http://www.caligari.com/)

De ce HTML?

HTML este un set de comenzi care, incorporate în fisierul text, permit browserelor să afiseze textul îmbogătit cu grafică, audio sau video si legături hypertext cu alte documente.

Dacă formatarea avea mai putină importantă în cazul "simplei" distributii de informatie, ea a devenit esentială în cazul distributiei pe Web. Dar de ce a fost preferat HTML cînd pentru realizarea publicatiilor electronice există mai multe tehnologii? (De pildă documente portabile sau SGML - Standard Generalized Markup Language). Unul dintre motive ar fi legat de faptul că desi scopul este acelasi (crearea de publicatii care pot fi văzute, navigate, adnotate si distribuite) ele diferă între ele deoarece sînt destinate unor medii diferite (CD-ROM sau retea locală). Cea mai puternică tehnologie este totusi SGML, constituit dintr-un set de reguli foarte complexe bazate pe orientarea obiect în manipularea textului si graficii, audio si video, dispunînd de abilitatea de a manipula documente de pînă la 1000 de pagini (pentru notiunile fundamentale ale SGML, vezi articolul lui Ionut Muslea din BYTE Romania oct. 95, pag. 115). Motivul alegerii HTML (de fapt subset al SGML) pentru publicatii pe Internet este că permite formatarea textului ASCII cu etichete în format ASCII. Rezultă o compresie bună, suport pentru legături hypertext si usurintă în a scrie browsere pentru vizualizarea documentelor. Deci răspunsul. la întrebarea "De ce HTML?" este: "Pentru simplitate."

Localizarea documentelor

Realizarea unei legături înseamnă marcarea unei portiuni de text sau de imagine (ancoră pointer) care poate fi activată si care instruieste browserul (prin ancora tintă) cu privire la adresa documentului la care se face referire, numele lui si cu ce protocol poate fi adus. În ce priveste ancora tintă lucrurile nu sînt complicate deoarece Web-ul asignează o adresă unică (URL-Uniform Resource Locator) pentru fiecare resursă pe care o recunoaste pe Internet. Un ghid URL se găseste la: http://turnpike.net/metro/bagingry/URLs.html

Legăturile pot conduce practic la orice tip de fisier, utilizînd diverse protocoale (FTP, gopher, telnet, etc) iar forma exactă a URL depinde de ce anume se utilizează pentru a ajunge acolo. Pentru un server Web adresa începe cu numele serverului pe care doriti să-l accesati: http://www.whitehouse.gov/ urmată de calea paginii HTML.

pentru celelate protocoale utilizate:

ftp://ftp.uu.net/doc/literary/obi/World.Factbook

gopher://gopher.micro.umn.edu

telnet://compuserve.com

news:alt.cows.moo

Fisierul adus poate fi hypertext, imagine, sunet sau video. Pentru a le "vedea" browserul face apel fie la viewerele interne fie la cele ale sistemului pe care rulează.

Vînt la pupa

Browserele (navigatoarele), aceste instrumentele grafice pentru aducerea, vizualizarea si manipularea publicatiilor electronice, au fost portate pe aproape toate sistemele de operare si au evoluat mult într-un timp foarte scurt. În general oferă cam aceleasi posibilităti pentru Windows, Macintosh si sistemele X Window. O listă actualizată a browserelor se găseste la: http://info.cern.ch/hypertext/WWW/Clients.html.

Primul browser grafic a fost Mosaic dezvoltat pe banii guvernului american la National Center for Supercomputing Activities (NCSA) la University of Illinois în Urbana si oferit gratis comunitătii Internet (ftp://ftp.ncsa.uiuc.edu/Web/Mosaic). Înaintea browserelor grafice însă au fost browserele care lucrează în modul text (line mode browsers) dintre care cel mai popular este Lynx (atît pentru UNIX cît si pentru DOS), creat la University of Kansas. Acesta face apel la setul de caracteristici al unor monitoare obisnuite (DEC VT-100), emulat de cele mai multe softuri de telecomunicatii. Cum paginile Web utilizează text ASCII, Lynx-ul izolează acest text si îl afisează. Poate nu este lipsit de interes aă mentionez că unele variante pot lucra împreună cu un sintetizator de sunet si cu sistem de afisare Braille (pentru utilizatorii cu deficiente)

Mai multe companii au cumpărat licenta Mosaic de la NCSA si au dezvoltat propriul lor browser, aducîndu-i îmbunătătiri. Noile trăsături au venit în avalansă: ferestre multiple, securitatea transmiterii datelor, interfată pentru grupurile de discutii, e-mail incorporat sau căutători (searchers).

Cel mai complet browser la această oră pare a fi Netscape. Cineva (ejk@ uiuc.edu) a numărat 511 versiuni diferite de Netscape. Am întrebat cîtiva utilizatori care folosesc în mod frecvent browsere WWW cam cum îsi imaginează browserul ideal. Unul dintre ei mi-a răspuns scurt: "Cam ca Netscape".

Îmbunătătiri în mod sigur se mai pot aduce, problema este să "ghicesti" în ce directie vor fi făcute: economia de resurse, navigarea în VR, multiple seturi de caractere pentru a naviga documente în mai multe limbi, integrarea unor protocoale suplimentare de securitate pentru a putea fi folosite în operatii bancare, folosirea lui pentru interogarea unei baze de date sau dezvoltarea lui pînă la a deveni o unealtă universală care poate fi folosită la orice pe Internet.

Lumea browserelor se schimbă foarte rapid. Aproape în fiecare zi sînt anuntate versiuni îmbunătătite sau produse complet noi. Caracteristicile lor au parcă menirea să atragă si mai multi utilizatori. Cîteva din cele mai "calde" ar fi Slipknot 1.10, VRweb 1.0 beta, PowWow 1.6 beta si Video On Line 1.0.

Ultima versiune a lui Slipknot ( http://www.interport.net/slipknot/slipknot.html ), browser creat special pentru utilizatorii Windows care au cont la un shell Unix (nu necesită SLIP sau PPP), este compatibilă OS/2. În plus fată de aducerea documentelor multiple în fundal si stocarea lor completă pe discul local al utilizatorului, aduce un spor de viteză si suport pentru formulare (forms).

VRweb 1.0 beta ( ftp://iicm.tu-graz.ac.at/pub/Hyper-G/VRweb ) este un browser VRML pentru scene 3D. Proiectul a fost initiat printre altii de NCSA si echipa Gopher de la University of Minnesota si anticipează (deocamdată pe post de platformă de experimentare si cercetare) vitorii navigatori comericali.

PowWow este un program Windows care în versiunea 1.6 beta permite unui număr de sapte utilizatori să stea la taclale, să schimbe fisiere si să navigheze împreună prin Web ca un grup ( http://www.tribal.com/powwow.html )

Si în sfîrsit, Video On Line 1.0, un browser care suportă 15 limbi, primul care "suportă" limba arabă ( http://www.vol.it/VOLB/browser.html ).

Web-ul, încotro?

Web-ul s-a dovedit a fi mai mult decît un sistem de distributie si căutare a informatiei impunîndu-se ca un nou mod de structurare a cunostintelor. Navigatoarele grafice au determinat cresterea exponentială a celor care oferă publicatii si servicii hypermedia.

Si ce altceva ar putea fi mai încurajator, vis-a-vis de această tehnologie decît că oferă o cale pentru cresterea gradului de democratizare a acestei lumi.

Glosar


(C) Copyright Computer Press Agora