HTML

HTML nu este un limbaj de programare iar un document HTML nu este un program de computer. În timp ce un program de computer înseamnă o serie de proceduri si instructiuni care se aplică unor date, un document HTML reprezintă chiar datele. Limbajul HTML specifică gramatica si sintaxa tag-urilor (etichetelor) care, inserate în date (de pildă text), spun browserului cum anume să citească documentul HTML.

Din punct de vedere tehnic, HTML este un subset al SGML iar un document HTML este o instantă a unui document SGML. SGML s-a născut sub numele GML (General Markup Language) la IBM, spre sfîrsitul anilor 60, într-o tentativă de a rezolva problemele ivite la transportul documentelor între diferite computere. Numele markup vine din lumea publicistilor unde se referă la instructiunile codate inserate de editor în manuscis privind tipul caracterelor. SGML este generalizat (generalized) prin faptul că în loc să specifice exact cum anume trebuie prezentat un document el descrie tipuri de documente împreună cu modalitatea de marcare pentru formatarea si prezentarea instantelor fiecărui tip. GML a devenit SGML cînd a fost acceptat ca standard de către International Standards Organization (ISO) la Geneva (ISO 8879; 1986).

Un document SGML are trei părti. Prima descrie setul de caractere si, lucrul cel mai important, care sînt caracterele care vor fi folosite pentru a diferentia textul de tag-uri (etichete). Cea de a doua parte declară tipul documentului (Document Type Definition - DTD) si care tag-uri sînt considerate legale. A treia parte se numeste instanta documentului si contine textul si tag-urile. Cele trei părti nu trebuie să se găsească în acelasi fisier fizic, lucru fericit deoarece ne permite să "uităm" de SGML si să lucrăm numai cu HTML. Toate browserele HTML presupun aceeasi informatie legată de setul de caractere si declaratiile legate de tipul documentului asa încît avem de a face doar cu instantele HTML ale documentului, simple fisiere text.

Setul de caractere de bază al unui document HTML este ISO 8859/1, cunoscut ca Latin-1. Este un alfabet pe 8 biti cuprinzînd caractere pentru cele mai multe limbi americane si europene. ISO 646, cunoscut ca ASCII pe 7 biti, este subset al setului Latin-1. Nu există nici o obligatie pentru a utiliza într-un document HTML mai mult decît cele 128 de caractere ASCII standard. De fapt s-ar putea spune că este chiar încurajată rămînerea în cadrul US-ASCII deoarece documentele pot fi editate cu orice editor de text si "văzute" de cele mai rudimentare browsere. Caracterele Latin-1 care nu fac parte din US-ASCII sînt incluse în HTML sub forma unor "caractere entităti". Caracterele entităti încep cu semnul & (ampersand) care este urmat de numele sau numărul caracterului si de punct si virgulă. De pildă litera Ă este Ã, ă este ã, Î este Î, î î, Â Â, â â, etc.

Tag-urile HTML sînt delimitate de paranteze unghiulare < si >. Ele apar fie singular, cum este de pildă

care indică un paragraf nou în text fie în perechi marcînd începutul si sfîrsitul textului asupra căruia au efect. De pildă Atentie! reprezintă etichetarea cuvîntului pentru a fi afisat îngrosat pe ecran. Există tag-uri pentru formatare, pentru specificarea legăturilor, pentru includerea fisierelor grafice, video sau sunet precum si tag-uri pentru definirea unor cîmpuri de editare, interactive.

Numărul tag-urilor si al caracterelor entităti creste în continuu făcînd necesară redefinirea periodică a HTML. Acum există trei nivele de standardizare: Nivelul 0 este nivelul primelor browsere (modul text); Nivelul 1 este obligatoriu pentru toate browserele si înseamnă nivelul 0 plus imagini. Nivelul 2 include nivelul 1 plus tag-urile care definesc intrările utilizatorului (formularele). Nivelul 3 (cunoscut si ca HTML+) include tag-uri pentru obiecte mai speciale cum ar fi tabele, figuri sau formule matematice.

Formularele HTML sînt contributia cea mai inovativă la versiunea 2.0. Ele permit autorului documentului web să prezinte cititorului un formular interactiv care include cîmpuri de intrare, butoane si meniuri pull-down. Formularele pemit implementarea unei clase noi de de aplicatii web. Utilizarea lor se extinde de la furnizarea unor interfete sofisticate pentru căutători pînă la înregistrări on-line si aplicatii interactive în care input-ul în formular determină natura si continutul doumentului afisat. Formularele sînt extrem de folositoare deoarece reprezintă mecanismul prin care un limbaj de descriere a paginii hypertext este transformat într-o unealtă pentru crearea de documente interactive.

Ceea ce a rezultat, documentul interactiv, va fi citit de cineva care va completa cîmpurile de editare. Un program va face ceva cu datele de intrare si va furniza ceva utilizatorului pe baza acelor date. Evident, autorul va trebui să scrie un program (practic în orice limbaj de programare) numit CGI (Common Gateway Interface), aplicatie care manipulează intrarea, (caută informatie, trimite un e-mail, etc, orice vreti). Dacă vreti să învătati cum să vă scrieti aplicatile sau să aflati cum anume lucrează e-mergeti la < http://lpage.com/cgi/ > unde găsiti cîteva tutoriale (pentru începători spre mediu). Se găsesc si cîteva exemple si codul sursă.

Imaginile senzitive, o altă specificatie a limbajului HTML, au făcut posibilă depăsirea fazei în care imaginile erau utilizate doar pentru efectul decorativ. Extinderea HTML a constat în definirea unor zone "calde" care conectează diferite regiuni ale imaginii de diferite actiuni. Cînd cineva face clic pe o anumită zonă, numai informatia legată de acea zonă este afisată. Treaba se poate realiza fie cu ajutorul formularelor fie cu ajutorul variabilelor de mediu. Programul care implementează această facilitate citeste informatia din punctele calde ale unei imagini dintr-un fisier, caută "valoarea" asociată punctului cald x,y si furnizează utilizatorului documentul sau actiunea asociată cu acel punct.

Dezvoltarea HTML nu s-a terminat, evolutia specificatiilor fiind corelată cu evolutia serverelor si browserelor Web. Aproape întreaga muncă de dezvoltare a HTML se face pe Web sub forma grupurilor de discutii. Specificatiile HTML urmează un model deschis de dezvoltare: se propune o nouă caracteristică, se implementează în cîtiva clienti pentru testare si se fac testările pe cîteva aplicatii. Dacă există cerere suficientă pentru noua caracteristică atunci alti implementatori de browsere sînt încurajati să facă acest lucru si caracteristica se generalizează. În acest proces designul este revăzut si probabil modificat si îmbunătătit.

Se găsesc o varietate de instrumente comerciale si freeware gîndite în ideea simplificării acestui proces. HoTMetal Pro (SoftQuad) de pildă este un procesor de documente HTML care vă scuteste de problema codării si poate fi folosit în acelasi timp pentru a verifica dacă diverse documente sînt consistente cu HTML.

Asemănător, FastTag (Avalanche), un filtru care poate fi folosit cu procesoarele clasice de text. Practic textul se scrie în mod obisnuit după care se execută un macro de conversie în formatul HTML.

Cele mai multe instrumente HTML sînt concentrate pe functii specifice (cum ar fi translatarea documentelor create anterior în format HTML) si prin urmare nu sînt potrivite pentru dezvoltări puternice. O multime de tutoriale privind crearea documentelor HTML sînt disponibile on line: Beginner's Guide to HTML, la http://www.ncsa.uiuc.edu/SDG/Software/Mosaic/Docs/d2-htmlinfo.html, HTML Quik Reference, la http://www.kuhttp.cc.ukans.edu/lynx_help/HTML_quik.html si Composing Good HTML, la http://www.williamette.edu/html-composition/strict-html.html.


(C) Copyright Computer Press Agora