SGML se întoarce

Mircea Sârbu

Istoria informaticii consemnează adesea revenirea în actualitate a unor tehnicii sau tehnologii mai vechi, după ce vreme ele au fost considerate depăsite de abordări mai moderne. Un exemplu edificator în acest sens este SGML (Standard Generalized Markup Language).

Istoria acestei tehnologii începe în anul 1969, când un grup de specialisti condus de Charles Goldfarb se angajează într-un proiect de cercetare al IBM-ului, proiect vizând un sistem integrat de informatii pentru biroul juridic. Rezolvarea lor s-a bazat pe un set de idei de codificare datorat lui William Tunnicliffe de la CGA si pe ideea unui sistem de etichetare pentru „structura editorială“, datorată lui Stanley Rice. Ceea ce a rezultat a fost un sistem de marcare a continutului pentru orice fel de pu blicatii, sistem numit de autori GML (Generalized Markup Language). Ideea fundamentală constă în separarea completă a continutului publicatiei de elementele de formă si în utilizarea unui sistem configurabil de etichetare a continutului astfel încât să fie evidentiată structura acestuia.

Între timp, sistemul a fost implementat cu succes la IBM, într-un cadru mult mai larg decât cel vizat initial. Realizarea a avut un ecou remarcabil, având în vedere că IBM este al doilea „editor“ mondial (după guvernul SUA). Sensul termenilor „editor“ si „publicatie“ este mai larg decât cel uzual: orice organizatie emite publicatii (documente, manuale de utilizare, indicatii de procedură, etc.) pentru uz intern sau extern, deci practic orice organizatie este un „editor“.

Interesul manifestat de către Departamentul Apărării (US DoD) si de către alte organisme federale americane a impulsionat efortul de standardizare, început la sfârsitul anilor '70. În 1986, GML devine SGML, fiind adoptat ca standard international (ISO 88 79). Totodată, SGML devine o cerintă obligatorie în contractele cu multe organisme federale, mai cu seamă DoD.

Între timp însă lumea informaticii a fost bulversată de explozia microcomputerelor, iar SGML a fost aproape uitat în valul de sisteme de editare si DTP de tip WYSIWYG. Babilonia formatelor proprietare si incompatibile nu a reusit să stopeze frenezia de-a dreptul sinucigasă a producătorilor si clientilor timp de mai mult de zece ani, până când…

Diversificarea mediilor de publicare odată cu răspândirea tehnologiei CD-ROM si, mai ales, World Wide Web, a scos dintr-o dată la lumină carentele majore are sistemelor proprietare de tip WYSIWYG: legarea prea strânsă a publicatiei de imaginea copiei pe hârtie si lipsa de structurare internă a continutului. Eforturile imense implicate de aceste sisteme pentru publicare pe medii diversificate (hârtie, CD-ROM, HTML) a readus în ultimii ani din nou în actualitate standardul SGML. Un articol de prezentare a principiilor a fost publicat si de BYTE România în octombrie 1995 (Ionut Muslea: Documentele viitorului si viitorul documentelor; vezi http://www.agora.ro/byte/byte95-07/doc.html).

Editura Prentice Hall ( http://www.prenhall.com ) a initiat de curând o serie numită Open Information Management, coordonată chiar de Charles Goldfarb, părintele tehnologiei SGML. După o primă introducere în tehnologie (Turner, Douglas & Turner, README.1ST: SGML for Writers and Editors) urmează două cărti adresate cu precădere managerilor cu responsabilităti în sistemele informatice ale organizatiilor.

Industrial-Strength SGML: An Introduction to Enterprise Publishing (ISBN 0-13-216243-1, $44.95) este o carte care urmăreste să evidentieze beneficiile pe care tehnologia SGML le poate aduce unei întreprinderi, nu doar prin economii legate de activitătile de publicare, cât mai ales prin cresterea calitătii si îmbunătătirea metodelor prin care înt reprinderea poate furniza informatii către angajati, clienti sau furnizori. Autoarea lucrării, Truly Donovan, este un expert în domeniu, cu experientă de peste 35 de ani, incluzând cei 18 ani dedicati implementării sistemului integrat al IBM, extins în peste 20 de sedii din 7 tări, cuprinzând peste 11 milioane de master pages. Fără a pierde cititorul în detal ii tehnice, autoarea prezintă pe scurt câteva notiuni tehnice – folosind în acest scop si câteva exemple sugestive – concentrând-se însă în special asupra părtii de analiză a documentelor si a strategiilor de implementare. In final este prezentat pe scur t, ca studiu de caz, sistemul IBM BookMaster.

$GML: The Billion Dollar Secret (ISBN 0-13-226705-5, $32.95) de Chet Ensign, este o carte pentru directorii ocupati si vesnic grăbiti, dar mai ales alergici la notiunile prea tehnice legate de informatică. Lucrarea adună studii de caz, fiecare cu morala si semnificatia sa specială. Domeniile si problematica s unt atât de diverse, încât cu sigurantă fiecare cititor va găsi cel putin o rezolvare aplicabilă sau adaptabilă la situatia sa particulară. Grolier este o editură specializată pe enciclopedii (Encyclopedia Americana) si materiale educative, atât pe hârtie cât si pe CD-ROM; Sybase, producătorul de software de baze de date care si-a restructurat pe baza SGML sistemul de editare si distribuire a manualelor si documentatiei. Mobil Corp. (petrol, gaz si petrochimie) folo seste SGML pentru specificatiile tehnologice; Grupul The Semiconductor Industry (format din Hitachi America, Intel, National Semiconductors, Philips Semiconductors, Texas Instruments) foloseste SGML ca un standard pentru schimbul de documente. Un capitol final, Lessons for Your Future, sintetizează si concluzionează întreaga carte.

(Cărtile prezentate pot fi comandate si prin serviciul de carte prin postă a editurii Computer Press Agora, Tel.: 065-166516, Fax: 065-166290)


(C) Copyright Computer Press Agora