Gestiunea documentelor la OSIM

Mircea Sârbu

Arhivele imense, debordînd de hîrtii îngălbenite si prăfuite, sînt imagini comune nu doar în institutiile administrative, ci si în întreprinderi, bănci, scoli si multe alte organizatii dintre cele mai diferite. Cu toate că dezideratul „biroul fără hîrtie" este încă departe, calculatoarele si noile medii de stocare ne pot deja ajuta să stopăm proliferarea fără limite a hîrtiilor si să ne descurcăm mai eficient în administrarea documentelor care ne asaltează.

Cazul Oficiului de Stat pentru Inventii si Mărci (OSIM) este la prima vedere foarte specific. Dar o prezentare a solutiilor văzute aici pot reprezenta pentru multe alte organizatii un punct de plecare în găsirea propriilor solutii de administrare a documentelor.

Ce face OSIM?

Oficul de Stat pentru Inventii si Mărci este un organism guvernamental, unicul în România abilitat cu asigurarea protectiei proprietătii industriale. Conform legislatiei în vigoare, obiectele proprietătii industriale sînt inventiile, mărcile, desenele si modelele industriale precum si topografiile de circuite integrate. Este posibil ca evolutia tehnologică si legislativă să aducă si alte obiecte în domeniul proprietătii industriale.

Înfiintat în 1906, odată cu prima lege modernă românească în domeniul proprietătii industriale, OSIM acordă si protejează drepturile de proprietate pentru o anumită perioadă de timp pe un anumit teritoriu (în spetă, teritoriul national al României). Volumul imens de documente cu care se lucrează este determinat în principiu de trei aspecte:

Există si alte aspecte, dar este suficient pentru a vă forma o idee. Deoarece în continuare mă voi referi mai ales la brevete, voi aminti doar că arhiva OSIM cuprinde cca. 17 milioane de documente în acest domeniu, dintre care cele mai vechi datează din 1906 (există si documente mai vechi, de provenientă străină).

Alternative pentru hîrtie

Simpla stocare a unui asemenea volum de hîrtii implică probleme greu de surmontat. Hîrtia este un material foarte perisabil, deci necesită anumite conditii pentru o păstrare corespunzătoare. Problemele legate de volumul fizic al acestor arhive nu pot fi nici ele trecute cu vederea. În fine, praful si microorganismele pot periclita sănătatea celor ce lucrează în aceste conditii. La toate acestea se adaugă si costurile semnificative implicate de generarea documentelor pe hîrtie.

Accesul la informatiile continute în aceste arhive reprezintă o altă clasă de probleme. În mod obisnuit, documentele relative la brevete sînt clasate în mape folosind doar trei criterii: unul geografic (tara în care a fost emis), unul temporal (perioada în care a fost emis) si unul tematic (clasificarea). Acesta din urmă este adesea insuficient sau nerelevant pentru necesitătile analizei de fond.

Nu în ultimul rînd, apare problema schimburilor de informatii cu alte oficii, practică obligatorie în zilele noastre. Pentru oficiile mari, coletele postale ar avea cîteva tone!

Desi pe plan international s-au încercat variante diverse (de pildă microfilmele), pînă la mijlocul deceniului trecut nici o alternativă a hîrtiei nu s-a impus pe scară largă. În 1985, OEB (Oficiul European de Brevete) îsi propune să folosească pentru schimburi de informatii medii optice de stocare, oprindu-se (probabil din considerente de standardizare) asupra discurilor CD-ROM. Alegerea s-a dovedit pertinentă: tehnologia a evoluat, preturile au scăzut spectaculos iar standardele au cîstigat stabilitate.

Un disc CD-ROM poate stoca peste 600 MB de date. Datorită necesitătii de a avea acces la toate informatiile purtate de document, varianta de stocare aleasă pentru brevete si cereri de brevete este facsimilul, adică imaginea digitizată a documentului, obtinută prin scanare. Cu toate că imaginile digitizate necesită volume de stocare relativ mari, un CD-ROM poate stoca circa 3.000 de pagini în facsimil.

Povestea indexului

Cu toate că imaginea digitală a unui document este purtătoarea informatiei exhaustive a acestuia, problema accesului la această informatie nu este simplă. O imagine digitală este doar o descriere a punctelor care o formează si nimic mai mult. Pentru a putea fi identificate, documentele trebuie însotite de o serie de informatii suplimentare (de exemplu: numele autorului, anul, tematica, cuvintele cheie, etc), structurate de o manieră care să permită explorarea lor prin metode informatice performante. Aceste structuri formează sisteme de indexare, indispensabile în utilizarea unei colectii de documente.

Într-o primă fază, fiecare disc emis de OEB continea si un index propriu, dar aceasta implica faptul că identificarea unui document impunea consultarea indexului de pe fiecare disc. Următorul pas a fost realizarea unor asa-numite discuri pilot, care contineau o bază de date index (BDI). O astfel de bază de date stocată pe un CD-ROM contine referinte la cca. 300.000 de documente, deci practic intermediază accesul la cca. 1000 de alte discuri. Actualizarea discurilor pilot se face de regulă trimestrial.

Dar orice rezolvare crează noi probleme. În primul rînd, sînt putine oficii de brevete în lume care crează discuri pilot, mai precis OEB (discurile ESPACE-ACCESS), oficiul american de brevete (CASSIS-BIB) si cel japonez (PAJ). În al doilea rînd sistemele de indexare sînt diferite, fiind orientate spre grupe diferite de utilizatori. De pildă sistemul folosit de OEB este orientat spre specialistii din oficiile de brevete, în timp ce sistemul american este orientat preponderent spre beneficiarii din comert, industrie si sectorul juridic. Mai mult, oficiile nationale utilizează sisteme proprii, în functie de necesitătile specifice.

Planul de ansamblu

Pentru OSIM sansa schimbării vechiului sistem, bazat în exclusivitate pe hîrtie, s-a ivit în 1992, cînd un program regional PHARE, denumit RIPP (Regional Industrial Property Program), si-a propus să ajute alinierea la standardele europene a oficiilor de brevete din 6 tări est-europene (România, Bulgaria, Cehia, Polonia, Slovacia si Slovenia). Aceste tări urmau să producă împreună un disc propriu numit ESPACE-PRECES, făcînd parte din familia discurilor ESPACE patronată de OEB.

Introducerea CD-urilor în schimburile internationale implica însă si introducerea tehnologiilor informatice necesare. Existenta colectiei nationale pe CD, împreună cu cele mai importante colectii din lume, creea premiza extinderii folosirii acestor tehnologii si în faza de documentare si expertiză. Deoarece proiectul PHARE asigura si finantarea, a luat nastere un departament specializat de informatică si, desi azi pare greu de crezut, primele calculatoare au pătruns în OSIM în 1993. Proiectul initial de informatizare s-a dovedit realist si a fost în mare parte materializat.

Din motive lesne de înteles, transpunerea pe CD-ROM a colectiei nationale nu putea începe de la origine, drept pentru care s-a început de la brevetul nr. 100.001, emis în 1989, urmînd ca în cîtiva ani să se ajungă la zi (de altfel aceasta a fost abordarea si în alte oficii nationale). Primul disc din seria PRECES a apărut în septembrie 1993 iar pentru 1995 se doreste realizarea unui disc pilot, ESPACE-ACCESS-PRECES.

Deoarece OSIM doreste transpunerea în formă digitală a întregii colectii, ideal ar fi fost ca si pentru numerele mai mici decît 100.001 să fie folosit tot suportul CD-ROM, dar problemele legate de editarea pe cont propriu a acestor CD-uri (licente, procesare, etc) precum si lipsa de fonduri au necesitat alegerea unei solutii alternative. S-a optat pentru un alt suport optic: discuri WORM (Write Once Read Many) de mare capacitate.

Problema specifică

În aceste conditii, problema care s-a pus departamentului informatic ar putea fi enuntată astfel:

O sarcină aditională, dar nu neglijabilă, a fost instruirea întregului personal pentru utilizarea întregului sistem.

Vedetele hardware

Solutia problemei s-a clădit în jurul unor componente hard/soft esentiale pentru sfera gestiunii documentelor digitale.

InfoServer. Problema accesului la colectia de discuri CD-ROM putea fi abordată pornind de la un jukebox (tonomat) de mare capacitate pentru CD-uri. Dar această variantă prezenta trei dezavantaje majore: 1) Partajarea în retea a acestei resurse este foarte dificilă. Practic, consultarea unui CD din colectie blochează accesul la alte CD-uri. 2) Solicitarea CD-urilor nu este echilibrată. Discurile pilot sînt mult mai mult solicitate decît discurile cu facsimile. 3) În fine, un astfel de aparat este prea scump.

Solutia aleasă este mult mai practică: InfoServer 1000. Este vorba de un dispozitiv produs de Digital Equipment Corp. anume pentru a partaja în retea multiple dispozitive SCSI, permitînd accesul concurent la acestea. InfoServer-ul de la OSIM controlează un „tower" format din 7 cititoare de CD-ROM, dintre care sînt folosite actualmente 4. În felul acesta, 4 CD-uri sînt permanent disponibile pentru întreaga retea: 2 discuri ESPACE-ACCESS (unul pentru perioada 1978-1988, al doilea 1989 pînă la zi), CASSIS-BIB (baza de index pentru brevetele americane) si IPCCLASS (disc ce contine clasificarea internatională a brevetelor si tabelele de concordantă pentru diferitele sisteme de clasificare).

Prin intermediul acestor patru CD-uri se poate identifica discul facsimil care contine documentul dorit, disc ce este luat apoi din colectie si consultat pe lectorul CD-ROM local.

Jukebox WORM. Produs tot de DEC, tonomatul utilizează 5 discuri WORM de 12 inch a cîte 5,6 GB. În felul acesta, circa 28 GB sînt disponibili „aproape on-line", prin mijlocirea unui server DEC 450 MT, bazat pe un procesor i486, dotat cu 64 MB RAM si două hard-discuri de cîte 1 GB, rulînd ca sistem de operare SCO Unix.

DEC Alpha 2100. Serverul de bază al retelei, continînd bazele de date pentru cereri de brevete si cereri de mărci, este un sistem bazat pe un procesor RISC Alpha si este dotat cu 64 MB RAM si 8 GB într-un sistem RAID, plus un drive magneto-optic. Sistemul de operare este OSF/1 cu PATHWORKS pentru interfată cu clientii DOS/Windows. SGBD-ul este Informix On-line (ca si pentru toate celelalte baze de date din OSIM).

Pentru ca familia serverelor să fie completă, mai trebuie să amintesc serverul de baze de date pentru colectia de desene si modele industriale), rulînd pe un ICL DRS3000 (i486, 16 MB RAM, 800 MB HHD, Unix SVR4), precum si serverul DTP (DEC 450 MT, 32 MB RAM, 2 GB HHD).

Tot acest ansamblu de servere deserveste un număr de 104 statii de lucru, în general PC-uri cu Intel 486, dintre care cca. 80 dispun de 16-20 MB RAM si o bună parte de cititoare CD-ROM.

Vedetele software

Dacă în privinta arhivelor pe CD-ROM singurele probleme sînt găsirea si consultarea documentelor (realizată prin programe standard), în privinta administrării documentelor „active" precum si a accesului la documentele stocate pe discuri WORM, lucrurile nu mai sînt atît de simple. Instrumentarul software utilizat de OSIM se bazează pe două piese „grele", numite Common Software (CS) si MEGADOC.

Common Software a fost dezvoltat în Franta, din initiativa Comunitătii Europene si a Oficiului European de Brevete, în cadrul programului PHARE RIPP. Ideea de la care s-a pornit a fost realizarea unui program comun pentru oficiile nationale, dar care să fie suficient de flexibil pentru a putea fi adaptat de fiecare oficiu national în functie de procedurile specifice.

Functionalitatea programului este în principiu dublă. Pe de-o parte este o aplicatie administrativă din categoria „Workflow", urmărind si controlînd traseul documentelor active gestionate, iar pe de altă parte este o aplicatie de baze de date tranzactională (bazată pe Informix On-line) care construieste si întretine un sistem de indexare a documentelor arhivate. Desi functionalitătile par divergente, se va observa în exemplificare că ele sînt de fapt strîns legate.

MEGADOC este un produs al firmei DEC, tipic pentru domeniul „document management". Partea server rulează pe aceasi masină (DEC 450 MT) care controlează tonomatul de discuri WORM, pe care de altfel îl utilizează pentru stocarea imaginilor. Tot partea server administrează sistemul de indexare, utilizînd acelasi SGBD Informix On-line. Cererile de documente venind de la clienti (partea client rulează pe statii DOS/Windows) sînt rezolvate de o manieră care să permită o deservire optimă: documentul solicitat este copiat de pe WORM pe discul hard (fiind disponibil astfel si altor clienti) eliberînd tonomatul pentru deservirea altor cereri.

Printre facilitătile pe care le oferă MEGADOC se remarcă posibilitatea de organizare a documentelor în dosare, regăsirea documentelor după diverse criterii, vizualizarea unuia sau mai multor documente simultan (zoom, rotire, etc), actualizarea unor pagini sau părti de pagină, listarea la imprimantă, etc. Este interesantă si posibilitatea de a combina în cadrul aceluiasi document imagine si text (folosind un procesor de texte lansat automat, în cazul OSIM WordPerfect for Windows).

Desi posibilitătile de indexare oferite de MEGADOC sînt relativ puternice, sistemul de indexare utilizat este foarte simplu, pentru a nu dubla functionalitatea oferită de Common Software.

Lungul drum al unei inventii

Descrierea fragmentară de pînă acum se cere completată cu o vedere de ansamblu a functionării sistemului. Pentru a ilustra acest aspect cea mai relevantă cale este să urmărim pas cu pas ce păteste o cerere adresată OSIM.

Asadar, primul drum duce la registratură, unde se depune dosarul. Dacă nu e complet (lipseste de pildă o adeverintă indispensabilă) atunci se păstrează aici pînă la completare.

Următorul pas este o decizie: este sau nu este de competenta OSIM? Dacă nu, petentul este îndrumat spre forul competent, cu dosar cu tot. Si povestea se termină din punctul nostru de vedere.

Dacă este însă de competenta OSIM (o cerere de brevet de inventie, o revendicare a unor drepturi de proprietate industrială, etc.) atunci dosarul primeste un număr unic (care-l va însoti pe tot parcursul) si o dată (foarte importantă, deoarece are relevantă juridică). Din acest moment intră în urmărirea lui Common Software (în continuare CS).

Urmează un set de operatii tipice, pe baza unui algoritm implementat în CS. Fiecare operatie este consemnată prin intermediul CS si duce dosarul într-o nouă stare, care poate fi de competenta altei persoane. Dosarul este automat trecut în coada de asteptare a acesteia.

Să presupunem că procedura legală prevede plata unei taxe. În această fază, CS va genera automat o scrisoare prin care petentul este înstiintat de vestea cea bună si va trece documentul în competenta functionarului care va urmări efectuarea plătii. În momentul în care primeste dovada, să zicem o copie a chitantei, o adaugă la dosar si consemnează operatiunea în CS printr-o operatie standard. Datele despre plată sînt trimise la contabilitate iar dosarul îsi continuă drumul, urmărit cu vigilentă de CS (care restrictionează accesul la acesta în functie de faza în care se află).

După ce etapa birocratică a trecut, datele bibliografice sînt consemnate în baza de date si se trece la examinarea formală. Dacă ceva nu e în regulă, CS ajută la realizarea corespondentei si urmăreste corectarea situatiei.

În fine, cererea (să presupunem că este o cerere de brevet) intră în analiza de fond. Este luată în primire (desigur, cu consimtămîntul CS) de un expert în domeniul respectiv. Prima fază este cea de documentare, în care se caută documente relevante în domeniul respectiv. În această etapă bazele de index sînt cele mai solicitate. Tot prin CS va permite consultarea indexului asociat colectiei de pe WORM. Pentru arhivele pe CD se pot folosi 24 de ore din 24 discurile pilot, aflate permanent în InfoServer.

Odată identificate documentele relevante, se trece la analiza comparativă. Pentru documentele din arhivele pe CD, se face o plimbare pînă la parter si se împrumută CD-urile în cauză pentru a fi consultate pe statia locală. Pentru cele de pe WORM se utilizează MEGADOC-ul, pe baza informatiilor de identificare furnizate de CS. Pentru ambele variante se poate recurge la listare.

Urmează decizia cea mare: este brevet sau nu? Dacă examinarea de fond apreciază că nu, atunci dosarul se întoarce într-o fază de asteptare. Se anuntă petentul, care poate să conteste si să aducă noi argumente. CS urmăreste si această fază.

Dacă răspunsul este da, atunci descrierea de brevet intră în linia de DTP, unde textul este editat în WordPerfect, prima pagină si imaginile sînt scanate, se adaugă rezumatul final si, cu ajutorul MEGADOC, forma digitală a descrierii brevetului îsi ia locul cuvenit pe un disc WORM. Toate informatiile bibliografice au fost deja administrate de CS.

Totusi, vor exista si hîrtii. Anumiti beneficiari ai OSIM (întreprinderi, institute, etc) vor primi noile brevete pe hîrtie. Tot pe hîrtie va călători descrierea ce va fi transpusă pe discul PRECES.

Planuri de viitor

Faptul că întreg ansamblul descris functionează nu înseamnă că el este perfect. Planurile compartimentului de informatică de la OSIM prevăd dezvoltarea si perfectionarea sistemului. O parte dintre planuri se referă la simpla „întărire" a sistemului existent (schimbarea monitoarelor de 14 inch cu monitoare de 19-21 inch alb-negru, mărirea numărului statiilor de cititoare CD-ROM, acceleratoare grafice, etc), dar unele implică dezvoltări structurale importante.

Astfel, pentru 1996 se prevede o primă variantă de acces în retea la juke-box-uri cu CD-ROM-uri continînd documente în facsimil. Una dintre variantele avute în vedere se referă la o „baterie" formată din 4 juke-box-uri de cîte 300 de CD-uri dotate cu cîte 2 drive-uri, toate conectate la un server avînd un spatiu de disc de cca. 10 GB, care să servească ca zonă tampon pentru un acces cît mai eficient.

Această solutie, dublată de crearea unei infrastructuri de comunicatii eficientă, ar putea crea posibilitatea consultării on-line a colectiilor din exteriorul OSIM.

În privinta componentelor soft, se are în vederea dezvoltarea Common Software prin adăugarea unor module care să realizeze serviciile de contabilitate, realizarea unor instrumente de documentare si examinare de fond care să utilizeze rezumatul si textul (full-text).

O intentie ambitioasă se referă la utilizarea MEGADOC pentru constituirea dosarului electronic, ceea ce ar însemna ca întregul flux al documentelor să se facă în formă electronică.

Multumiri finale

Prezentarea de mai sus nu acoperă decît o parte din sistemul informatic al OSIM, si de altfel nici nu si-a propus altceva.

Marea majoritate a datelor care au stat la baza acestui material le-am obtinut de la dl. Bogdan Boreschievici, seful sectorului Editură si Informatică OSIM, pe care de altfel îl citez copios (sper că si exact) pe parcursul întregii expuneri. Îi multumesc pentru timpul si răbdarea pe care mi le-a acordat. Celelalte informatii le-am obtinut tot prin intermediul domniei sale. Multumesc de asemenea pentru colaborare d-nelor Adriana Atanasoaie si Doina Dumitrescu (OSIM), precum si d-lui Orest Robciuc (Digital Equipment Romania).

Multumesc întregului colectiv de la sectorul de informatică de la OSIM pentră că mi-au dat prilejul să realizez acest reportaj.


(C) Copyright Computer Press Agora