Un corector lexical ne va scuti de greseli de genul celor care apar în titlul acestui articol.

Scriti rmăneste cu computadorul

Mircea Sârbu

Lipsa unor instrumente lingvistice computerizate a fost îndelung resimtită în conditiile informatizării muncii de birou pe meleagurile mioritice. Am privit cu jind la spell-checker-ul englezesc, german, francez, etc. Dar, cei din urmă vor fi cei dintâi, spune Biblia. Ortograf este un corector ortografic pentru limba română, reprezentând prima componentă a unui pachet lingvistic complet pregătit de colectivul RoLingva din cadrul firmei Software ITC, filiala Cluj-Napoca, împreună cu firma MorphoLogic din Budapesta, sub licentă Microsoft. În final pachetul va cuprinde, alături de corectorul ortografic, un dictionar de sinonime si un analizor sintactic, astfel încât e de presupus că vremea greselilor din Byte România se apropie de sfârsit.

Cum functionează?

Versiunea curentă, Ortograf 1.1, se bazează pe un dictionar propriu continând peste 60.000 de cuvinte. Analiza ortografică se bazează pe caracterul puternic flexionar al limbii române, astfel încât pe baza rădăcinilor din dictionar se pot acoperi peste 2 milioane de cuvinte. Programul primeste rând pe rând cuvintele din textul de analizat si furnizează răspunsuri referitoare la corectitudinea acestora. Algoritmul de recunoastere încearcă să găsească în dictionarul de bază rădăcina cuvântului, după care caută în tabelele interne ale programului celelalte componente ale cuvântului (prefixe, sufixe, terminatii). Răspunsul final este determinat pe baza verificării coerentei compunerii pe baza regulilor gramaticale specifice limbii române. Procedura de corectare tratează si constructiile cu cratimă specifice limbii române.

Programul cuprinde si un modul special care asigură functia de despărtire automată în silabe a cuvintelor. O caracteristică valoroasă este posibilitatea de a opta între normele ortografice actuale ale limbii (adică, de fapt, cele vechi) si ortografia "veche" (adică cea modernă...). De asemenea, pentru multe dintre cuvintele eronate sau necunoscute se furnizează o listă de sugestii de corectii, tinând cont de greselile tipice de dactilografiere.

Programul este disponibil în versiuni pentru toate variantele curente de Microsoft Windows (3.1, 3.11, NT si '95) si poate fi folosit în cadrul programelor MS Word si MS Excel din suita Microsoft Office. Programul este independent de fonturile sau tastaturile folosite, singura presupunere pe care o face în această privintă este folosirea paginii de cod WinCP 1250 pentru caracterele limbilor est-europene. Producătorii afirmă că programul poate fi integrat, în principiu, sub orice procesor de texte, fiind necesară doar interfata de legătură specifică precum si procedurile de instalare prin care corectorul poate deveni functie internă a acestor procesoare.

Din punctul de vedere al utilizării, programul se comportă asa cum ne asteptam. Am folosit versiunea pentru Windows '95, pe postul local, lucrând cu Word 7. Instalarea este extrem de simplă, bazată pe procedura standard din Windows 95 (există si o variantă pentru retea, ceva mai complexă). După instalare, în cadrul dialogului Language din Word au apărut optiunile Romanian si Romanian(OLD). Pentru documentele declarate românesti (sau pentru portiuni din documente) functia Spelling se comportă normal, în functie de optiuni: cuvintele gresite sau necunoscute sunt marcate iar tratarea lor se poate face fie prin dialogul standard, fie cu un clic pe butonul din stânga al mouse-lui în interiorul cuvântul în cauză.

Functia de despărtire în silabe (Hyphenation) poate functiona automat sau în mod manual (caz în care oferă sugestii - nu am remarcat nici una gresită).

Posibilităti de îmbogătire

Valoarea unui corector lexical este însă dependentă de flexibilitatea lui. Cerintele unui birou de avocatură sunt diferite de cele ale unui poet, iar limba este si ea vie. Ortograf oferă o multitudine de posibilităti, bazate pe utilizarea unor dictionare speciale. Aceste dictionare sunt în format ASCII, deci pot fi editate cu orice editor (de pildă Notepad). În dictionarele utilizator, cuvintele noi pot fi introduse si folosind butonul Add din dialogul specific de corectare.

Îmbogătirea fondului de cuvinte se poate face prin utilizarea unuia sau mai multor dictionare utilizator, declarate ca atare în dialogul Tools/Options/Spelling. Astfel, un neologism de specialitate (sau barbarism, cum credeti...) ca "drive" poate fi adăugat unui anumit dictionar, pe când numele proprii (de pildă "Mircea") pot fi plasate în altul, si asa mai departe. Verificare unui document se poate face apoi doar cu acele dictionare utilizator care corespund specificului textului. Există si posibilitatea de a înregistra (într-un dictionar special) forme diferite de despărtire în silabe sau modul în care se despart cuvintele adăugate în dictionarele utilizator.

O altă posibilitate de îmbogătire a functionalitătii este dictionarul de exceptii. Cuvintele plasate în acest dictionar vor fi marcate ca incorecte chiar dacă sunt, de fapt, corecte. Cuvântul respectiv este totusi furnizat ca sugestie de înlocuire.

Există încă două dictionare speciale care pot fi extrem de utile. Unul este dictionarul de sugestii, prin care se poate îmbogăti lista de sugestii oferite automat de program. Am considerat firesc ca sugestiile să poată fi specificate pentru cuvintele din dictionarul de exceptii, deoarece nu prea are sens să introduc sugestii pentru cuvinte gresite oarecare (numărul si varietatea acestora este, evident, fără limită). Am încercat să introduc cuvântul "chip" în dictionarul de exceptii si să ofer ca sugestie de corectare cuvântul "cip". Cuvântul "chip" a fost sanctionat de program, dar singura sugestie oferită a fost... tot "chip". Greseala a fost faptul că "cip" era si el un cuvânt necunoscut. De îndată ce am adăugat în dictionarul INFO.DIC cuvântul "cip", lucrurile s-au desfăsurat normal.

Ce n-a mers?

În fine, mai există posibilitatea de a folosi un dictionar propriu de flexionare. Aice se pot introduce cuvinte absente din dictionarul de bază, fiecare împreună cu un cuvânt cunoscut care serveste drept model de flexionare. Cuvântul nou trebuie să prezinte aceleasi alternante ale rădăcinii cu cele ale cuvântului dat ca exemplu. Ideea este, într-adevăr, excelentă (apropo de idee: cuvântul "ideea" este marcat ca eronat). Am încercat să conving programul că "cip" este în aceeasi categorie de flexionare cu "sip", dar n-am reusit să obtin rezultatul pe care-l asteptam, adică acceptarea cuvintelor "cipuri", "cipului", etc. Voi cere detalii producătorilor si vă voi comunica rezolvarea corectă (sunt încredintat că există).

În ansamblu, un instrument care nu trebuie să vă lipsească. Iar când vom putea beneficia si de tezaur, vom fi de-a dreptul bogati (e vorba de dictionarul de sinonime, desigur).


(C) Copyright Computer Press Agora