Încă cineva
care trage cu ochiul la
scrisorile noastre

E adevărat, nu în România, dar la americani a apărut cineva care trage cu ochiul la toate scrisorile expediate prin poștă. USPS (United States Postal Service) utilizează Linux-ul pentru scanarea și recunoașterea automată a adreselor de pe plicurile scrisorilor.

În 1997, Poșta Statelor Unite ale Americii (USPS) a instalat peste 900 de centre de sortare automată a scrisorilor, cu software pentru recunoașterea automată a destinatarilor. Fiecare centru este constituit dintr-o rețea formată dintr-un calculator central, cu procesor Pentium Pro la 200 MHz, care coordonează alte 5 sisteme de calcul duale Pentium Pro 200 MHz. Toate calculatoarele rulează pe sistemul de operare Linux. Am ales această știre pentru descrierea unui sistem informatic complex implementat cu ajutorul Linux-ului, pentru că este un exemplu foarte bun de situație în care fiabilitatea, viteza de calcul și flexibilitatea repre zintă punctele cheie ale proiectului. Cu greu mi-aș putea imagina că o instituție de calibrul poștei din U.S.A. nu a avut fondurile necesare pentru a alege o altă soluție și că a ales Linux-ul ca platformă de lucru doar din considerente de preț.

Realizare

USPS avea deja, la începutul proiectului, cîteva echipamente pentru scanarea adresei destinatarului de pe plicuri și cîteva calculatoare mai vechi pentru recunoașterea automată a acestora, dar numărul de plicuri a căror destinație putea fi detectată în mod automat era destul de mic. Proiectul a adăugat cîte un sistem de calcul la fiecare scaner, pentru a rula mai mulți algoritmi avansați de recunoaștere automată a caracterelor (OCR), furnizați de firma RAF Technology Inc.

Calculatorul central a fost dotat cu monitor, tastatură, mouse, CD-ROM și floppy. Celelalte calculatoare dispun numai de unitatea centrală, 128 Mb RAM și cîte un disc de 2.5 Gb.

Plicurile sînt scanate la o rezoluție de 212 DPI și la o viteză de 12 plicuri pe secundă. Imaginea binară rezultată este trimisă la unul dintre calculatoare, prin intermediul unor interfețe specifice. După aceea, imaginea este supusă unui proces de comprimare rapidă și este expediată prin rețea către unul dintre cele 10 procese (unul pentru fiecare CPU) de pe celelalte mașini, care rulează software specific de recunoaștere a caracterelor scrise de mînă sau de mașină. Aceste procese recunosc adresa destinatarului în ritmul de 1 adresă pe secundă și întorc informația în mod ASCII către o bază de date clasică pe un calculator separat, unde se face și verificarea codului poștal ZIP.

Inițial, proiectul prevedea doar utilizarea algoritmilor pentru recunoașterea adreselor scrise de mașina de scris sau imprimante. Calculatoarele "slave" erau preconizate a fi dotate numai cu 32 Mb RAM și fără disc de stocare. În timpul derulării proiectului, firma SUNY Buffalo a dezvoltat un set de algoritmi eficienți pentru recunoașterea adreselor scrise de mînă și USPS a luat decizia de mărire a capacității de prelucrare și pentru sortarea acestor tip de scrisori. Pentru a rula în condiții bune, calculatoarele "slave" au fost dotate cu disc și memoria a fost mărită la 128 Mb.

Linux-ul a fost alegerea ideală pentru sistemul de operare. Pentru a face ca softul de recunoaștere a caracterelor și sistemul de operare să ruleze în 32 Mb RAM, fără ca să facă swap, kernel-ul a fost recompilat, păstrîndu-se numai modulele esențiale, lucru care nu ar fi fost posibil în cazul unui sistem de operare Microsoft, de exemplu. Driver-ul pentru interfața specifică a scanerelor a fost relativ simplu de dezvoltat și proiectanții au ținut să menționeze suportul tehnic excelent pe care l-au obținut din partea "comunității Linux", pe care l-au considerat ca fiind mult superior oricărui altul. Cînd au avut probleme cu alocarea unor cantități mult prea mari de memorie în kernel au expediat o întrebare prin e-mail și au obținut zeci de răspunsuri în cel mai scurt timp.

Scanerele care au fost folosite utilizau 8 nivele de gri. La viteza de scanare de 12 plicuri pe secundă, datele soseau la server cu o rată susținută de 28 Mbytes/sec. Interfața și bus-ul PCI trebuiau să asigure această rată susținută de transfer. Pentru asigurarea continuității scanării, au fost prevăzute meca nisme de bufferare în zone extinse de me morie RAM.

Concluzia

Linux-ul a depășit de mult faza încercărilor de laborator, faza de sistem al hacker-ilor , al studenților pasionați de informatică pură. Există în momentul de față, conturate deja câteva domenii de activitate în care alegerea Linux-ului ca sistem de operare este indicată. Stabilitatea deosebită de care dă dovadă, performanțele ridicate îl recomandă pentru acele proiecte care necesită funcționarea 24/24 în condiții critice (sisteme de achiziții de date, servere pentru Internet, print servere, servere de baze de date). Faptul că sursa sistemului de operare este "la vedere" oferă proiectantului siguranța că nu se pot strecura proceduri "ascunse", orice comportament dubios din partea sistemului are în cele din urmă o explicație logică și ca urmare și un remediu.

Parcurgînd lista cu companiile care utilizează Linux-ul, într-un fel sau altul am avut plăcuta surpriză să găsesc nume sonore cum ar fi : Mercedes Benz, U.S. Navy - Personnel Support Activity, San Diego, Netherlands Foreign Investment Agency, National Disaster Communication Response Team, Yellow Cab Service Corporation, U.S. Army Publications and Printing Command, Sony WorldWide Networks, Cisco Systems Inc., United Railway Signal Group Inc., Virginia Power (un fel de RENEL al americanilor), Sony Electronics Inc, editions O’Reilly, Animal and Plant Health Inspection Service, Science Applications International Corporation, California Veterinary Diagnostic Laboratory System, pentru a menționa numai câteva dintre ele, ale căror nume erau cât de cât cunoscute. Printre ele, neoficial, sunt menționate și firmele AMD și Cyrix care, pe ascuns, ar utiliza Linux-ul pentru testarea procesoarelor proprii.

Majoritatea folosesc Linux-ul ca server de intranet, de Internet, pentru mail, proxy, print server, server de fișiere compatibil Windows for Workgroups (prin Samba), server de fișiere compatibil Netware (prin Mars-Nwe), aplicații sub X, birotică, dezvoltare în C++, Java. Mulți folosesc de asemenea Li nux pentru aplicații de birotică, în special cu pachetul Applixware. Am avut ocazia să testez ultima variantă de Applixware 4.3.7 (chiar varianta neprofesională) și pot să afirm că nimeni care a utilizat (în limitele normalului, fără OLE sau alte subtilități) un Microsoft Office nu ar avea ce să-i reproșeze.

Certificate de garanție

În urmă cu câtva timp, într-o discuție furtunoasă cu o firmă, privind alegerea Linux-u lui ca sistem de operare pentru un proiect în România , am fost admonestat că am ales un sistem de operare gratuit. O mare greșeală este să confunzi noțiunea de "gratuit" cu cea de "fără valoare", lucruri profund diferite.

La finalul proiectului, care pînă la urmă a fost făcut totuși pe Linux, mi-a fost solicitat un certificat de garanție pentru funcționarea întregului sistem. Mi-am pus atunci problema ce ar fi trebuit să fac dacă soluția aleasă s-ar fi bazat pe alt sistem de operare.

În mod normal, funcționarea corectă a sistemului livrat de mine este direct dependentă de corecta funcționare a sistemului de operare pe care rulează aplicația mea, deci ar fi trebuit să mă bazez pe certificatul de garanție emis de firma care a livrat sistemul de operare. Citiți orice certificat de garanție tip "Limited Warranty" a unui sistem de ope ra re din cele uzuale, luat la întîmplare din ce aveți prin preajmă. Veți constata că singurul lucru care vă poate fi garantat este că dischetele de livrare sunt "libere de orice defect de manufactură" și chiar dacă acest lucru grav s-ar întîmpla, ele ar urma să fie rapid înlocuite. Nici o altă vorbă din care să deduceți că furnizorii respectivului sistem de operare își asumă vreo responsabilitate în cazul unor crash-uri, pierderi de date. Și chiar așa fiind, probabil că ele ar trebui probate în fața unei comisii , iar dacă pe calculator mai rulează și alte aplicații produse de încă 2,3 firme, ați asista, pro babil, la un șir lung de acuze că asta se datorea ză altor cauze , poate hardware, la aceeași veche teorie că un calculator "asamblat în garaj" nu are cum să ruleze corect sistemul de operare cutare sau aplicația cutare.

Din punctul meu de vedere, avînd în vedere că nici un sistem de operare uzual nu are posibilitatea să-mi ofere nici o garanție privind funcționarea corectă 100%, am ales soluția în care, în cazul în care voi întâm pina vreo problemă, să pot obține un suport tehnic și ajutor pentru o rezolvare rapidă, în cel mult 24 de ore de la ivirea incidentului.

Acest articol a fost scris pe baza articolului scris de John Taves, unul dintre proiectanții sistemului mai sus descris, căruia îi mulțumim pentru că ne-a permis folosirea materialului.


BYTE România - august 1998


(C) Copyright Computer Press Agora