Motoare de căutare

Unele dintre metodele de indexare ale Web-ului
au devenit atât de populare încât s-au transformat în soluții comerciale

Un motor de căutare (search engine) este un program care caută documente după cuvinte cheie specificate și oferă o listă a acestor documente. De regulă, un motor de căutare trimite un "păianjen" care extrage cât mai multe documente posibile. Un alt program, de indexare, citește apoi aceste documente și le indexează după cuvintele conținute de fiecare document. Pentru a crea acești indecși, fiecare motor de căutare folosește un algoritm proprietar care, ideal, ar trebui să ofere doar rezultatele cerute de interogare.

Alta Vista

Alta Vista al firmei Digital este un puternic motor de căutare atât pentru Web, cât și Usenet. Interogările sale sunt precise, iar cele avansate oferă posibilitatea trierii exacte a informației căutate. La prima interogare, Alta Vista informează despre numărul documentelor găsite pentru fiecare cuvânt specificat. Apoi, afișează rezultatele, oferind titlul și URL-ul, primele câteva cuvinte din text, dimensiunea fișierului, precum și data în care Alta Vista a înregistrat intrarea respectivă în baza de date. Rezultatele primesc punctaje, fiind afișate în ordinea scorului obținut. De regulă, Alta Vista caută doar pe Web, dar oferă și opțiunea de căutare în grupurile de știri Usenet. Rafinarea căutării se face ușor, cu ajutorul operatorilor logici AND, OR și NOT, completați de directiva NEAR, care specifică un cuvânt din imediata apropiere. Căutarea avansată permite limitarea rezultatelor în funcție de dată, limbă etc., acordarea punctajului făcându-se după criterii specificate. Toate acestea fac din Alta Vista un sit excelent pentru a începe o căutare.

Excite

Excite permite căutarea pe Web, Usenet, categorii Usenet și în propria bază de date a siturilor Web. Chiar dacă Excite găsește informația dorită, nu oferă aceleași unelte sofisticate ca Alta Vista. Implicit, Excite caută pe Web după termeni explicativi ai cuvintelor cheie, dar poate căuta și după cuvintele cheie. Practic însă, nu există diferențe între cele două metode: aproximativ primele 40 de rezultate sunt identice. Termenii de căutare se introduc în engleza literară, fără operatori speciali. Motorul de căutare afișează rezultatele în ordinea relevanței (titlul și sumarul documentului), fiind însoțite și de o legătură spre căutarea altor documente similare. Astfel, trierea rezultatelor se face mai rapid, fără introducerea de noi termeni. Dacă doriți, puteți modifica ordinea de afișare, după sit. Acest lucru îl puteți realiza însă doar după ce căutarea în ordinea relevanței s-a încheiat. Macheta de rafinare a căutării păstrează termenii inițiali. Căutarea în Usenet a fost îmbunătățită, oferind acum, pe lângă subiectul și autorul articolului, și data în care articolul a fost expediat, împreună cu numele grupului de știri.

Infoseek Guide

Infoseek Guide a fost îmbunătățit radical, permițând acum căutarea pe Web, Usenet, după cuvinte cheie sau conținut. De asemenea, se poate căuta în baza de date proprie după un anume cuprins. Acest lucru înseamnă obținerea mai rapidă a rezultatelor. Infoseek Guide afișează doar primele 100 de documente găsite. Pentru celelalte, este necesară înscrierea la serviciul Infoseek Professional, care nu este gratuit. Implicit, Infoseek Guide caută pe Web după cuvintele cheie și frazele furnizate. Puteți include sau exclude un termen. Afișarea rezultatelor se face în ordinea relevanței, oferind titlul, URL-ul, sumarul documentului, dimensiunea și data fișierului și scorul obținut. Dacă nu găsiți imediat ceea ce căutați, puteți apela la căutarea avansată, după criterii suplimentare. Însă, punctul forte al Infoseek este căutarea pe Usenet. El oferă titlul articolului, numele expeditorului, primele rânduri din articol, precum și o legătură spre grupul de știri unde a fost expediat articolul. Infoseek Guide găsește articolul, după care oferă o legătură spre toate grupurile unde a fost expediat.

Lycos

Lycos este bine cunoscut ca fiind o unealtă puternică de localizare a informației pe Web, ușor de utilizat. Doar scrieți câteva cuvinte cheie și Lycos vă oferă rezultatele sortate în ordinea relevanței. Pentru aceasta, Lycos asociază documentelor un scor (între 0,0 și 1,0). Este posibilă și stabilirea unui prag minim de termeni care trebuie să coincidă cu cuvintele cheie ale documentelor. Fără să schimbați setările, Lycos oferă titlul (cu legătură), sumarul și URL-ul pentru fiecare pagină afișată. Există și opțiunea de căutare într-un anumit set de rezultate, pe baza unor cuvinte cheie suplimentare. Unul din neajunsurile motorului de căutare este ignorarea cuvintelor de genul and, new etc. Astfel, dacă precizați cuvintele cheie "new york", în lista rezultatelor vor predomina legăturile spre informație despre York, Anglia, nicidecum despre orașul New York. Desigur că se poate ocoli problema, alegând cuvintele cheie "York City", dar ...

Index.ro

Index.ro este un motor de căutare pentru România, încă (de multișor) în fază de testare, aparținând firmei DNT Timișoara. Cu o interfață extrem de simplă, este ușor de utilizat. Cunoaște operatorii logici AND, OR și NOT, precum și parantezele rotunde, folosite în scopul ordinii de evaluare a expresiilor care, implicit, este de la stânga spre dreapta. Motorul caută doar pe Web, oferind maxim 250 de rezultate. Acestea sunt afișate în ordinea relevanței, oferind informații despre dimensiunea și ultima actualizare a fișierului, evident cu o legătură spre acesta. Nu are unelte de căutare avansată sau de rafinare a rezultatelor obținute și nici o metodă prin care utilizatorii sa-și poată promova propriile pagini. În schimb, este rapid, dar asta și din cauza domeniului restrâns de căutare. Sperăm ca pe viitor acest motor să fie echipat cu toate instrumentele necesare pentru o căutare eficientă.

Search.ro

Un alt motor de căutare pentru România este Search.ro. El oferă trei servicii de căutare: documente generale Web, pagini ale mediei românești și firme din România (pagini galbene). Suplimentar, oferă și interogări / adăugări într-o bază de date proprie pentru cerere și ofertă de produse și servicii. Căutarea se face ușor, motorul oferind maxim 150 de rezultate pe care le afișează în ordinea relevanței acestora (doar titlu și URL). Nici acest motor nu oferă mecanisme de căutare avansată sau triere a rezultatelor, după cuvinte cheie suplimentare. Despre promovarea paginilor, nu mai spun nimic. Poate aveți mai mult noroc.


BYTE România - iulie 1998


(C) Copyright Computer Press Agora