Caratteristiche dei dati e dei motori di ricerca
- Per usare al meglio il programma di ricerca è utile conoscere il criterio di indicizzazione, con cui vengono riconosciuti e normalizzati i termini (parole, abbreviazioni e numeri) sia durante la fase di preparazione dell’opera in formato digitale, sia durante l’analisi delle espressioni di ricerca.
- Nella fase di indicizzazione l’intera opera viene scandita considerando come parole tutte le sequenze di lettere e numeri comprese fra: spazio, apostrofo, / (barra), – (trattino) e fine paragrafo e vengono scartati tutti i codici che non siano lettere dell’alfabeto maiuscole o minuscole, cifre, virgola. I termini così individuati vengono posti nell’indice attraverso un filtro di normalizzazione: le maiuscole sono trasformate nelle corrispondenti minuscole, gli accenti e i segni diacritici vengono eliminati, le virgole vengono eliminate se a fine parola; tutti gli altri codici vengono ignorati. Nella fase di ricerca il programma adotta un sistema di normalizzazione dei termini inseriti dall’utente in modo simile al programma di indicizzazione. Si noti che in questo modo i punti interni alle sigle vanno sempre omessi nell’espressione di ricerca (per cercare OO.PP., è necessario digitare OOPP o oopp).
- Le varie parti dell’opera sono presenti nella versione digitale come serie di unità elementari consultabili o documenti. La parte principale è costituita dalle singole voci. Come documenti accessori sono inoltre presenti alcuni documenti di supporto alla consultazione dell’opera o di approfondimento sull’uso della lingua. I documenti accessori possono essere consultati usando la linguetta Indice generale ma non attraverso la ricerca, poiché non sono indicizzati.
- Ogni documento è strutturato al proprio interno in varie aree (o campi) che possono essere oggetto di ricerche specifiche attraverso la Ricerca avanzata. Per esempio: lemma, etimologia, definizione, esempio, ecc.
- Mediante Ricerca avanzata è possibile indicare in quale area della voce (ovvero in quale campo) si intende effettuare la ricerca. L’Area del documento deve essere indicata prima di digitare la parola da cercare. L’inserimento del prefisso che identifica l’Area del documento può essere effettuato in ciascuno dei campi di ricerca e ha il sopravvento su di esso.
- Il programma di interrogazione estrae dall’insieme delle voci dell’opera solo i documenti il cui contenuto soddisfa le condizioni espresse mediante le ricerche.
- Un semplice linguaggio consente all’utilizzatore di formulare delle espressioni di ricerca. In esse si indicano al programma le parole, le relazioni che devono esistere fra loro, le aree del documento in cui devono essere presenti per soddisfare la ricerca.
- Il caso più semplice e frequente è la ricerca della parte principale di ogni singola voce, ovvero la ricerca del documento che contiene nel campo Lemma la parola cercata. In una ricerca più sofisticata si può voler cercare un unico documento in cui compaiano contemporaneamente più parole. Si può poi ulteriormente restringere la ricerca alla presenza di due o più parole all’interno di una medesima area del documento.
- La formulazione delle espressioni di ricerca avviene digitando entro campi predisposti i termini da cercare ed eventualmente gli operatori di relazione fra loro.
- Non è necessaria una conoscenza approfondita degli operatori e della sintassi. Il compito è facilitato dall’indicazione delle aree del documento, che indirizzano automaticamente la ricerca. Le Ricerche predefinite e indici costituiscono ulteriori ausili di facile impiego.