Guida alla ricerca

La ricerca

La base dati contiene schede relative a cantate e arie manoscritte e a stampa composte in un periodo che va dal 1620 circa ai primi anni dell'Ottocento. Le unità bibliografiche vengono catalogate nella loro interezza, includendo l'eventuale presenza di altre tipologie di composizioni: musica sacra, musica strumentale, composizioni polifoniche.

I risultati della ricerca vengono presentati in ordine di rilevanza, calcolata sul numero di occorrenze dei termini ricercati negli indici prodotti dall'elaborazione delle schede. Le occorrenze in alcuni indici (titolo, autore, incipit) hanno peso maggiore rispetto ad altri (note, segnatura, ecc.), secondo i valori riportati in fondo a questa pagina.

Come vengono indicizzati i testi

Prima di essere inseriti negli indici, i testi delle schede attraversano una serie di elaboratori che effettuano in sequenza:

  • normalizzazione di maiuscole, minuscole e lettere accentate;
  • separazione di parole unite da apostrofo o altra punteggiatura (tokenizing);
  • scarto delle parole più corte di due caratteri;
  • scarto delle parole non significative per la ricerca: articoli determinativi, indeterminativi e partitivi (stop words); le preposizioni non vengono scartate;
  • riconduzione delle parole rimaste alla loro forma radice tramite stemming, utilizzando l'algoritmo Snowball (libreria wamania/php-stemmer).

Ricerca semplice

Come impostazione standard la ricerca viene effettuata su tutti gli indici contemporaneamente, cercando tutte le parole della stringa con operatore booleano AND, in qualsiasi ordine siano state inserite.

Lo stemming fa sì che la ricerca sia per radice della parola: cercando mortali i risultati includeranno anche mortale e mortal; cercando partir si troveranno schede contenenti parti, parte, partite, parto, partia, partirai, parta, oltre a partir.

Cercando ad esempio legrenzi rigide orme si trova la scheda della cantata di Giovanni Legrenzi "Aureo serto real sei pur pesante", che contiene nel suo testo i versi "Poiché con rigid'orme / Le calpesta i pensier sogno tremante".

Cercando gli orologi reale achille si trova la cantata di Giovanni Legrenzi "O grandezze reali", con titolo d'opera "Orologio siete voi", riferita a un'opera con appellativo "Achille in Sciro".

La ricerca per parte iniziale di parola non è attiva al di là dello stemming: se la radice della parola orologio è orolog, la ricerca per orologio, orologi o orolog produrrà gli stessi risultati, mentre la ricerca per orol non darà risultati.

Ricerca avanzata

Il modulo di ricerca avanzata permette di restringere la ricerca a uno o più indici specifici. Si possono combinare fino a cinque criteri, ognuno applicato a un indice scelto fra:

  • Tutti i campi — ricerca semplice estesa a tutti gli indici;
  • Titolo dell'opera — titolo uniforme dell'opera collegata;
  • Titolo proprio — titolo come appare sul documento (titolo diplomatico);
  • Testo poetico — trascrizione del testo e incipit;
  • Persona collegata — qualsiasi ruolo (compositore, autore del testo, dedicatario, possessore, esecutore, copista, ecc.), comprese le forme varianti dei nomi;
  • Organico — descrizione in linguaggio naturale di voci e strumenti;
  • Biblioteca — sigla RISM della biblioteca di possesso;
  • Segnatura — collocazione del documento;
  • Note — note generali della scheda;
  • Filigrana — descrizione della filigrana.

I criteri inseriti in righe diverse vengono combinati con AND (tutti i criteri devono essere soddisfatti). Anche all'interno di un singolo criterio, se si inseriscono più parole, queste sono combinate in AND.

Modifica della ricerca attiva

Quando i risultati di una ricerca sono visualizzati, in cima alla pagina compaiono i filtri attivi sotto forma di etichette. Ogni etichetta riporta il nome dell'indice e il termine ricercato. Cliccando l'icona "✕" si rimuove quel singolo criterio mantenendo gli altri. Il link "Modifica ricerca avanzata" riporta al form di ricerca avanzata con tutti i criteri attuali precompilati, per modificarli e rilanciare la ricerca.

Rilevanza dei campi (valori di boost)

Quando un termine di ricerca viene trovato, il suo peso nel calcolo della rilevanza dipende dall'indice in cui compare. I valori di "boost" applicati sono:

IndiceBoost
Titolo dell'opera21
Autore dell'opera13
Autore dell'opera, forme varianti del nome8
Incipit testuale8
Titolo diplomatico sul documento5
Trascrizione del testo poetico5
Organico analitico5
Persona collegata alla scheda5
Persona collegata, forme varianti del nome5
Curatore della scheda0.5
Tutti gli altri indici1

Funzionalità in corso di sviluppo

Sono in fase di implementazione le seguenti funzionalità:

  • Ricerca esatta: racchiudendo una stringa tra virgolette si forzerà il rispetto dell'ordine delle parole;
  • Ricerca negativa: premettendo il segno meno (−) a una parola, le schede che la contengono saranno escluse dai risultati;
  • Ricerca su forme grafiche varianti: la ricerca per "pietà" troverà anche "pietade", "core" troverà "cuore", e così via;
  • Faccette: filtri a lato dei risultati per tipo documento, tipo scheda, datazione, paese, presentazione della musica, organico sintetico;
  • Elenchi di autorità: navigazione diretta degli authority files per autori, opere, biblioteche, filigrane e bibliografia.