Archivi tag: identificativi

CBL e ricerca su Wikipedia

Il Catalogo delle Biblioteche Liguri – CBL, nella visualizzazione completa della scheda, accanto al nome dell’autore mostra un link alla voce corrispondente su Wikipedia quando una corrispondenza viene trovata (è un processo automatico), ma non è difficile notare che talvolta l’autore individuato su Wikipedia non è in realtà quello del catalogo.

E’ un problema noto da tempo ma finora non è stato possibile risolverlo: si verifica sia quando nel CBL e su Wikipedia ci sono persone diverse con nome identico, sia anche quando non c’è un nome identico e il nome presente nel CBL corrisponde ad una parte di quello presente su Wikipedia. Ad esempio, nel CBL c’è Mario Rossi, in Wikipedia non c’è, ma c’è invece Mario Baciccia Rossi, che è quello che viene recuperato. Talvolta si tratta del nome completo della stessa persona, altre volte invece si tratta di qualcuno che non c’entra.

Sono limiti che derivano principalmente dalla ricerca per nome, che per sua natura non è univoca.

La soluzione sarebbe gestire la corrispondenza tra i cataloghi e wikipedia non tramite il nome ma tramite l’identificativo, cosa per cui Wikipedia ha molto interesse: per molti nomi, anche se non tutti, Wikipedia registra uno o più identificativi (ad esempio per Giuseppe Verdi ce ne sono ben sette), tra cui anche il VID assegnato in SBN.

Con gli identificativi errori di questo genere non ce ne sarebbero, perché si vedrebbe che gli omonimi non hanno lo stesso identificativo: anche noi però dovremmo modificare il programma in modo da utilizzarli per la ricerca, una cosa che in questo momento non possiamo fare per mancanza di risorse economiche.

La logica di funzionamento del programma potrebbe essere la seguente: recupera il nome con lo stesso identificativo; se non trovi l’identificativo, cerca il nome, ma recuperalo solo se è privo di identificativo (se c’è lo stesso nome con identificativo diverso si presume che si tratti di un omonimo).

Attualmente SBN, a differenza di Wikipedia, gestisce un solo tipo di identificativo autore, cioè il VID, cosa che limiterebbe l’efficacia della ricerca. Per questo e per altri scopi sarebbe utile poterne trattare anche altri, quanto meno quello del VIAF (http://www.viaf.org/) , speriamo che presto sia possibile.

Cos’è un permalink

Poiché recentemente mi è capitato di dare informazioni su cosa sono i permalink, ho pensato che potrebbe essere utile condividerle anche qui sul blog.

Un permalink è semplicemente un link permanente, ossia un link che è sempre uguale indipendentemente dal software utilizzato per la gestione del servizio (un opac o altro) e dalle azioni che ha fatto l’utente.

Ad esempio, supponiamo di andare su http://www.catalogobibliotecheliguri.it/ e di fare una ricerca per autore per Howard Phillips Lovecraft. Andiamo poi a vedere la lista dei risultati e visualizziamo la scheda di completa di uno qualunque di essi, ad esempio il seguente:

Lovecraft, H. P.

Kadath / Howard P. Lovecraft

Roma : Compagnia del giallo, Gruppo Newton, 1994

Monografia – Testo a stampa [RAV0286422]

Osservando l’indirizzo che compare nella barra del browser quando visualizziamo la scheda completa di questo record vediamo il seguente:

http://www.catalogobibliotecheliguri.it/opaclib/opaclib?db=solr_cbl&rpnquery=%40attrset+bib-1+%40and+%40and++%40attr+1%3D1002+%40attr+4%3D2+%22howard%22++%40attr+1%3D1002+%40attr+4%3D2+%22phillips%22++%40attr+1%3D1002+%40attr+4%3D2+%22lovecraft%22&select_db=solr_cbl&totalResult=92&nentries=1&format=xml&rpnlabel=+Autore+%3D+howard+phillips+lovecraft+%28Parole+tutte%29+&resultForward=opac%2Fcbl%2Ffull.jsp&searchForm=opac%2Fcbl%2Favanzata.jsp&do_cmd=search_show_cmd&saveparams=false&fname=none&from=21

Possiamo anche memorizzare questo indirizzo, ma nulla garantisce che in futuro continui a funzionare, perché una versione nuova del programma utilizzato sul sito, o a maggior ragione l’introduzione di un nuovo programma potrebbero comportare un url diverso. Non solo, ma possiamo notare che questo url contiene dei riferimenti alla sessione di lavoro dell’utente: l’ultimo parametro (from=21) fa riferimento al fatto che il record è nella posizione 21 nella lista dei risultati, cosa che ovviamente dipende dalla ricerca che è stata fatta. Nel nostro caso, l’url funziona anche fuori contesto perché i parametri non pertinenti vengono ignorati, ma con altri programmi non è così e l’url è inutilizzabile fuori dalla sessione di ricerca.

Il permalink invece è un indirizzo, a cui si cerca di dare la struttura più semplice possibile, che fa sempre e direttamente riferimento ad un certa entità, e rimane lo stesso a tempo indefinito indipendentemente dal contesto. L’entità indirizzata dal permalink può essere una scheda bibliografica, una immagine, un file musicale, la scheda di autorità di un autore, un articolo in vendita in un negozio online o qualunque altra cosa.

Il nostro opac CBL ha dei permalink della forma http://bid.catalogobibliotecheliguri.it/<identificativo> , ad esempio per questo particolare record http://bid.catalogobibliotecheliguri.it/RAV0286422, dove l’identificativo è il BID per i dati SBN mentre viene costruito nel CBL per gli altri (e quindi non ha significato al di fuori del CBL stesso).

Si può dire che un permalink svolga completamente la sua funzione se utilizza un identificativo riconosciuto, in modo da essere facilmente prevedibile non solo nell’uso manuale ma anche nell’elaborazione automatizzata. Ad esempio, se qualcuno avesse una lista di 100.000 bid SBN e volesse verificare se sono presenti nel CBL, conoscendo la struttura del permalink potrebbe facilmente produrre un programma che li controlla uno per uno, cosa non possibile con identificativi puramente locali.

Un permalink non funziona per magia: bisogna che ci sia sul server un programma in grado di interpretare il permalink e recuperare il dato corrispondente, e bisogna che chi gestisce l’opac o qualche altro servizio che fa uso dei permalink abbia cura di fare in modo che esso rimanga sempre valido anche quando cambia il programma utilizzato. Noi prima o poi certamente sostituiremo l’attuale software di gestione del CBL (anche se questo al momento non è in programma), ma tra le specifiche del nuovo programma dovremo includere il supporto dei permalink nella loro forma attuale.

Nulla vieta che per uno stesso contenuto ci siano diversi permalink, cosa che si giustifica in particolare quando vengono utilizzati diversi tipi di identificativo.