Index d’arxius i actualització
“Un
índex és una llista de paraules o frases ( ' encapçalats ' ) i indicadors
associats , que permet la ubicació de material a l' interior d'un llibre, d'una
publicació,d’arxius, etc.”
INDEXS D´ARXIU
La indexació té per objectiu crear les referències del
document que permiten la seva recerca
posterior. Aquestes referències s' emmagatzemen en fitxers.
La indexació es fa per mitjà dels anomenats
llenguatges d’indexació. N’hi ha de dos tipus:
• Llenguatges lliures.
• Llenguatges controlats.
1) Llenguatges lliures
Els llenguatges lliures poden estar formats per les
llistes de paraules clau i els descriptors lliures.
Llista de paraules clau:
És una col·lecció de paraules rellevants, extretes automàticament
per l’ordinador, del títol, del resum o bé del text complet del document. En
aquest procés s’exclouen les paraules sense significació, com ara articles,
preposicions, etc., també denominades paraules buides.
Queda clar que la llista de paraules clau és més fàcil
d’obtenir, ja que la fa automàticament l’ordinador, però comporta gestionar un
enorme volum d’informació, i la qualitat del resultat és inferior, ja que no hi
ha cap relació entre les paraules (sinònims); per tant, l’usuari que vulgui
cercar la informació ha de preveure tots els sinònims possibles dels conceptes
que li interessin, en el context de
la seva recerca. A més, com que una paraula pot tenir
diferents significats en funció del context, una recerca pot donar, a més dels
resultats desitjats, d’altres que no tenen res a veure amb el context de la
consulta.
Descriptors lliures:
Són una col·lecció o llista de conceptes extrets del
contingut
del document o que hi tenen relació mitjançant una
operació intel·lectual, és a dir, procedent de l’anàlisi del document per una
persona qualificada (el documentalista).
2) Llenguatges controlats
En aquests tipus de llenguatge, les paraules o
conceptes que serveixen per indexar un document formen part d’una llista
construïda prèviament.
És a dir, que abans de començar a indexar documents,
es crea una col·lecció o llista de conceptes o paraules en la qual ens haurem
de basar per indexar el document.
Quan la llista prèvia de descriptors no està
estructurada, és a dir, no es preveuen mecanismes de relació entre els
diferents elements de la llista, s’anomena llista d’autoritat. Per exemple, una
llista d’autors.
Quan, en canvi, la llista prèvia està estructurada, és
a dir, entre els diferents elements hi ha mecanismes de relació (relacions
d’equivalència, de jerarquia i d’associació), s’anomena tesaure. Seria el cas
d’un diccionari ideològic.
En resum, un descriptor és la llista de paraules o
expressions que pertanyen al llenguatge controlat. De tota manera, per extensió,
i tot i que no és gaire correcte, també s’anomenen descriptors les dels
llenguatges no controlats (llistes de paraules clau i descriptor lliure), que
hem vist abans.
Index d’arxius digitals
Taula comparativa del diferents métodes de indexació
Indexació manual
|
Indexació social
|
Indexació automàtica
|
|
Complexitat
|
Baixa
|
Mitjana
|
Alta
|
Inversió de temps
|
Alta
|
Mitjana
|
Baixa
|
Fiabilitat
|
Mitjana
|
Alta
|
Baixa
|
No hay comentarios:
Publicar un comentario