jueves, 10 de abril de 2014

1.1.3 Índex d'arxiu: actualització

Index d’arxius i actualització

“Un índex és una llista de paraules o frases ( ' encapçalats ' ) i indicadors associats , que permet la ubicació de material a l' interior d'un llibre, d'una publicació,d’arxius, etc.”



INDEXS D´ARXIU

La indexació té per objectiu crear les referències del document que permiten la seva recerca posterior. Aquestes referències s' emmagatzemen en fitxers.

 La indexació es fa per mitjà dels anomenats llenguatges d’indexació. N’hi ha de dos tipus:
• Llenguatges lliures.
• Llenguatges controlats.

1) Llenguatges lliures

Els llenguatges lliures poden estar formats per les llistes de paraules clau i els descriptors lliures.

Llista de paraules clau:




És una col·lecció de paraules rellevants, extretes automàticament per l’ordinador, del títol, del resum o bé del text complet del document. En aquest procés s’exclouen les paraules sense significació, com ara articles, preposicions, etc., també denominades paraules buides.
Queda clar que la llista de paraules clau és més fàcil d’obtenir, ja que la fa automàticament l’ordinador, però comporta gestionar un enorme volum d’informació, i la qualitat del resultat és inferior, ja que no hi ha cap relació entre les paraules (sinònims); per tant, l’usuari que vulgui cercar la informació ha de preveure tots els sinònims possibles dels conceptes que li interessin, en el context de
la seva recerca. A més, com que una paraula pot tenir diferents significats en funció del context, una recerca pot donar, a més dels resultats desitjats, d’altres que no tenen res a veure amb el context de la consulta.
  Descriptors lliures:



Són una col·lecció o llista de conceptes extrets del contingut
del document o que hi tenen relació mitjançant una operació intel·lectual, és a dir, procedent de l’anàlisi del document per una persona qualificada (el documentalista).

2) Llenguatges controlats


En aquests tipus de llenguatge, les paraules o conceptes que serveixen per indexar un document formen part d’una llista construïda prèviament.
És a dir, que abans de començar a indexar documents, es crea una col·lecció o llista de conceptes o paraules en la qual ens haurem de basar per indexar el document.
Quan la llista prèvia de descriptors no està estructurada, és a dir, no es preveuen mecanismes de relació entre els diferents elements de la llista, s’anomena llista d’autoritat. Per exemple, una llista d’autors.
Quan, en canvi, la llista prèvia està estructurada, és a dir, entre els diferents elements hi ha mecanismes de relació (relacions d’equivalència, de jerarquia i d’associació), s’anomena tesaure. Seria el cas d’un diccionari ideològic.
En resum, un descriptor és la llista de paraules o expressions que pertanyen al llenguatge controlat. De tota manera, per extensió, i tot i que no és gaire correcte, també s’anomenen descriptors les dels llenguatges no controlats (llistes de paraules clau i descriptor lliure), que hem vist abans.

Index d’arxius digitals

Taula comparativa del diferents métodes de indexació


Indexació manual
Indexació social
Indexació automàtica
Complexitat
Baixa
Mitjana
Alta
Inversió de temps
Alta
Mitjana
Baixa
Fiabilitat
Mitjana
Alta
Baixa

No hay comentarios:

Publicar un comentario