You are on page 1of 25
Elementos, actividades y criterios para la identificacién, comprensi6n y seleccion de conceptos en la indizacion analitica Miguel Angel Esteban Navarro Universidad de Zaragoza 0.1. Resumen Descripcién de la naturaleza de tos elementos léxico-conceptuales que se uti- lizan para la indizacién analftica de documentos textuales: los identificadores del contenido (materia, concepto y término), los empleados para la comprensién del significado de éstos (faceta y campo) y los usados para su expresién (términos de indizacién). A continuacién, se exponen las actividades que se realizan para la identificacién, comprensién, seleccién y expresién de las unidades de informa- cién que contiene el documento. Se presenta como Ia tarea central ef disefio y uso. de partillas de indizacién construidas sobre la base del andlisis de las facetas que caracterizan a un conjunto de materias relacionadas entre sf. Se discuten los cri- terios que ayudan a decidir que conceptos entre los identificados se deben repre- sentar, los cuales s¢ presentan vinculados por parejas, condiciondndose entre sf: exhaustividad y profundidad, especificidad y precisién, relevancia y pertinencia y coherencia y consistencia. Por ultimo, se defiende, por extenso, la necesidad de raantener la indizaci6n analitica controlada por un lenguaje documental construi- do de acuerdo con principios cientificos, como alternativa a los sistemas automa- tizados de indizacién por unitérminos para algunos tipos de documentos, porque su desaparicién puede provocar el colapso del ciclo de informacién documental (Autor). Palabras clave: Indizacién analitica. Concepto. Faceta. Andlisis de facetas. Exhaustividad. Profundidad. Especificidad. Precisién. Relevancia. Pertinencia. Coherencia. Consistencia. Indizacién automética por unitérminos. Lenguajes documentales. 0.2. Abstract Description of the nature of lexical and conceptual elements for the analyti- cal indexing of textual documents: the identifiers of content (subject, concept and Organ. conoc. sist. inf, doc. 3 (1999) 69-93 70 Miguel Angel Esteban Navarro term), the ones employed for the understanding of those (facet and field), and the others employed for its expression (indexing terms). Next, the activities for the identification, understanding, selection and expression of the information units of the document are expossed. The principal task is the design and the use of inde- xing grilles, developed from the faceted analysis of a group of subjects. The cri- teria for the determination of the concepts to represent are discussed, which are coupled in pairs but in relation between they: exhaustivity and depht, specificity and precision, relevance and aboutness, coherence and consistency. Finally. defence of the need of analytical indexing controlled by an indexing language builded with scientific principes, like cption of the automatic uniterm indexing systems for some classes of documents, because its missing could crash the docu- mentary information life cycle (Author). Keywords: Analytical indexing. Concept. Facet, Faceted analysis. Exhaustivity. Depth. Specificity. Precision, Relevance. Aboutness. Coherence. Consistency. Automatic uniterm indexing. Indexing languages. 1. Concepto de indizacion La indizacin consiste en un proceso destinado a identificar y a describir 0 caracterizar el contenido informativo de un documento mediante la extraccién y la seleccién de las materias sobre las que versa (indizacién sintética) o de los con- ceptos presentes (indizacién analitica) para su expresi6n mediante unos términos de Ja lengua natural y su reunién en un fndice, con objeto de permitiza posteriori la recuperacién de ese documento de! seno de una coleccién documental o de un conjunto de referencias documentales como respuesta a una demanda acerca del tipo de informacién que contiene. Es decir, la indizaci6n tiene como objetivo la representacion del contenido de los documentos que forman parte de un conjun- to para garantizar su eficaz. recuperacién durante el proceso de bisqueda en ese grupo, por lo que se trata de una técnica fundamental de la cadena documental, ya que afecta por igual a la fase de andlisis y a la de salida. El concepto de indi- zacidn se construye, por tanto, a partir del examen tanto de las actividades que se realizan durante el ejercicio de esta técnica, como de su funcién en un sistema de informacién documenta]. El cumplimiento de esa funcidn exige que la seleccién de los términos de indizacién durante el andlisis de los documentos se efecttie siguiendo dos crite- ios: en primer lugar, como dominante, la adecuacién al contenido informativo del documento, por lo que los términos’de indizacién deben ser precisos, apro- piados y exhaustivos; y, en segundo lugar, como secundaria pero también pre- sente, las necesidades informativas del sistema documental en el que se realiza y a las que los documentos conservados deben dar satisfaccién. Organ. conoe. sist. inf. doc. 3 (1999) 69-93 71 Identificacién, comprensién y seleccién de conceptos en la indizacién... Asimismo, la expresiGn de los términos de indizacién se puede realizar de modo libre o haciendo uso tnicamente de una lista de yocablos autorizados fija- dos a priori, con objeto de conseguir sobre la base del empleo de idénticas expre- siones una coherencia entre los procesos de representacién y de inter-ogacién del catélogo, garantizando, de este modo, una adecuada recuperacién de Ja informa- cidn pertinente que contiene una coleccidn. Bs decir, se observa que se obtienen mejores resultados durante la recuperacién cuando las demandas de los usuarios se pueden traducir a términos similares 0 iguales a los empleados durante la representacién. La existencia de ese vocabulario auxiliar, denominado habitual- mente lenguaje documental, también reduce el riesgo siempre presente de la sub- jetividad durante la indizacién y, por tanto, su negativa consecuencia de pérdida de coherencia cuando actdan miltipies indizadores en un mismo conjunto de documentos. 2. Elementos léxico-conceptuales de Ja indizacién Centréndonos en el caso de la indizacién analitica de documentos textuales, para su ejercicio se emplean varios elementos léxico-conceptuales distribuidos en tres grupos, de acuerdo con su mision, que tienen su razén de ser en la propia naturaleza del texto: Ios identificadores del contenido, los gue se emplean para la comprensi6n del significado y los que se utilizan para su expresi6n en un sistema documental. 2.1. Elementos para la identificacién del contenido de Ios documentos El contenido de un documento se compone de una serie de unidades de infor- macién dotadas de una mayor o menor complejidad intema y en profunda inte- rrelacién entre ellas, que se traducen en otros tantos niveles y elementos de infor- macién a identificar y representar durante e] tratamiento documental. Basicamente, el contenido de un documento se puede reducir en un primer nivel ala presencia de una o varias materias, !as cuales poseen una naturaleza com- puesta y relacional formada por un tejido de conceptos que se expresan median- te la lengua en forma de términos, Bl documento se puede comparar a un objeto compuesto de materiaies (materias) diversos formados por moléculas (concep- tos) que se componen de dtomos (términos) que a su vez poscen elementos atd- micos (lexemas). Por consiguiente, la identificacién del contenido de un documento se reduce al descubrimiento de la naturaleza y las caracteristicas concretas que adoptan en ese documento los elementos que componen cada uno de esos tres niveles de sig- nificado. Segtin el nivel de representacién en el que se actiie se realizard un tipo u otro de indizacién: indizacién sintética si se detiene en las materias, indizacién Organ. conoe. sist. inf. doc. 3 (1999) 69-93 72 Miguel Angel Esteban Navarro analitica si profundiza hasta los conceptos e indizacién automatica por unitérmi- nos si es un ordenador quien extrae términos. La materia de un documento no se debe considerar una unidad simple, uni- dimensional y estable, sino que si consiste, de acuerdo con la norma UNE 50- 121-91, en “cualquier concepto o combinacién de conceptos que representa el tema de un documento» y el conjunto de sus relaciones, estamos ante una reali- dad compleja cuya plena identificacién y comprensidn exige atender durante su andlisis a su capacidad para transmitir el conglomerado de conceptos que forma el contenido de un documento. Asimismo, Ia materia de un documento, segtin indica Langridge (1992, p. 74-75) parafraseando a Ranganathan, consiste en el asunte 0 los asuntos de Ios que trata ese documento mas la forma del coneci- miento desde la que son tratados; entendiendo por asunto aquelio de io que se ocupa un documento o, de modo mas preciso, esa parte de la materia que adopta la expresion de fenémenos y relaciones. En definitiva, la materia de un docu- mento no se puede considerar atendiendo unicamente a su naturaleza intrinseca, observada como algo ajeno al documento en el que se encuentra o encarna, sino que su plena comprensién exige, en primer lugar, desvelar la relacién dinémica que los diverses asuntos, expresados por los conceptos, establecen dentro de un documento, ya que de esa relacidn se derivan modificaciones de significado; y, en segundo lugar, atender al ambito disciplinar en que se sittia el documento y la perspectiva desde !a que ¢] autor aborda la construccién del discurso. Un concepto es una representacién mental de una parte de la realidad fisica © intelectual, que se construye a partir de la atribucién, extraccidn y abstraccién de una serie de caracteres comunes a un conjunto de objetos o fenémenos indivi duales, para formar una unidad de pensamiento que se expresa mediante un tér- mino compuesto de una 0 varias palabras u otro simbolo no lingiifstico, como las expresiones gréficas (por ejemplo, una sefial de tréfico). El concepto es tanto el resultado de un proceso de comprensién y representacién de la realidad como el elemento basico para expresar y comunicar esa comprensién. Pero los conceptos no aparecen come entidades aisladas en el sistema cognitivo humano —y, por tanto, tampoco se muestran asi en los documentos que conservan y transmiten el conocimiento—, sino que poseen una elevada capacidad intrinseca de relacio- narse y de agruparse entre si, formando, ¢ modo de redes 0 de mosaicos de tese- las, unos conjuntos denominados campos seménticos, que a su vez se articulan en tomo a unos macroconceptos, donde las relaciones adoptan la forma de relacio- nes de significado. Un concepto consiste, basicamente, en una unidad de conoci- miento estructurado que se materializa en un contexto concreto. Por consiguien- te, el contenido de un concepto sélo se puede establecer de mode preciso mediante el descubrimiento de sus relaciones con otros conceptos en él seno de un campo. Organ. conoc. sist. inf. doc, 3 (1999) 69-93

You might also like