miércoles, 28 de noviembre de 2007

CONCEPTOS y DEFINICIONES

Un descriptor es cada uno de los términos o expresiones escogidos entre un conjunto de sinónimos o cuasi sinónimos para representar (en calidad de término preferido) generalmente de manera unívoca, un concepto susceptible de aparecer con cierta frecuencia en los documentos indizables, y en las consultas que se realicen. El descriptor corresponde normalmente a la etiqueta de un concepto, y es la unidad mínima de significado que integra un tesauro o una lista de descriptores. Suele acompañarse de una nota de alcance o, menos usualmente, de una definición en los casos que el mero registro del término puede provocar problemas de ambigüedad en su interpretación. El descriptor es el término por el cual efectivamente se indizará (por eso se llama también término de indización), y por el cual se recuperarán los documentos referidos a su temática. ( http://es.wikipedia.org/wiki/Tesauro)

  • El resumen como prototipo

    La razón de ser obedece principalmente a la necesidad de identificar el contenido documental, de forma rápida y fiable. Son muchos los científicos y profesionales los que confían en esta herramienta para el desarrollo de su trabajo.

    El protagonismo de los resúmenes se hace notar, ante una sociedad llena de cambios tecnológicos y constantes aumentos de información. Se trata de una herramienta que ofrece información estructura, que con ayuda de los sistemas hipertexto permite crear redes semánticas entre documentos útiles para los avanzados entornos de búsqueda actuales.

    • Definición

      El resumen es un breve texto representativo, autónomo, intencional. Destaca su textualidad, pues no podemos pasar por alto que se trata de un verdadero texto lleno de coherencia y cohesión; su autonomía, o independencia documental con respecto al texto de partida; y su diversidad, pues para un mismo texto se pueden realizar distintos resúmenes dependiendo de los factores de producción y sobre todo del nivel de descripción analítica que se requiera.

    • Objetivos

      La definición de los objetivos documentales, el entorno operativo definido por el tipo de texto a resumir, las características de los posibles usuarios, y las condiciones de trabajo de los resumidores influye considerablemente en el proceso de resumir.

    • Funciones

      Sus funciones más importantes:

      • Indicar: generando un microtexto que indique, es decir suministre indicios sobre el documento que representa.
      • Informar: el resumen se equipara a cualquier otro documento primario, siendo esta su más noble cualidad documental.
      • Sustituir: ahorrando tiempo al usuario en el manejo de información filtrada siendo sustituto del documento original.
      • Orientar: en el entorno electrónico en una doble dirección: 1. como etiquetas metadatos de los documentos electrónicos y 2. como unidades independientes en una red de resúmenes con sus preceptivos hiperenlaces.

      De la importancia concedida a cada uno de estas funciones se desprenderá la estrategia más adecuada para elaborar el resumen.

    • Factores

      Deben ser tenidos en cuenta: documento a resumir, objetivos documentales, resumidor, usuario y tipo de resumen.

      • Documento

        Término polisémico concebido como la acumulación permanente y estable de signos que puede ser explorada libremente, con la doble función de almacenar datos e informar. Es conservador permanente de la información y difusor discrecional de la misma. El desarrollo de la nuevas tecnologías también ha dejado huella en este entorno, obligando a distinguir entre documentos textuales y electrónicos o multimedia. Los documentos textuales, y sobre todo los científicos suelen presentar una estructura lineal -acompañado en ocasiones de gráficos- y una inconfundible metodología OMRC (objetivos, metodología, resultados y conclusiones), que permiten al resumidor (estudiante, investigador,..) sintetizar la información de una forma menos compleja. Los documentos tienen una estructura fija y son algo más complejos al combinar diversas técnicas multimedia (vídeos, imágenes en movimiento, sonido, hipertexto, etc.). Su análisis es muy sofisticado debido principalmente a la diversa naturaleza informativa de los documentos de los que se ocupa, a la yuxtaposición de canales por la que dichas informaciones se transmiten y a la escasa normalización existente en los procesos de descripción y representación documental.

      • Resumidor

        Es el elemento más importante del sistema y de su competencia y habilidades va a depender la calidad de los resúmenes.

      • Usuario / destinatario

        El perfil y las funciones asignadas son factores que condicionan el proceso resumidor. No es lo mismo hacer un resumen para un compañero de clase que para presentar una comunicación a un congreso pues será este el elemento clave para su aceptación o no.

      • El resumen

        Es el recurso de información más solicitado por científicos y profesionales, porque permite de una forma anticipada la consulta o rechazo del original, sin necesidad del acceso directo.

  • Procedimiento

    Aunque la elaboración del resumen supone un proceso único y encadenado de operaciones intelectuales, estableceremos con fines de aprendizaje la siguiente secuencia:

    • Lectura / Comprensión

      La lectura es la toma de contacto entre el estudiante y el texto, operación a través de la cual se consigue una comprensión del significado del documento, identificando los detalles físicos (párrafos, gráficos, títulos, subtítulos, etc.) y cognitivos (ideas principales, secundarias, conclusiones, etc.) que posteriormente serán claves para elaborar el resumen.

      Hay dos tipos de lectura:

      • Lectura rápida: el tiempo estimado es muy breve y se pretende destacar los elementos más importantes del documento: tema principal y secundario, estructura de la información,... Se aconseja resaltar las ideas relevantes bien subrayándolas en el texto o bien redactando un pequeño esquema. La finalidad es obtener una idea general del contenido del documento y comprender la estructura cognitiva del mismo.
      • Lectura estratégica: es una lectura más activa y pausada, deteniéndose en cada párrafo importante, reflexionando sobre las ideas que se han expuesto y analizando aquellos segmentos textuales que concentra una mayor cantidad de información: objetivos, metodología y conclusiones.

      La comprensión de un texto es la representación mental que hacemos de su significado. En este proceso intervienen una serie de variables: conocimientos del lector, datos del texto, contexto, objetivos que se persiguen. Comprender supone captar la estructura del texto e integrar de forma coherente la información nueva en los propios conocimientos y esquemas del que lee.

    • Análisis / Interpretación

      Es todo proceso por el cual se divide un objeto o un documento en sus componentes o fases fundamentales. De la comparación entre los elementos se extraen los rasgos específicos y diferenciadores que permite diferenciar unos de otros.

      El análisis se despliega a través de estas fases
      • Segmentación del texto: se recomienda estratificar la información en párrafos, normalmente los mismos que proporciona el texto del documento.
      • Estrategias de reducción: en cada segmento de texto es conveniente leerlo detenidamente y seleccionar aquella información relevante. De esta manera, la información se reduce considerablemente.
      • Identificación de las ideas principales: algunos documentos ofrecen las denominadas palabras identificativas, tales como en conclusión, como idea principal, por consiguiente, etc., para indicar que a continuación viene una información relevante.
      • Jerarquizar la información: Jerarquizar la información: determinando y organizando las ideas principales y secundarias, con la ayuda de la elaboración de un mapa conceptual.

      La interpretación, es un proceso individualizado y creativo que permite hacer conexiones entre la información procedente de distintas fuentes para ampliar las ideas propias asignando a las palabras y conceptos un determinado significado y generar nueva información.

    • Síntesis / Producción

      Es la fase más compleja del proceso, ya que no se puede someter a ningún criterio normalizador, depende exclusivamente del autor de resumen que pone en juego sus cualidades, habilidades, conocimientos e intereses documentales para sintetizar el contenido del documento original en unas cuantas líneas.

      Una vez seleccionada, interpretada y esquematizada la información relevante del documento se redacta el resumen a modo de texto breve que recoge el contenido esencial del documento original, de forma que al tratarlo no sea necesario recurrir al original. La elaboración de todo resumen estará presidido por los siguientes criterios:

      • Fidelidad, respetando en cada momento el contenido original, no omitiendo partes sustanciales y evitando comentarios personales.
      • Precisión, evitando siempre la redundancia y la repetición
      • Claridad expositiva, utilizando una terminología apropiada, teniendo en cuenta los usuarios y nivel de conocimientos.

  • Normativa
    • ISO 214-1976:

      Documentation Abstracts for publications and documentation enlaza a la pagina oficial ISO, para comprar la norma.

      Esta norma proporciona una breve introducción y un apartado dedicado a definiciones, se centra principalmente en el tratamiento del contenido de los documentos, en la presentación y estilo, finalizando con una serie de ejemplos.

    • UNE 50-103-1990

      AENOR (Asociación Española de Normalización y Certificación), es el organismo español encargado de elaborar las normas españolas. La norma UNE 50-103-1990, es la equivalente a la ISO 214-1976, con la única diferencia de que incluye sus propios comentarios y, propone ejemplos propios.

  • Tipos de resúmenes

    Es difícil determinar una clasificación exhaustiva de los resúmenes, ya que en la práctica los criterios se entremezclan dando lugar a clasificaciones cada vez diferentes, dependiendo de la persona o entidades que se encarguen de producir resúmenes. Proponemos la siguiente clasificación:

    • Densidad informativa

      En física la densidad es una magnitud que pone en relación la masa y el volumen de un cuerpo. En el entorno del resumen documental, la densidad al igual que en física relaciona la cantidad (masa) de información que contiene y el volumen ocupada. Por lo que, las magnitudes profundidad (nivel de descripción) y densidad son directamente proporcionales, de forma que al aumentar una automáticamente aumenta la otra.

      La densidad informativa del resumen lleva consigo la siguiente tipología:

      • Resumen indicativo

        Sirve de alerta al estudiante, anunciándole la existencia del documento y ofreciéndole la información suficiente para que decida si vale la pena iniciar la lectura. Su extensión no suele sobrepasar las 50 palabras por lo que hace de este tipo de resumen una herramienta ideal para aquellos estudiantes que deban resumir un gran número de documentos. En este caso, la densidad informativa y su profundidad son máximas.

      • Resumen informativo

        Su función es la de informar al estudiante sobre el contenido explícito del documento, incluyendo aquella información relevante que en el resumen indicativo no se incluyen. La estructura se basa en el esquema OMRC, esto es Objetivos, Metodología, Resultados y Conclusiones del documento resumido. Su extensión está comprendida entre los 100 y 300, en función de la longitud del documento original. En este caso, la densidad y la profundidad es menor que en el indicativo.

    • Autoría del resumen

      La autoría depende del agente que se encargue de llevar a cabo esta compleja operación, distinguiéndose los resúmenes humanos y resúmenes automatizados.

      Resúmenes humanos, elaborados por:

      • Autor del documento: El autor es el que engendra el documento y por tanto nadie mejor que él para conocer el contenido de la obra. Pero esto presenta distintas desventajas, por un lado a la hora de realizar el resumen ya que una cualidad imprescindible es la objetividad y el autor puede llegar a confundirla y dejarse llevar por ideas o emociones. Por otro lado, el autor de un documento carece a veces de conocimientos y técnicas para llevar a cabo un resumen de calidad. No por ello no deja de ser un resumen útil, principalmente para los profesionales resumidores que les permite avanzar rápidamente sobre el contenido del documento dejándoles sólo las tareas documentales.

      • Experto o especialista: Es aquella persona que se dedica hacer resúmenes del campo en el que es especialista garantizando la imparcialidad que al autor puede costarle más esfuerzo. Este agente flaquea en que desconoce las herramientas documentales para llevar a cabo un buen resumen.

      • Resumidor profesional: Es el que mejor conoce las técnicas de análisis y filtración de información. Pero carece muchas veces de competencias científica en una materia. Las cualidades básicas que distinguen a un buen resumidor son: capacidad de entrega, formación científica específica, observador, conocimiento de técnicas de lectura y de comprensión, y dominio del lenguaje.

      Resúmenes automatizados

      Con el desarrollo de la gran cantidad de documentos digitales, se hace necesario establecer programas que permitan procesar los textos de forma automática. Los métodos automáticos diseñados hasta ahora pretenden actuar de la misma forma que lo haría la mente humana, pero esto no es probable ya que para realizar un resumen se pone en práctica la capacidad cognitiva/intelectual del hombre difícil de plasmar en la herramientas informáticas. Se investiga en programas inteligentes basados en aspectos sociocognitivos de los documentos capaces de especificar las características de legibilidad, precisión y brevedad en sus productos.

    • Ejemplos de resúmenes

  • Forma de presentación de los resúmenes

    Se distinguen dos modalidades de presentar la información, en texto libre y texto estructurado.

    • Resúmenes en texto libre

      Son aquellos que no disponen de una estructura específica en la presentación de información. Se distinguen dos tipos los telegráficos, que presentan la información de una manera concisa y esquemática, se caracterizan por ser rápidos de escribir y de leer. Por otro lado están los resúmenes discursivos, donde la información que se presenta es de forma literaria y amplia.

    • Resúmenes estructurados

      Todos los resúmenes estructurados deben incluir la estructura básica en todo proceso científico: objetivos, metodología, resultados y conclusiones. La forma discursiva está basada en la estructura y el texto que se obtiene se caracteriza por su cohesión.

  • Modo de difusión

    La difusión se basa entorno al medio en que se va a presentar el resumen, bien puede ser en formato papel (bibliográfico) o electrónico.

    • Difusión bibliográfica

      Este modo de difusión es el empleado tradicionalmente antes del desarrollo de las nuevas tecnologías, actualmente se utiliza para publicar el resumen con el artículo científico en las revistas científicas. También se pueden encontrar las revistas de resúmenes que están formadas por el conjunto de resúmenes de los documentos originales analizados, agrupados y estructurados según un plan de clasificación temática preestablecido.

    • Difusión electrónica

      Se caracteriza por el enorme auge que se está produciendo en el mundo electrónico, donde la transmisión de información tiene multitud de vías. De forma que el resumen puede difundirse rápidamente por medio de las bases de datos, las revistas electrónicas, internet, etc. Su mayor cualidad es que se le pueden agregar hiperenlaces dando lugar a una cadena continuada de pequeños resúmenes denominados microtextos interactivos.

  • Automatización

    El auge electrónico en todas las ramas de la ciencia ha supuesto un gran cambio en el entorno profesional, aunque existen procesos documentales como RESUMIR que se resisten a la automatización, debido a la dificultad de conferir a un ordenador mediante reglas y algoritmos procesos y estrategias cognitivas individuales. Por fortuna para los resumidotes, resumir sigue siendo una tarea que requiere de la intervención de expertos humanos para garantizar la transición entre dos estructuras significantes de un documento a través de una estructura de significado común.

    No obstante, se han producido avances en el dominio de la sintaxis oracional, pues hay programas que permiten el reconocimiento de las unidades léxicas y la extracción simple de información. El problema surge en las facetas interpretativa y pragmática, donde fluyen los efectos de ambigüedad e imprecisión terminológico-conceptual del lenguaje y los condicionantes contextuales y documentales de cualquier situación de comunicación. Pese a los avances derivados de la lingüística computacional y del Procesamiento del Lenguaje Natural (PLN), los sumarios y extractos automáticos son de escasa calidad, pues son unidades de significado incoherentes que aportan indicios sobre el contenido de los documentos.

    Los métodos automáticos para la representación textual podemos agruparlos:

    • Métodos de extracción, basados en la estructura superficial y en el uso de técnicas estadísticas que permitan seleccionar la información en función de la frecuencia de las palabras clave, de la localización de la información..
      Como ejemplo destacamos la aplicación ANES (1995)

    • Métodos de sumarización, centrados en las estructuras retórica y/o profunda de los documentos y en los avances del procesamiento del lenguaje natural, permiten la creación de sumarios empleando recursos como plantillas web y plantillas metadatos.
      Como ejemplos destacan PROTEUS (1991), SUMMONS (1995), SIM-SUM (1998)

    • Métodos gráfico-relacionales, basados en técnicas vectoriales y algoritmos gráficos de mapeo de información, permiten extraer información en lenguaje natural de las similitudes y diferencias de un conjunto de documentos. Sobresale el sistema SMART (1989)

    • Métodos híbridos, que a modo de banco de trabajo asisten al resumidor en el proceso de creación de pre-resúmenes.
      Mencionamos la aplicación TEXNET

    Se ofrece una selección de softwares para la producción de extractos y sumarios:

  • Disponible ( http://www.mariapinto.es/e-coms/or_con_elect.htm)

miércoles, 31 de octubre de 2007

viernes, 20 de julio de 2007