Título:
Búsqueda y recuperación de información
Dirección:
http://recuperaciondeinformacion-gr21.blogspot.com/
Descripción:
Memorias de la asignatura Recuperación de Información del Programa de Sistemas de Información de la Universidad de La Salle Colombia, en el primer semestre de 2011, Grupo21. En él se desarrollarán principalmente temas relacionados con: Sistemas de Recuperación de Información, búsqueda y recuperación de información, Google, posicionamiento web y metadatos.
Palabras clave:
Búsqueda y Recuperación de Información, Programa de Sistemas de Información, Universidad de La Salle, 2011, Colombia, Google, posicionamiento, Grupo21, búsqueda de información, posicionamiento, Sistemas de recuperación de información
Código de idioma:
es
Autor/a:
CARMEN GONZALEZ y VIVIANA GONZALEZ
Colaborador/a:
CARMEN ELENA GONZÁLEZ CASTAÑEDA
Editor/a:
LEIDY VIVIANA GONZÁLEZ GONZÁLEZ
Derechos:
creative commons
Fecha de creación:
2011-2-13

sábado, 30 de abril de 2011

El Documento y su Estructura

El Documento y su Estructura


A largo de apartado número dos titulado: “Los Documentos de Texto y su estructura” se presentan un sinnúmero de conceptos esenciales que demuestran la gran importancia de la estructura de los documentos en el análisis, búsqueda y recuperación de información. Es así como este apartado se centra en tres temas importantes: la Estructura de los documentos de texto, los Metadatos y los Lenguajes de Marcado.

Bajo esta perspectiva, inicialmente plantea el concepto de texto como una de las tantas formas en que el conocimiento puede ser entendido, difundido, divulgado o gestionado, consecuentemente, aparece el concepto de documento en el mundo digital, entendido como unidad o porción de información que ofrece un contenido entorno a un tema en particular (ya sea texto o imagen). Ahora bien, fusionando ambos conceptos se tiene que un documento de texto expone los datos de formas y en secuencias diferentes, por ende tiene características diversas, una sintaxis, semántica y presentación que lo diferencia de otros. En este sentido, y dada la gran diversidad de documentos emerge una clasificación adecuada que permite categorizarlos en Documentos de texto Estructurados (con información perfectamente clasificada, dividida e identificable), Semiestructurados (con algunos elementos identificables) y No estructurados (con datos variados sin elementos identificables).



Seguidamente, el apartado hace referencia a los metadatos como un esquema actual dentro del análisis y procesamiento de la información, entendidos como una descripción de la información que evidencia su contenido, orden y relaciones. Asimismo, se plantean las tendencias existentes alrededor de su concepto: a) La tendencia “Todo Metadatos”, impuesta por Demsey y Heery, pues toda información se compone de datos que el fondo la describen por sí misma, así por ejemplo se tiene un catálogo de una biblioteca o una base de datos; y b) La tendencia “Metadatos en estricto sentido” referida a la descripción de objetos en el contexto del ciberespacio, como por ejemplo, descripción del contenido, tema, ubicación, etc. En este punto cabe resaltar que los metadatos se caracterizan por su funcionalidad, contexto e interlocutor. A su vez se distinguen tres corrientes: La Escuela de Catalogación o de Metadatos Descriptivos, la Escuela Estructuralista o de Datos Interrelacionados con lenguajes específicos y la Escuela de Estructura de Datos o de estándares universales.



Ahora bien, estos metadatos se clasifican de diversas maneras: Según Fitcher en Administrativos o Factuales y Descriptivos, según Kashpay y Shet su contenido los clasifica en independientes o dependientes y pueden basarse en contenido directo o descriptivos del contenido y según Marchioni se dividen en Descriptivos (o de creación del documento) y Semánticos (o de contenido del documento). De igual manera, el apartado presenta los lenguajes de marcado como el medio a través del cual se define y describe la estructura de los documentos su formato, semántica, atributos, etc., de allí su importancia en relación con los metadatos. Los lenguajes de marcado más usados son el HTML y el XML provenientes del SGML.



Finalmente, se evidencia la relevancia del proceso de búsqueda de información en tanto permite reducir el gup existente entre el usuario y su unidad informativa traducida en identificación y análisis de fuentes, nivel de uso y acceso a las mismas. En este sentido, si se habla de búsqueda necesariamente se deriva la recuperación u obtención de información relevante y pertinente desde la cobertura y la extracción de la información basada en los metadatos desde la precisión de la información deseada, enfoques diferentes mediante los cuales el usuario puede satisfacer su necesidad de información.




FUENTES:


Taller 1 sobre la lectura "Los Documentos de Texto y su Estructura", asignatura Recuperación de Información del Programa de Sistemas de Información de la Universidad de La Salle


Los Documentos de Texto y su Estructura. [Material de clase]. Moodle, 2011.

1 comentario:

Bibliotecologos On Line dijo...

Este artículo condensa información verdaderamente interesante... además por fin encontré algo relacionado con metadatos ... muy buena compilación.Felicitaciones