Representação de conteúdo via indexação automática em textos integrais em língua portuguesa - (1991)

Acessos: 18

Flávia Pereira Braga Mamfrim

Volume: 20 - Issue: 2

Resumo. Verifica-se a possibilidade da indexação automática derivativa de textos em língua portuguesa, a partir de seu texto integral. É aplicada a Fórmula de Transição de Goffman a 10 artigos na área de Bibliometria e formulado um algorltimo probabilístico de indexação. A Fórmula de Transição de Goffman ê perfeitamente aplicável à língua portuguesa, apontando para uma região de frequência de palavras onde estão concentradas as palavras indicativas do conteúdo dos artigos analisados. Palavras-chave Recuperação da informação. Indexação automática derivativa. Fórmula de Transição de Goffman. Representation of contents by the automatic indexing process of full texts in Portuguese language Abstract Possibility of automatic derived indexing of full texts in Portuguese is verifyed. Ten papers in Bibliometrics were indexed and their different parts considered for quantitative and qualitative analysis. Structure and disíríbution patterns of words were studied. Goffman's transition formula proved to be adequate as a slarting point for the indexing algorithm, which yielded, in all papers, a concentration zone forsemantic loaded terms. The algorithm worked as an uncenainty reducer, feading to the semantically important words. Keywords Information retrieval. Automatic derived indexing. Goffman's transition formula.

Keywords: recuperação da informação. indexação automática derivativa. fórmula de transição de goffman.

Idioma: English

Registro: 2024-08-17 14:41:05

http://revista.ibict.br/ciinf/article/view/355