La minería de textos como subsidio para la organización de la información: un estudio exploratorio

Autores

DOI:

https://doi.org/10.47681/rca.v7i2.53185

Palavras-chave:

Minería de textos, Encabezamientos de materias, Términos de indexación, textrank, slowraker, rapidraker, tm, udpipe, RKEA.

Resumo

Se presenta seis exploraciones utilizando la paquetería de R disponibles para la minería de textos. Estos paquetes de minería de textos pueden ser utilizados para ofrecer subsidios en la construcción de encabezamientos de materias, palabras clave y/o términos de indexación de artículos de revistas. Con los paquetes textrank, slowraker, rapidraker la coincidencia entre las palabras claves ofrecidas por la autora del documento usado como prueba alcanzó al 50%, pero al mismo tiempo los paquetes ofrecieron palabras claves complementarias como subsidios pertinentes para enriquecer la terminología dirigida a la recuperación de la información. Con los paquetes tm y udpipe la coincidencia entre las palabras claves ofrecidas por la autora del documento usado como prueba alcanzó al 75%; igualmente ambos paquetes ofrecieron otras palabras claves perfectamente pertinentes para enriquecer la terminología dirigida a la recuperación de la información. El único paquete no adecuado fue RKEA.

Biografia do Autor

Rubén Urbizagastegui-Alvarado, Universidade da California em Riverside

NA

Referências

REFERENCIAS

BAKER, Christopher. slowraker: A Slow Version of the Rapid Automatic Keyword Extraction (RAKE) Algorithm, 2017. R package version 0.1.1. https://CRAN.R-project.org/package=slowraker.

BAKER, Christopher. rapidraker: Rapid Automatic Keyword Extraction (RAKE) Algorithm, 2021. R package version 0.1.3. https://CRAN.R-project.org/package=rapidraker.

BOTTA-FERRET, Eleazar; CABRERA-GATO, Jania E. Minería de textos: una herramienta útil para mejorar la gestión del bibliotecario en el entorno digital. ACIMED, Ciudad de La Habana, v. 16, n. 4, oct. 2007. http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024-94352007001000005

CANDÁS-ROMERO, Jorge. "Minería de datos en bibliotecas: bibliominería. BiD: textos universitaris de biblioteconomia i documentació, v. 17, 2006. https://bid.ub.edu/sites/bid9/files/pdf/17canda1.pdf

CONTRERAS BARRERA, Marcial. Minería de texto: una visión actual. Biblioteca Universitária, v. 17, no. 2, p. 129-138, 2014. https://www.redalyc.org/pdf/285/28540279005.pdf

CONTRERAS BARRERA, Marcial. Minería de texto en la clasificación de material bibliográfico. Biblios, n. 64, p. 33-43, 2016. https://www.redalyc.org/journal/161/16148511003/html/

DORIVAL CÓRDOVA, Rosa; ROJAS LAZARO, Carlos Javier. El uso de los sistemas tradicionales de organización del conocimiento en las bibliotecas peruanas. Biblios: Journal of Librarianship and Information Science, n. 46, p. 26-32, 2012. http://biblios.pitt.edu/ojs/index.php/biblios/article/download/38/93

FEINERER, Ingo; HORNIK, Kurt. tm: Text Mining Package. 2020. R package version 0.7-8. https://CRAN.R-project.org/package=tm.

FEINERER, Ingo; HORNIK, Kurt. RKEA: R/KEA Interface, 2015. R package version 0.0-6. https://CRAN.R-project.org/package=RKEA.

GÁLVEZ, Carmen. Minería de textos: la nueva generación de análisis de literatura científica en biología molecular y genómica. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, v. 13, no. 25, 1-14, 2008. https://www.redalyc.org/pdf/147/14702502.pdf

GORBEA-PORTAL, Salvador. Tendencias transdisciplinarias en los estudios métricos de la información y su relación con la gestión de la información y del conocimiento. Perspectivas em Gestão & Conhecimento, v. 3, no. 1, p. 13-27, 2013. https://brapci.inf.br/index.php/res/v/53087

JARAMILLO VALBUENA, Sonia; CARDONA, Sergio Augusto; FERNANDEZ, Alejandro. Minería de datos sobre streams de redes sociales, una herramienta al servicio de la Bibliotecología. Información, cultura y sociedad, n. 33, p. 63-74, 2015. Disponible en: http://www.scielo.org.ar/scielo.php?script=sci_arttext&pid=S1851-17402015000200005

MORAIS, Natanna Santana de. A análise de domínio na construção de linguagens documentárias. Informação em Pauta, Fortaleza, CE, v. 3, n. 2, p. 140-141, jul./dez. 2018. http://www.periodicos.ufc.br/informacaoempauta/article/view/39572

OLSON, Hope A.; SCHLEGL, Rose. Standardization, objectivity, and user focus: A meta-analysis of subject access critiques. Cataloging & classification quarterly, v. 32, no. 2, p. 61-80, 2001. https://www.tandfonline.com/doi/abs/10.1300/J104v32n02_06

R Core Team (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. R version 4.1.2 (2021-11-01). URL https://www.R-project.org/.

URBIZAGÁSTEGUI-ALVARADO, Rubén. La bibliometría brasileña: minería de textos. Revista ACB: Biblioteconomía em Santa Catarina, v. 26, no. 1, p. 1-18, 2021.

https://revista.acbsc.org.br/racb/article/view/1768

URBIZAGÁSTEGUI-ALVARADO, Rubén. Arte rupestre peruano: análisis textométrico. En prensa.

URBIZAGÁSTEGUI-ALVARADO, Rubén. Cataloging Pierre Bourdieu’s books. Cataloging & Classification Quarterly, v. 19, no. 1: 89-105, 1994.

https://www.tandfonline.com/doi/abs/10.1300/J104v19n01_07

URBIZAGÁSTEGUI-ALVARADO, Rubén. Encabezamientos de materias: develando la organización del conocimiento. Revista Prefacio (Córdoba, Argentina), v. 5, n. 8, p. 79-98, 2022.

https://revistas.unc.edu.ar/index.php/PREFACIO/issue/view/2491

WIJFFELS, Jan. textrank: Summarize Text by Ranking Sentences and Finding Keywords, 2020. R package version 0.3.1. https://CRAN.R-project.org/package=textrank

WIJFFELS, Jan. udpipe: Tokenization, Parts of Speech Tagging, Lemmatization and Dependency Parsing with the 'UDPipe' 'NLP' Toolkit, 2021. R package version 0.8.8. https://CRAN.R-project.org/package=udpipe.

Publicado

2022-12-21

Edição

Seção

Relatos de Pesquisa