La minería de textos como subsidio para la organización de la información: un estudio exploratorio
DOI :
https://doi.org/10.47681/rca.v7i2.53185Mots-clés :
Minería de textos, Encabezamientos de materias, Términos de indexación, textrank, slowraker, rapidraker, tm, udpipe, RKEA.Résumé
Se presenta seis exploraciones utilizando la paquetería de R disponibles para la minería de textos. Estos paquetes de minería de textos pueden ser utilizados para ofrecer subsidios en la construcción de encabezamientos de materias, palabras clave y/o términos de indexación de artículos de revistas. Con los paquetes textrank, slowraker, rapidraker la coincidencia entre las palabras claves ofrecidas por la autora del documento usado como prueba alcanzó al 50%, pero al mismo tiempo los paquetes ofrecieron palabras claves complementarias como subsidios pertinentes para enriquecer la terminología dirigida a la recuperación de la información. Con los paquetes tm y udpipe la coincidencia entre las palabras claves ofrecidas por la autora del documento usado como prueba alcanzó al 75%; igualmente ambos paquetes ofrecieron otras palabras claves perfectamente pertinentes para enriquecer la terminología dirigida a la recuperación de la información. El único paquete no adecuado fue RKEA.
Références
REFERENCIAS
BAKER, Christopher. slowraker: A Slow Version of the Rapid Automatic Keyword Extraction (RAKE) Algorithm, 2017. R package version 0.1.1. https://CRAN.R-project.org/package=slowraker.
BAKER, Christopher. rapidraker: Rapid Automatic Keyword Extraction (RAKE) Algorithm, 2021. R package version 0.1.3. https://CRAN.R-project.org/package=rapidraker.
BOTTA-FERRET, Eleazar; CABRERA-GATO, Jania E. Minería de textos: una herramienta útil para mejorar la gestión del bibliotecario en el entorno digital. ACIMED, Ciudad de La Habana, v. 16, n. 4, oct. 2007. http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024-94352007001000005
CANDÁS-ROMERO, Jorge. "Minería de datos en bibliotecas: bibliominería. BiD: textos universitaris de biblioteconomia i documentació, v. 17, 2006. https://bid.ub.edu/sites/bid9/files/pdf/17canda1.pdf
CONTRERAS BARRERA, Marcial. Minería de texto: una visión actual. Biblioteca Universitária, v. 17, no. 2, p. 129-138, 2014. https://www.redalyc.org/pdf/285/28540279005.pdf
CONTRERAS BARRERA, Marcial. Minería de texto en la clasificación de material bibliográfico. Biblios, n. 64, p. 33-43, 2016. https://www.redalyc.org/journal/161/16148511003/html/
DORIVAL CÓRDOVA, Rosa; ROJAS LAZARO, Carlos Javier. El uso de los sistemas tradicionales de organización del conocimiento en las bibliotecas peruanas. Biblios: Journal of Librarianship and Information Science, n. 46, p. 26-32, 2012. http://biblios.pitt.edu/ojs/index.php/biblios/article/download/38/93
FEINERER, Ingo; HORNIK, Kurt. tm: Text Mining Package. 2020. R package version 0.7-8. https://CRAN.R-project.org/package=tm.
FEINERER, Ingo; HORNIK, Kurt. RKEA: R/KEA Interface, 2015. R package version 0.0-6. https://CRAN.R-project.org/package=RKEA.
GÁLVEZ, Carmen. Minería de textos: la nueva generación de análisis de literatura científica en biología molecular y genómica. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, v. 13, no. 25, 1-14, 2008. https://www.redalyc.org/pdf/147/14702502.pdf
GORBEA-PORTAL, Salvador. Tendencias transdisciplinarias en los estudios métricos de la información y su relación con la gestión de la información y del conocimiento. Perspectivas em Gestão & Conhecimento, v. 3, no. 1, p. 13-27, 2013. https://brapci.inf.br/index.php/res/v/53087
JARAMILLO VALBUENA, Sonia; CARDONA, Sergio Augusto; FERNANDEZ, Alejandro. Minería de datos sobre streams de redes sociales, una herramienta al servicio de la Bibliotecología. Información, cultura y sociedad, n. 33, p. 63-74, 2015. Disponible en: http://www.scielo.org.ar/scielo.php?script=sci_arttext&pid=S1851-17402015000200005
MORAIS, Natanna Santana de. A análise de domínio na construção de linguagens documentárias. Informação em Pauta, Fortaleza, CE, v. 3, n. 2, p. 140-141, jul./dez. 2018. http://www.periodicos.ufc.br/informacaoempauta/article/view/39572
OLSON, Hope A.; SCHLEGL, Rose. Standardization, objectivity, and user focus: A meta-analysis of subject access critiques. Cataloging & classification quarterly, v. 32, no. 2, p. 61-80, 2001. https://www.tandfonline.com/doi/abs/10.1300/J104v32n02_06
R Core Team (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. R version 4.1.2 (2021-11-01). URL https://www.R-project.org/.
URBIZAGÁSTEGUI-ALVARADO, Rubén. La bibliometría brasileña: minería de textos. Revista ACB: Biblioteconomía em Santa Catarina, v. 26, no. 1, p. 1-18, 2021.
https://revista.acbsc.org.br/racb/article/view/1768
URBIZAGÁSTEGUI-ALVARADO, Rubén. Arte rupestre peruano: análisis textométrico. En prensa.
URBIZAGÁSTEGUI-ALVARADO, Rubén. Cataloging Pierre Bourdieu’s books. Cataloging & Classification Quarterly, v. 19, no. 1: 89-105, 1994.
https://www.tandfonline.com/doi/abs/10.1300/J104v19n01_07
URBIZAGÁSTEGUI-ALVARADO, Rubén. Encabezamientos de materias: develando la organización del conocimiento. Revista Prefacio (Córdoba, Argentina), v. 5, n. 8, p. 79-98, 2022.
https://revistas.unc.edu.ar/index.php/PREFACIO/issue/view/2491
WIJFFELS, Jan. textrank: Summarize Text by Ranking Sentences and Finding Keywords, 2020. R package version 0.3.1. https://CRAN.R-project.org/package=textrank
WIJFFELS, Jan. udpipe: Tokenization, Parts of Speech Tagging, Lemmatization and Dependency Parsing with the 'UDPipe' 'NLP' Toolkit, 2021. R package version 0.8.8. https://CRAN.R-project.org/package=udpipe.