A aprendizagem distribucional no português brasileiro: um estudo computacional

Autores

  • Pablo Picasso Feliciano de Faria Universidade Estadual de Campinas
  • Giulia Osaka Ohashi Universidade Estadual de Campinas

DOI:

https://doi.org/10.31513/linguistica.2018.v14n3a21419

Palavras-chave:

aquisição da linguagem, aprendizagem distribucional, categorias de palavras, modelagem computacional.

Resumo

Neste artigo, tratamos do problema da aprendizagem de categorias de palavras durante o processo de aquisição. Nossa abordagem é computacional: construímos um modelo baseado em Redington et al. (1998) para investigar a informatividade da informação distribucional para a categorização de palavras. Os dados fornecidos ao aprendiz vêm de dois corpora de fala dirigida à criança em português brasileiro. Especifi camente, os experimentos apresentados aqui avaliam a informatividade de várias janelas contextuais relativas a uma dada palavra-alvo, isto é, quais contextos são mais ou menos informativos sobre a categoria de uma palavra. Nossos resultados mostram que contextos locais são altamente informativos e que a informação distribucional é útil como fonte de informação categorial.

 

---

DOI: http://dx.doi.org/10.31513/linguistica.2018.v14n3a21419

Biografia do Autor

Pablo Picasso Feliciano de Faria, Universidade Estadual de Campinas

Doutor em Linguística pela Universidade Estadual de Campinas, com ênfase em Aquisição de Linguagem e Linguística Computacional. Tem interesse nas áreas de formalismos gramaticais, aquisição de linguagem, teorias formais de aprendizagem, processamento automático (parsing, tradução, etc.) e psicolinguística. Possui formação interdisciplinar, que inclui o bacharelado em Ciências da Computação, pós-graduação (aperfeiçoamento) em Sistemas de Informação, mestrado e doutorado em Linguística. Atuou como desenvolvedor e analista de sistemas comerciais entre 1998 e 2007. Entre 2000 e 2006, atuou também como artista (cantor e violonista) profissional, tendo gravado um álbum solo, em 2006, interpretando canções autorais.

Giulia Osaka Ohashi, Universidade Estadual de Campinas

Bacharel em Linguística, com ênfase em Linguística Computacional pela Universidade Estadual de Campinas.

Downloads

Publicado

2018-12-30