Distributional learning in Brazilian Portuguese: a computational study

Authors

  • Pablo Picasso Feliciano de Faria Universidade Estadual de Campinas
  • Giulia Osaka Ohashi Universidade Estadual de Campinas

DOI:

https://doi.org/10.31513/linguistica.2018.v14n3a21419

Keywords:

language acquisition, distributional learning, word categories, computational modeling.

Abstract

In this paper, we address the problem of learning word categories during language acquisition. Our approach is computational: we built a model based on Redington et al. (1998) in order to investigate the informativeness of distributional information to the categorization of words. The data provided to the learner comes from two corpora of child-directed speech in Brazilian Portuguese. Specifi cally, the experiments presented here evaluate the informativeness of various contextual windows regarding a given target word, that is, which contexts are more or less informative of a word category. Our results show that local contexts are highly informative and that distributional information is useful as a source of categorial information.

 

---

DOI: http://dx.doi.org/10.31513/linguistica.2018.v14n3a21419

Author Biographies

Pablo Picasso Feliciano de Faria, Universidade Estadual de Campinas

Doutor em Linguística pela Universidade Estadual de Campinas, com ênfase em Aquisição de Linguagem e Linguística Computacional. Tem interesse nas áreas de formalismos gramaticais, aquisição de linguagem, teorias formais de aprendizagem, processamento automático (parsing, tradução, etc.) e psicolinguística. Possui formação interdisciplinar, que inclui o bacharelado em Ciências da Computação, pós-graduação (aperfeiçoamento) em Sistemas de Informação, mestrado e doutorado em Linguística. Atuou como desenvolvedor e analista de sistemas comerciais entre 1998 e 2007. Entre 2000 e 2006, atuou também como artista (cantor e violonista) profissional, tendo gravado um álbum solo, em 2006, interpretando canções autorais.

Giulia Osaka Ohashi, Universidade Estadual de Campinas

Bacharel em Linguística, com ênfase em Linguística Computacional pela Universidade Estadual de Campinas.

Published

2018-12-30