PhonLex: um corpus anotado para pesquisas de frequência de unidades fonéticas, fonológicas e morfológicas do português

Autores

DOI:

https://doi.org/10.35520/diadorim.2025.v27n3a68315

Resumo

Este artigo apresenta o corpus linguístico PhonLex, desenvolvido para a análise de frequência de estruturas fonéticas, fonológicas e morfológicas do português brasileiro. A criação do PhonLex envolveu etapas de seleção de léxico representativo do português brasileiro, seu tratamento, extração dos itens lexicais, anotações e revisões semiautomáticas e manuais. O corpus conta com transcrições fonéticas de itens lexicais, sílabas, tipos de sílabas, consoantes em diferentes posições silábicas, vogais por posição acentual, codas, segmentações morfológicas de raiz, afixos e categorias gramaticais. Além de apresentar o PhonLex, este trabalho apresenta resultados, a partir de uma amostra de aproximadamente 12 mil palavras, relativos à distribuição de frequência do tamanho de palavras, tipo de sílabas, informações de consoantes em onset simples e complexo, ditongos orais e nasais e rimas com codas consonantais róticas, fricativas e nasais. Observa-se que a alta frequência de certas unidades fonológicas como rima e vogais é amplamente motivada pela morfologia da língua nessas posições, que realiza certas propriedades semânticas ou classificatórias de alta rentabilidade no corpus. Os resultados comparáveis mostraram-se convergentes com os reportados na literatura, evidenciando a representatividade da amostra e a robustez dos achados. Este trabalho inaugura o PhonLex como uma ferramenta detalhada da estrutura fonética, fonológica e morfológica do português brasileiro, permitindo pesquisas detalhadas desses níveis.

Downloads

Não há dados estatísticos.

Downloads

Publicado

2025-12-27

Como Citar

MADRUGA, Magnun Rochel; MILLAS, Gabriel Castelano. PhonLex: um corpus anotado para pesquisas de frequência de unidades fonéticas, fonológicas e morfológicas do português. Diadorim: revista de estudos linguísticos e literários, Rio de Janeiro, v. 27, n. 3, p. e68315, 2025. DOI: 10.35520/diadorim.2025.v27n3a68315. Disponível em: https://revistas.ufrj.br/index.php/diadorim/article/view/68315. Acesso em: 10 mar. 2026.

Edição

Seção

DIADORIM VOLUME 27.3 - Especial - Dossiê de Língua - Fonética, Fonologia e Prosódia: uma homenagem ao Professor João Moraes.