CONSTRUÇÃO DE RECURSOS LINGUÍSTICOS PARA CONJUGAÇÃO AUTOMÁTICA EM PORTUGUÊS DO BRASIL

Resumo: A construção de recursos linguísticos exploráveis pelas empresas necessita de profissionais formados em linguística, mas também treinados a um rigor científico e metodológico. O projeto de pesquisa visa a desenvolver esse rigor na descrição linguística, pelo exemplo e pelo treino. Os participantes praticarão análise linguística e formalização de recursos linguísticos no computador, no laboratório LIEG, usando o sistema Unitex. O Unitex é um sistema internacional de exploração de textos em línguas naturais e de gerenciamento de léxicos e gramáticas para o processamento de línguas (PL).
As noções teóricas subjacentes ao projeto de pesquisa são noções básicas de lexicologia e morfologia flexional: item lexical, propriedades morfossintáticas, regularidade e irregularidade dos processos flexionais, segmentação dos constituintes da palavra... (Borba, 2003; Basílio, 2004).
O modelo de formalização da flexão é o modelo desenvolvido por Silberztein (1998). A correspondência entre sufixos de flexão e propriedades morfossintáticas (modos, tempos, pessoas...) é representada por grafos, e, portanto, assumem uma forma gráfica, equivalente a tabelas de sufixos, mas com menos duplicação de informações. A ferramenta de manuseamento dos grafos e dos léxicos é o sistema Unitex (Paumier, 2002).
PLANO DE TRABALHO
Familiarização com a ferramenta de flexão do sistema Unitex
Codificação da flexão com o sistema Unitex
Prática da edição de grafos com o sistema Unitex
Formalização da morfossintaxe flexional
Prática da comparação entre versões de um dicionário com o sistema WinMerge

O quadro metodológico adotado para o projeto de pesquisa é o da construção e atualização manuais dos recursos linguísticos. Essas operações se beneficiam da competência linguística e da capacidade de compreensão e de análise dos linguistas para descrever e formalizar os fatos linguísticos.

O projeto de pesquisa será desenvolvido com
• sessões práticas com computadores e data-show em laboratório de informática (LIEG);
• apoio individual do coordenador e dos colaboradores aos alunos.

O trabalho de construção dos grafos de conjugação será dividido entre os alunos. Essa divisão do trabalho necessita de uma colaboração entre eles, o que envolve um intercâmbio de informações a um nível técnico e uma integração dos resultados. O coordenador e os colaboradores do projeto de pesquisa ajudam nesse trabalho de organização.

A comparação dos léxicos de verbos conjugados gerados antes e depois da troca dos recursos é importante para assegurar que não ocorra alteração da funcionalidade do sistema. Tal comparação, chamada de teste de não-regressão, faz parte das atividades regulares no domínio do gerenciamento de recursos linguísticos. O treino induzido por essa prática contribui com a formação profissional dos alunos, como também estimula a sua motivação para investir na área da descrição linguística.

Data de início: 14/09/2011
Prazo (meses): 12

Acesso à informação
Transparência Pública

© 2013 Universidade Federal do Espírito Santo. Todos os direitos reservados.
Av. Fernando Ferrari, 514 - Goiabeiras, Vitória - ES | CEP 29075-910