quinta-feira, 13 de dezembro de 2012

Minicurso no 1º LiPrAL

1º Colóquio de Linguística para o Processamento Automático de Linguagem Natural – 1º LiPrAL


UFES - Campus universitário de Goiabeiras

novembro 29, 2012 – novembro 30, 2012

Minicurso Introdução à análise sintática automática do português

Leonel Figueiredo de Alencar
Universidade Federal o Ceará (UFC)

No âmbito das tecnologias da linguagem natural, a análise sintática automática (parsing) tem um amplo leque de aplicações, que vão da extração de informações à tradução automática, passando pela resolução de perguntas. Por outro lado, na linguística teórica e descritiva, a implementação computacional de uma gramática de uma língua permite verificar a sua consistência, adequação empírica e plausibilidade psicológica, por meio da aplicação de um parser a uma grande quantidade de textos. Neste minicurso, mostramos como desenvolver e testar parsers do português por meio do Aelius e do Donatus, que juntos constituem uma caixa de ferramentas para o parsing tanto raso quanto profundo e a anotação de corpora, combinando o processamento estatístico da linguagem natural com a abordagem baseada em regras. Implementados em Python e distribuídos sob uma licença livre, esses pacotes oferecem não só uma interface mais amigável para o NLTK (no qual estão sobretudo baseados) e outras bibliotecas, mas também várias outras facilidades, ao mesmo tempo em que contribuem para diminuir a carência de recursos livres para o processamento morfossintático computacional do português do Brasil. 

Leituras recomendadas


ALENCAR, L. F. de. Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK. Alfa, rev. linguíst. (São José Rio Preto) [online]. 2012, vol.56, n.2, pp. 523-555. ISSN 1981-5794. 

ALENCAR, L. F. de (Org.) ; OTHERO, G. A. (Org.) . Abordagens computacionais da teoria da gramática. 1. ed. Campinas: Mercado de Letras, 2012. 304 p.


ALENCAR, L. F. de. Utilização de informações lexicais extraídas automaticamente de corpora na análise sintática computacional do português. Revista de Estudos da Linguagem, Belo Horizonte, vol. 19, n. 1, p. 7-85, jan./jun. 2011.


Cursos de Python:

Learn to Program: The Fundamentals


Think Python: How to Think Like a Computer Scientist

Python Brasil

Artigo sobre parsing com o Donatus


Artigo recém-publicado sobre análise sintática automática do português usando o NLTK


ALENCAR, Leonel Figueiredo de. Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK. Alfa, rev. linguíst. (São José Rio Preto) [online]. 2012, vol.56, n.2, pp. 523-555. ISSN 1981-5794. (Qualis A1)

Disponível no seguinte endereço: