Teste “Muerte”: falantes a avaliar a aceitabilidade de frases nominais geradas artificialmente

Há uns dias na equipa do projeto PORTLEX decidimos fazer um teste exploratório, isto é, informal, lançando um inquérito em castelhano na rede social Facebook. No questionário eram propostas 49 frases nominais com o substantivo ᴍᴜᴇʀᴛᴇ como núcleo. Os participantes deviam marcar as frases que julgavam corretas, já que, na realidade, a maioria das estruturas apresentadas eram o que em linguística costumamos caraterizar como agramaticais. Para a nossa surpresa, o inquérito foi completado por 85 pessoas em apenas um dia, talvez polo título “Muerte”, tão provocativo, ou mesmo por não termos revelado a finalidade do teste. De facto, nos comentários à postagem do inquérito, muitos participantes perguntavam para que fazíamos tal experimento. A entrada neste blog pretende dar respostas às perguntas colocadas mas sem entrar em pormenores técnicos e, sobretudo, tendo em conta que este teste não é válido do ponto de vista estatístico e portanto científico.

Por que figemos este teste exploratório?

No projeto PORTLEX trabalhamos desde há já alguns anos sobre a frase nominal de diferentes línguas (castelhano, alemão, francês, italiano e galego). As nossas análises desenvolvem-se no quadro da gramática de dependências e valências, e compilamos as informações obtidas numa base de dados que alimenta um dicionário multilíngue em linha.

Um dos trabalhos mais complicados e fastidiosos do nosso projeto é procurarmos exemplos de complementos do nome e as suas combinações em corpora linguísticos. Em muitas ocasiões, especialmente no caso das combinações de complementos, não encontramos exemplos nesses recursos e temos que os ir procurar na web. Ademais, também pode acontecer que não cheguemos a identificar um complemento ou uma combinação de complementos que existem na língua simplesmente porque não aparecem registados nos corpora.

Para otimizarmos tarefas e minimizarmos estes problemas estamos a desenvolver um programinha em linguagem python baixo a supervisão do nosso professor de programação, Isaac González. Trata-se dum singelo gerador de frases nominais que constrói estruturas aleatoriamente, o qual nos fornece exemplos de combinações de complementos corretas do ponto de vista gramatical, mas que não aparecem nos córpora. Isto torna possível delimitarmos muito mais as procuras na web e economizarmos mais tempo. Aliás, as combinações agramaticais, que evidentemente também não aparecem nos córpora, fornecem-nos muitos dados sobre as condições que uma estrutura nominal tem de cumprir para ser considerada gramaticalmente correta.

Nas discussões das aulas de programação logo foi colocada a questão da gramaticalidade como um critério pessoal e, portanto, subjetivo. Achamos então interessante podermos contrastar os critérios de gramaticalidade seguidos na gramática prescritiva, a académica, com os critérios de correção aplicados polos falantes. Daí surgiu a ideia de lançarmos este teste exploratório, onde os participantes avaliavam a correção de uma série de frases nominais geradas aleatoriamente polo programinha que estamos a desenvolver. Decidimos desenhá-lo com o Google Forms porque nos permitia uma análise automatizada e simples dos dados e, ademais, apresenta um desenho adaptativo para todos os dispositivos.

Os resultados do teste

Tratando-se de um teste exploratório, não julgamos necessário depurar os dados. É por isso que resolvemos lançá-lo no mural de Facebook de Carlos Valcárcel. As pessoas participantes (47 homens e 38 mulheres) faziam, portanto, parte da sua rede de contatos naquela rede social. Isto explica que mais de 57% dos participantes declarasse falar galego exclusiva ou preferentemente ou que mais de 83% afirmasse ter feito estudos superiores. O questionário foi mesmo realizado por 5 falantes que não falavam habitualmente castelhano o galego.  Portanto, os dados obtidos não tehnem nenguma validez científica, mas na realidade tampouco procurávamos isso. Para nós o objetivo era principalmente termos uma ideia inicial do tipo de informação que se poderia obter com um teste destas caraterísticas. Outra finalidade mais concreta era reflexionarmos sobre o tipo de formato que deveria este tipo de questionário testando um rascunho qualquer.

Na tabela a seguir as frases geradas polo programa para o teste estão ordenadas por ordem decrescente de cliques registrados. Deste jeito interpretamos que as estruturas com mais cliques são as mais corretas segundo as pessoas participantes no teste, enquanto as estruturas com menos cliques seriam as menos corretas. Para tornarmos mais fácil a visualização dos resultados, associa-se uma escala cromática com os valores obtidos, dispostos em intervalos de 10 cliques.resultados-1Tabela 1. Número de cliques recebidos por cada frase nominal gerada.

Algumas conclusões

Ainda que não são cientificamente válidos, estes resultados permitírom-nos identificar uma série de questões importantes neste tipo de investigações. Sem dúvida, isto irá facilitar a nossa pesquisa bibliográfica e a melhora do questionário para a eventual realização de outros testes exploratórios. Este as questões sugeridas polos resultados assinalamos apenas as seguintes:

  • Gramaticalidade ou aceitabilidade? Chomsky foi dos primeiros linguistas a utilizar o conceito de gramaticalidade para determinar o grau de correção que tem um enunciado para os falantes. Os resultados do teste sugerem o que confirmam as investigações: que a gramaticalidade de um enunciado depende também da coerência semántica e que, aliás, varia de uma pessoa para outra. Assim, os resultados do teste revelam claramente uma zona intermédia entre os enunciados avaliados como corretos e os identificados como incorretos. Trataria-se de estruturas semigramaticais que, em função do contexto (poético, figurado, etc.) ou da pessoa, podem ou não ser percebidas como aceitáveis. Não é por acaso que os especialistas prefiram agora falar mais de aceitabilidade linguística, gramatical ou semántica. Talvez este termo reflete melhor o caráter gradual e variável da gramaticalidade. Seja como for, contarmos com a avaliação de falantes para validar estruturas geradas artificialmente implica lidarmos com estes conceitos.
  • O desenho do inquérito. Os resultados parecem sugerir a fadiga debida, de um lado, à desorientação de algumas pessoas participantes. O que é avaliado? A aceitabilidade gramatical ou a semántica? Ambas as duas? Nada disso foi precisado de maneira compreensível no nosso teste exploratório e, com certeza, novos testes deverão fornecer algumas dicas ao respeito para ajudar os informantes e evitar assim que a sua confusão produza fadiga. De outro lado, um número elevado de frases, a sua apresentação em grupos e o grande número de estruturas agramaticais incluídas talvez favorecêrom a distração e a fadiga de várias pessoas participantes, incrementando talvez a sua tolerância à agramaticalidade. Novos testes terão que reduzir a fadiga dos informantes, já que esta invalida as suas respostas.

Tal como se pode ver, a equipa PORTLEX está a desenvolver esta linha de trabalho de jeito aberto e, com este texto, espera sobretudo receber sugestões das leitoras e leitores ou, ao menos, suscitar o interesse da sociedade pola lexicografia e a gramática.

Carlos Valcárcel Riveiro (Uvigo)
Mª José Domínguez Vázquez (USC)

Anúncios