Um dos problemas que enfrentamos ao gerarmos frases nos projetos MultiGenera e MultiComb está relacionado coas preposições, especialmente em alemão e francês. Como sabemos, dentro da frase nominal, as preposições conectam o núcleo, um nome, cos seus diferentes complementos. Estes podem ser argumentos, também chamados de actantes, ou seja, complementos necessários ou requeridos para concretizar o significado do nome-núcleo. Por exemplo: le texte de philosophie, une question sur l’avortement, leur fuite en Belgique. Mas também podem ser circunstantes não essenciais (ou circunstanciais, como são geralmente estudados na escola), isto é, podem ser excluídos sem alterarem o significado essencial do núcleo, por exemplo : nos textes de cette année, une question en l’air, une fuite à pied. Ainda que em francês a preposição não seja sempre necessária para conectar um complemento ao seu núcleo (por exemplo, une question histoire, une fuite la nuit), a ligação com preposição é a opção mais frequente.

Para a gramática valencial, quadro teórico dos nossos projetos, estes complementos ou argumentos nominais também desempenham um determinado papel semântico (agente, paciente, beneficiário, experimentante, causa, localização etc). Precisamente, este papel semântico é que determina a preposição que liga um argumento ao seu núcleo. Assim, alguns dos traços ou valores semânticos da preposição selecionada (e geralmente cada uma tem vários) devem estar de acordo co papel semântico do argumento que introduz. Por exemplo, o nome fuite apresenta um argumento de ‘percurso’ ou ‘passagem’ que é introduzido pela preposição par. Ex :. Ex : la fuite par ce chemin, les fuites par mer. Isto é assim porque, entre os seus diferentes valores, par contém o de ‘passagem’. Neste sentido, é equivalente à locução à travers (la fuite à travers ce chemin).

Não é assim tão óbvio

Porém, as cousas não são tão óbvias porque, como em muitas outras línguas, muitos são os complementos actanciais do francês que marcam o seu papel semântico com várias preposições. Assim, para introduzir o argumento ‘local de origem’, normalmente exigido pelo nome fuite (‘fugida’), é possível utilizar as preposições de ou depuis. Por exemplo: la fuite de Bordeaux, la fuite depuis Bordeaux. Mas o uso duma ou outra preposição não é aleatório, porque cada uma delas matiza de certa forma o papel semântico do complemento actancial. O uso de depuis parece focar a atenção no ponto de partida em relação ao trajeto duma fugida, enquanto que de não apresenta este matiz. Algo semelhante pode ser observado no argumento que expressa a causa no nome mort (‘morte, fim da vida’). Mais uma vez, temos a possibilidade de usar duas preposições: de (la mort de faim, la mort de soif, la mort d’amour) e par (la mort par asphyxie, la mort par lapidation, la mort par arrêt cardiaque) associadas a matizes semânticos. Assim, o uso da preposição de parece indicar um estado de carência de alguma cousa (água, comida, ar, afeto) como causa de morte, enquanto as realizações com par não apresentam este matiz. 

No caso de présence e do seu complemento locativo, aquele que expressa o lugar em que algo ou alguém está presente, já encontramos o dobro das possibilidades (à, sur, dans et en), por exemplo: sa présence à Paris, sa présence sur Paris, sa présence dans Paris, sa présence en Italie. Parece que dous fatores interligados explicam a escolha das diferentes preposições aqui:

  1. Como nos casos anteriores, o uso de sur e dans introduz matizes de significado em relação ao uso de à e en. O uso de sur (sa présence sur Paris) indica uma presença em diferentes pontos ou ao longo duma região ou zona, enquanto dans (sa présence dans Paris), muito menos frequente, refere-se mais a uma presença interior, isto é, dentro dum lugar ou dos seus diferentes elementos.  
  2. Por outro lado, en e à são selecionadas em função das características semânticas do núcleo do argumento locativo. Como é sabido, a preposição à é normalmente utilizada cos topónimos de bairros, aldeias ou cidades, mas também cos nomes masculinos de regiões e países (sa présence à Paris, sa présence au Portugal). O uso do en é, pelo contrário, requerido com nomes femininos (sa présence en France, sa présence en Galice). Finalmente, sur é utilizado com espaços virtuais (webs, fóruns, redes sociais, etc.: sa présence sur Facebook) e corpos celestes, por exemplo: sa présence sur Mars, sa présence sur la Lune. No quadro da Teoria Sentido-Texto, que é particularmente importante para os nossos projetos, estas restrições são formalizadas pela função lexical Locin
    • Mars)Locin = sur [~]
    • (Galice)Locin = en [~]
    • (Marseille)Locin = à [~]

Como é que fazemos então?

Para a sua geração automática, o processamento destes fenómenos requer, portanto, soluções em termos computacionais. No quadro do MultiGenera e MultiComb (podem ver neste artigo os detalhes destes projetos), tomámos as seguintes decisões:

  • No caso dos complementos cuja variação na preposição é regida pelas características semânticas da casa argumental (ex. : la mort de faim vs la mort par asphyxie), e perante duas realizações diferentes, decidimos então tratá-las como duas estruturas distintas. Isto significa que a cada estrutura serão atribuídos pacotes semânticos específicos. Assim, a estrutura Det. + mort(s) + de + Nom (la mort de faim) é associada a pacotes semânticos [+situação, +estado] (p. ex. froid, faim), enquanto os pacotes [+situação, +processo] (p.ex. asphyxie, maladie) são usados para Det. + mort(s) + par + N (la mort par dénutrition). A este respeito, aplica-se o mesmo tratamento que nos muitos casos em que uma mesma preposição introduz argumentos diferentes para um mesmo nome (le texte de Paul, le texte d’économie).
  • No caso das realizações dum mesmo complemento que partilham classes semânticas (por exemplo, sa présence au Portugal, sa présence en Espagne), a mesma solução é adoptada. Quer dizer, estruturas com de e com à são tratadas como duas realizações diferentes e, consequentemente, têm pacotes semânticos específicos. Assim, por um lado, são criados pacotes específicos com topónimos ou tipos de lugares que requerem a preposição à (Montmartre, Rome, Cuba) e, por outro lado, pacotes de topónimos associados à utilização de en (Bretagne, Espagne).

Como acabámos de ver, o tratamento das preposições dentro da categoria de nomes pode não ser tão simples como parece à primeira vista. A dupla recção (exercida, dum lado, polo núcleo da frase nominal e, do outro, polo núcleo dum complemento) e as nuances semânticas introduzidas polas próprias preposições levam-nos a programar mais estruturas e a criar pacotes específicos para elas. É mais trabalho mas, como se costuma dizer, Roma e Pavia não se figérom num dia.