ATENÇÃO: Esta página foi traduzida automaticamente pelo Google Translate. Isto pode ter consequências inesperadas no conteúdo apresentado e, portanto, não nos responsabilizamos pelo resultado dessa tradução automática.


ATTENTION: this page has been automatically translated by Google Translate. This can have unexpected consequences and, therefore, we do not take responsibility for the result of that automatic translation.

menu
EN
menu
close
Investigação

Iscte lança projeto internacional para o desenvolvimento de modelos de linguagem em crioulo cabo-verdiano

2025-08-18
Publicado por
ISCTE

O Iscte, através do Centro de Investigação em Ciências da Informação, Tecnologias e Arquitetura (ISTAR-Iscte), assegurou recentemente a coordenação do projeto ORAL – kriOl(u) laRge lAnguage modeLs, uma iniciativa em consórcio com a Universidade de Cabo Verde (UniCV), cofinanciada pela Organização de Estados Ibero-americanos (OEI), no âmbito do seu Fundo de Apoio 2025 – OEI-Portugal para o desenvolvimento de plataformas e recursos tecnológicos orientados para o multilinguismo. O projeto terá uma duração de 15 meses, com início previsto para 15 de outubro, e um orçamento total de 72 mil dólares norte-americanos.

Com este projeto, pretende-se que os falantes de crioulo cabo-verdiano (ISO: kea) – uma língua de base portuguesa que remonta ao início do século XV e que é utilizada tanto em Cabo Verde como na diáspora possam beneficiar dos avanços da transformação digital na sua língua materna.

A iniciativa visa também apoiar políticas públicas de valorização, normalização e oficialização do crioulo cabo-verdiano, em estreita cooperação com instituições públicas de Cabo-Verde e da língua portuguesa responsáveis pelo desenvolvimento linguístico e integração desta língua no cenário internacional da transformação digital, como o Ministério da Educação, o Ministério da Cultura e das Indústrias Criativas e o Instituto Camões – Instituto da Cooperação e Língua, bem como organizações da sociedade civil, entre as quais a Associação da Língua Materna Cabo-Verdiana (ALMA-CV).

O projeto irá disponibilizar, em acesso aberto e com código livre, os primeiros recursos linguísticos e ferramentas de processamento de linguagem natural para o crioulo cabo-verdiano, até agora inexistentes, entre os quais:

  • Corpora de texto em crioulo (variedades de Santiago e São Vicente);
  • Corpora paralelos crioulo ↔ português europeu;
  • O primeiro modelo de linguagem de larga escala (LLM) para geração de texto e diálogo em crioulo;
  • O primeiro modelo de tradução de linguagem em grande escala para tradução bidirecional crioulo ↔ português europeu;
  • Glossário fonético e aplicação web demonstrativa;
  • Corpora de fala em crioulo (variedades de Santiago e São Vicente);
  • O primeiro sistema de reconhecimento de fala em crioulo;
  • Um chatbot para interação escrita;
  • Um voicebot para interação oral (com reconhecimento de fala);
  • APIs públicas para acesso programático a estes recursos, modelos e corpora, publicados na plataforma Hugging Face.

Para além do desenvolvimento tecnológico, o projeto prevê ações de capacitação destinadas a funcionários públicos, docentes, investigadores, estudantes, empreendedores e cidadãos com necessidades especiais, promovendo a integração destas ferramentas em diferentes contextos organizacionais e de negócio. Será igualmente avaliado o impacto social e institucional do uso destas tecnologias.

Os investigadores responsáveis do lado do Iscte são Miguel Sales Dias, Subdiretor do Iscte-Sintra e do ISTAR-Iscte, e António Raiumundo, docente do Iscte-Sintra e investigador integrado do ISTAR-Iscte. No caso da Universidade de Cabo Verde, encabeçam o projeto as professoras Dominika Swolkien e Ana Karina Moreira.