Notícias

Investigação • 18 ago 2025
Iscte lança projeto internacional para o desenvolvimento de modelos de linguagem em crioulo cabo-verdiano

O Iscte, através do Centro de Investigação em Ciências da Informação, Tecnologias e Arquitetura (ISTAR-Iscte), assegurou recentemente a coordenação do projeto ORAL – kriOl(u) laRge lAnguage modeLs, uma iniciativa em consórcio com a Universidade de Cabo Verde (UniCV), cofinanciada pela Organização de Estados Ibero-americanos (OEI), no âmbito do seu Fundo de Apoio 2025 – OEI-Portugal para o desenvolvimento de plataformas e recursos tecnológicos orientados para o multilinguismo. O projeto terá uma duração de 15 meses, com início previsto para 15 de outubro, e um orçamento total de 72 mil dólares norte-americanos.

Com este projeto, pretende-se que os falantes de crioulo cabo-verdiano (ISO: kea) – uma língua de base portuguesa que remonta ao início do século XV e que é utilizada tanto em Cabo Verde como na diáspora possam beneficiar dos avanços da transformação digital na sua língua materna.

A iniciativa visa também apoiar políticas públicas de valorização, normalização e oficialização do crioulo cabo-verdiano, em estreita cooperação com instituições públicas de Cabo-Verde e da língua portuguesa responsáveis pelo desenvolvimento linguístico e integração desta língua no cenário internacional da transformação digital, como o Ministério da Educação, o Ministério da Cultura e das Indústrias Criativas e o Instituto Camões – Instituto da Cooperação e Língua, bem como organizações da sociedade civil, entre as quais a Associação da Língua Materna Cabo-Verdiana (ALMA-CV).

O projeto irá disponibilizar, em acesso aberto e com código livre, os primeiros recursos linguísticos e ferramentas de processamento de linguagem natural para o crioulo cabo-verdiano, até agora inexistentes, entre os quais:

  • Corpora de texto em crioulo (variedades de Santiago e São Vicente);
  • Corpora paralelos crioulo ↔ português europeu;
  • O primeiro modelo de linguagem de larga escala (LLM) para geração de texto e diálogo em crioulo;
  • O primeiro modelo de tradução de linguagem em grande escala para tradução bidirecional crioulo ↔ português europeu;
  • Glossário fonético e aplicação web demonstrativa;
  • Corpora de fala em crioulo (variedades de Santiago e São Vicente);
  • O primeiro sistema de reconhecimento de fala em crioulo;
  • Um chatbot para interação escrita;
  • Um voicebot para interação oral (com reconhecimento de fala);
  • APIs públicas para acesso programático a estes recursos, modelos e corpora, publicados na plataforma Hugging Face.

Para além do desenvolvimento tecnológico, o projeto prevê ações de capacitação destinadas a funcionários públicos, docentes, investigadores, estudantes, empreendedores e cidadãos com necessidades especiais, promovendo a integração destas ferramentas em diferentes contextos organizacionais e de negócio. Será igualmente avaliado o impacto social e institucional do uso destas tecnologias.

Os investigadores responsáveis do lado do Iscte são Miguel Sales Dias, Subdiretor do Iscte-Sintra e do ISTAR-Iscte, e António Raiumundo, docente do Iscte-Sintra e investigador integrado do ISTAR-Iscte. No caso da Universidade de Cabo Verde, encabeçam o projeto as professoras Dominika Swolkien e Ana Karina Moreira.

Voltar ao topo