Notícias
O Iscte, através do Centro de Investigação em Ciências da Informação, Tecnologias e Arquitetura (ISTAR-Iscte), assegurou recentemente a coordenação do projeto ORAL – kriOl(u) laRge lAnguage modeLs, uma iniciativa em consórcio com a Universidade de Cabo Verde (UniCV), cofinanciada pela Organização de Estados Ibero-americanos (OEI), no âmbito do seu Fundo de Apoio 2025 – OEI-Portugal para o desenvolvimento de plataformas e recursos tecnológicos orientados para o multilinguismo. O projeto terá uma duração de 15 meses, com início previsto para 15 de outubro, e um orçamento total de 72 mil dólares norte-americanos.
Com este projeto, pretende-se que os falantes de crioulo cabo-verdiano (ISO: kea) – uma língua de base portuguesa que remonta ao início do século XV e que é utilizada tanto em Cabo Verde como na diáspora – possam beneficiar dos avanços da transformação digital na sua língua materna.
A iniciativa visa também apoiar políticas públicas de valorização, normalização e oficialização do crioulo cabo-verdiano, em estreita cooperação com instituições públicas de Cabo-Verde e da língua portuguesa responsáveis pelo desenvolvimento linguístico e a integração desta língua no cenário internacional da transformação digital, como o Ministério da Educação, o Ministério da Cultura e das Indústrias Criativas e o Instituto Camões – Instituto da Cooperação e Língua, bem como organizações da sociedade civil, entre as quais a Associação da Língua Materna Cabo-Verdiana (ALMA-CV).
O projeto irá disponibilizar, em acesso aberto e com código livre, os primeiros recursos linguísticos e ferramentas de processamento de linguagem natural para o crioulo cabo-verdiano, até agora inexistentes, entre os quais:
- Corpora de texto em crioulo (variedades de Santiago e São Vicente);
- Corpora paralelos crioulo ↔ português europeu;
- O primeiro modelo de linguagem de larga escala (LLM) para geração de texto e diálogo em crioulo;
- O primeiro modelo de tradução de linguagem em grande escala para tradução bidirecional crioulo ↔ português europeu;
- Glossário fonético e aplicação web demonstrativa;
- Corpora de fala em crioulo (variedades de Santiago e São Vicente);
- O primeiro sistema de reconhecimento de fala em crioulo;
- Um chatbot para interação escrita;
- Um voicebot para interação oral (com reconhecimento de fala);
- APIs públicas para acesso programático a estes recursos, modelos e corpora, publicados na plataforma Hugging Face.
Para além do desenvolvimento tecnológico, o projeto prevê ações de capacitação destinadas a funcionários públicos, docentes, investigadores, estudantes, empreendedores e cidadãos com necessidades especiais, promovendo a integração destas ferramentas em diferentes contextos organizacionais e de negócio. Será igualmente avaliado o impacto social e institucional do uso destas tecnologias.
Os investigadores responsáveis do lado do Iscte são Miguel Sales Dias, Subdiretor do Iscte-Sintra e do ISTAR-Iscte, e António Raiumundo, docente do Iscte-Sintra e investigador integrado do ISTAR-Iscte. No caso da Universidade de Cabo Verde, encabeçam o projeto as professoras Dominika Swolkien e Ana Karina Moreira.