InstituiçãoEscola Superior de Tecnologia e Gestão do Instituto Politécnico do PortoRequisitos de AdmissãoUma bolsa de investigação de 1 (uma) vaga, conforme o Projeto Lexia I – Sistema de Inteligência Artificial para Pesquisa Jurídica.Requisitos gerais:Ser estudante inscrito num mestrado integrado ou num mestrado, visando a consolidação da sua formação científica através do desenvolvimento de trabalhos de investigação conducentes à obtenção do grau académico, integrado ou não em projetos de I&D.Para candidatos com grau no estrangeiro, deve ter o grau reconhecido em Portugal e a conversão da classificação final para a escala portuguesa, conforme Decreto‐Lei n.o 66/2018.Requisitos EspecíficosEstar a frequentar curso de mestrado na área de Informática, mais especificamente em engenharia informática.Formação académica: Licenciatura em Informática, mais especificamente em engenharia informática.Fatores PreferenciaisExperiência em desenvolvimento de nhecimentos em bases de dados (SQL/No SQL), processamento de linguagem natural (NLP) e arquiteturas de dados para IA (bases de dados vetoriais).Plano de Trabalhos e ResponsabilidadesO bolseiro colaborará no plano de trabalhos do projeto, desenvolvendo investigação dedicada à recolha e pré‐processamento de dados para a arquitetura RAG (Retrieval Augmented Generation), assegurando qualidade, categorização e integração de fontes heterogéneas.Fase 1: Levantamento e Catalogação (Meses 1‐3)Mapeamento do Corpus Jurídico: Identificar e selecionar a legislação relevante, códigos e diplomas necessários, com foco sobre domínio fiscal.Análise de Qualidade de Dados: Caracterizar as fontes de dados (internas e públicas) identificando inconsistências ou falta de metadados.Definição de Taxonomias: Colaborar na catalogação e relação entre diferentes conteúdos legais para facilitar a indexação posterior.Fase 2: Processamento Técnico e Indexação (Meses 4‐7)Desenvolvimento de Mecanismos de Indexação: Implementar processos para converter documentos jurídicos em formatos processáveis, aplicando tokenização e limpeza de texto.Geração de Embeddings: Aplicar modelos para transformar o texto jurídico em vetores numéricos otimizados para o contexto do direito fiscal.Enriquecimento Semântico: Criar e associar metadados especializados aos documentos para pesquisas contextuais mais precisas.Fase 3: Integração e Automação de Pipelines (Meses 8‐10)Fusão de Dados Heterogéneos: Integrar dados estruturados (bases de dados) e não estruturados (PDFs, textos legais), assegurando consistênstrução de Pipelines de ETL: Desenvolver fluxos automáticos de extração, transformação e carregamento para atualizar continuamente a legislação.Adaptação a Perfis: Configurar tratamento de dados conforme perfis de acesso e níveis de direitos dos utilizadores.Fase 4: Validação, Relatórios e Disseminação (Meses 11‐12)Testes de Integridade: Validar a fidelidade jurídica dos dados processados.Documentação Técnica: Redigir relatórios de especificação e catálogo final de dados jurídicos.Escrita Científica: Colaborar na redação de artigos técnicos sobre os métodos de pré‐processamento para submissão em conferências.Legislação AplicávelLei n.o 40/2004, de 18 de agosto, alterada pelo Decreto‐lei n.o 202/2012, etc.Artigo 37.o do Decreto‐lei n.o 63/2019.Regulamento de Bolsas de Investigação da FCT, I. P., n.o 950/2019, e outras atualizaçõordenação CientíficaCoordenador científico: Professor Wellington Alves, Professor Adjunto na ESTG.Local de Trabalho e OrientaçãoEscola Superior de Tecnologia e Gestão, sob orientação do Professor Bruno Moisés Teixeira de Oliveira.Duração e Regime de AtividadeContrato de bolsa de 12 meses, eventualmente renovável por mais 12 meses, regime de exclusividade.Critérios de SeleçãoOs candidatos serão avaliados em três critérios, com pesos 40%, 20% e 40% respectivamente:Critério A – Percurso académico: notas da licenciatura, adequabilidade ao plano de trabalhos (peso 40%).Critério B – Curriculum Vitae e adequação ao posto (peso 20%).Critério C – Entrevista (peso 40%).Prazos de CandidaturaPeríodo aberto: 22 de maio de 2026 a 5 de junho de 2026 (10 dias úteis).