Saltar da navegação

Resultados de investigação científica do aluno da UPM foram seleccionados para a CVPR- conferência internacional mais prestigiada na área de visão computacional

Resultados de investigação científica do aluno da UPM foram seleccionados para a CVPR- conferência internacional mais prestigiada na área de visão computacional (Fonte da imagem: CVPR 2025)

Li Yanfeng, doutorando em Tecnologia Informática Aplicada da Faculdade de Ciências Aplicadas da Universidade Politécnica de Macau (FCA-UPM), em conjunto com Doutor Chan Ka Hou, Assistente Sun Yue, Professor Coordenador Lam Chan Tong e Professor Adjunto Tan Tao, apresentou um algoritmo inovador de edição de imagem “MoEdit”, em colaboração com investigadores do Centro de Ciência Informática John Hopcroft da Universidade Jiaotong de Xangai, da Universidade da Grande Baía, da Universidade de Fuzhou e da Universidade de Sichuan. Os resultados da investigação foram seleccionados para a CVPR (Computer Vision and Pattern Recognition) de 2025, uma conferência académica de topo na área da visão computacional, demonstrando plenamente a capacidade científica da UPM nas áreas de investigação de inteligência artificial e processamento de imagens.

A investigação propõe soluções para os principais desafios actualmente enfrentados na edição de imagens multi-objecto. Quando se lida com cenas complexas contendo vários objectos, os métodos tradicionais de edição de imagem não conseguem equilibrar simultaneamente as propriedades únicas de cada objecto com a consistência estrutural da cena global, resultando em problemas como erros quantitativos, distorção visual e propriedades desfocadas dos objectos nos resultados da edição. Além disso, os métodos de edição tradicionais requerem frequentemente ferramentas auxiliares para a operação, como máscaras e caixas delimitadoras, o que aumenta a complexidade da operação e limita a flexibilidade dos cenários de aplicação.

Para resolver os problemas acima mencionados, a equipa de investigação concebeu dois módulos cruciais: “FeCom” (Feature Compensation) e “QTTN” (Quantity Attention). O módulo “FeCom” separa e preserva eficazmente as características únicas de cada objecto, evitando a confusão entre elas. O módulo “QTTN” utiliza informações de imagem melhoradas por “FeCom” para detectar e manter automaticamente a consistência do número de objectos na imagem, sem depender de ferramentas auxiliares externas. Este avanço permite ao “MoEdit” ter um desempenho excelente em diversas tarefas de edição de imagem, como a transferência de estilos, a remodelação de objectos e a reconstrução de fundos. Os resultados da investigação fornecem, aos criadores de conteúdos, designers e indústrias que dependem de conteúdos visuais, como comércio electrónico, uma ferramenta de processamento de imagens eficiente, inteligente e fácil de utilizar. Prevê-se que esta ferramenta seja amplamente utilizada nos domínios de produção de media digital, exposição de produtos, processamento inteligente de imagens e outros campos.

Organizada pelo IEEE (Instituto de Engenheiros Electrotécnicos e Electrónicos), a CVPR (Conferência de Visão Computacional e Reconhecimento de Padrões) é uma das conferências académicas mais prestigiadas do mundo nas áreas da visão computacional e da inteligência artificial, sendo classificada como conferência de tipo A pela Federação Chinesa de Computadores (CCF). De acordo com as estatísticas da Google Scholar, a CVPR, actualmente, tem um índice h5 de 440 e uma mediana h5 de 689, classificando-se entre as principais conferências académicas do mundo, e em primeiro lugar do mundo na área da visão computacional. Em termos de publicações em todas as categorias, a CVPR fica apenas atrás da Nature, tornando-se um dos eventos académicos mais influentes nesta área.

Ver galeria