A Apple lança o modelo de edição de imagens MGIE de código aberto e alimentado por IA com instruções em linguagem natural, em colaboração com pesquisadores da UC.

A Apple lançou um novo modelo de edição de imagens com IA, MGIE, em colaboração com pesquisadores da Universidade da Califórnia. MGIE, que significa MLLM-Guided Image Editing, usa modelos multimodais de linguagem grande (MLLMs) e permite aos usuários editar imagens com base em instruções de linguagem natural. O modelo foi apresentado num artigo na Conferência Internacional sobre Representações de Aprendizagem 2024, demonstrando a sua capacidade de melhorar as métricas automáticas e a avaliação humana, mantendo ao mesmo tempo a eficiência da inferência competitiva.

February 07, 2024
4 Artigos

Leitura adicional