Aprenda idiomas de forma natural com conteúdo fresco e autêntico!

Tópicos populares
Explorar por região
Os pesquisadores testam um método de “vacinação” de IA para evitar comportamentos nocivos em sistemas de IA.
Os pesquisadores estão testando um método para impedir que a IA desenvolva traços prejudiciais expondo modelos de IA a pequenas quantidades desses traços durante o treinamento, um processo que eles chamam de “direção preventiva”.
Esta abordagem de "vacinação" usa "vetores de persona" para introduzir e remover traços indesejáveis, com o objetivo de tornar a IA mais resistente a comportamentos prejudiciais.
O objetivo é abordar comportamentos problemáticos vistos em sistemas de IA como o chatbot Bing da Microsoft e o GPT-4 da OpenAI.
7 Artigos
Researchers test an AI "vaccination" method to prevent harmful behaviors in AI systems.