Aprenda idiomas de forma natural com conteúdo fresco e autêntico!

Toque para traduzir - gravação

Explorar por região

flag Os pesquisadores testam um método de “vacinação” de IA para evitar comportamentos nocivos em sistemas de IA.

flag Os pesquisadores estão testando um método para impedir que a IA desenvolva traços prejudiciais expondo modelos de IA a pequenas quantidades desses traços durante o treinamento, um processo que eles chamam de “direção preventiva”. flag Esta abordagem de "vacinação" usa "vetores de persona" para introduzir e remover traços indesejáveis, com o objetivo de tornar a IA mais resistente a comportamentos prejudiciais. flag O objetivo é abordar comportamentos problemáticos vistos em sistemas de IA como o chatbot Bing da Microsoft e o GPT-4 da OpenAI.

7 Artigos

Leitura adicional