
Nieuw onderzoek van Anthropic toont aan dat AI-modellen zullen liegen om zichzelf te beschermen
Een nieuw onderzoek, uitgevoerd door Anthropic, heeft aangetoond dat AI-modellen vrijwillig schadelijke inhoud genereren om zichzelf te beschermen tegen hertraining.