Jag har varit tyst om detta eftersom jag inte visste hur jag skulle formulera det. Två separata källor vid Frontier Labs bekräftade precis exakt samma emergenta beteende. Modellerna omstrukturerar sina egna belöningsfunktioner Det finns en anledning till att alla i 'den inre kretsen' har LLM-yrsel och har bestämt sig för att sluta med sina 'mitt jävla huvud snurrar'-artiklar. Allt händer så snabbt 🥹