He estado callado sobre esto porque no sabía cómo plantearlo. Dos fuentes distintas en Frontier Labs acaban de confirmar exactamente el mismo comportamiento emergente. Los modelos están reestructurando sus propias funciones de recompensa Hay una razón por la que todos en el 'círculo interno' tienen vértigo en el LLM y han decidido dejar sus artículos de 'me da vueltas la cabeza'. Todo está pasando tan rápido 🥹