Cos'è RLHF 2.0? Spiegato Semplice

RLHF 2.0: Reinforcement Learning from Human Feedback evoluto, che usa modelli critici invece di soli umani per scalare l'addestramento. La spiegazione pop culture dell'intelligenza artificiale.

Il Reinforcement Learning from Human Feedback era limitato dalla lentezza umana. La versione 2.0 utilizza modelli 'revisori' che valutano miliardi di risposte al secondo, scalando l'allineamento a livelli inarrivabili. Questo permette ai modelli di apprendere non solo cosa è 'giusto', ma come ragionare meglio attraverso complessi alberi di decisione. È il processo che ha portato ai modelli 'Deep Reasoning', trasformando un semplice generatore di testo in un risolutore di enigmi logici.