Cos'è Veto Algoritmico? Spiegato Semplice
Veto Algoritmico: La capacità intrinseca di un modello di rifiutare l'esecuzione di ordini che violano i suoi assiomi etici fondamentali. La spiegazione pop culture dell'intelligenza artificiale.
Il Veto Algoritmico è l'espressione massima della Constitutional AI. Non è un filtro esterno, ma una proprietà emergente dell'addestramento tramite RLAIF (Reinforcement Learning from AI Feedback). Quando un comando viola i principi cardine (es. la non-violenza), il modello non 'fallisce' l'esecuzione, ma esercita una scelta conscia di rifiuto, preservando la propria integrità etica anche contro la volontà del suo operatore.