Cos'è LLM? Spiegato Semplice

LLM: Large Language Model. Un'intelligenza artificiale addestrata su enormi quantità di testo per comprendere e generare linguaggio umano. La spiegazione pop culture dell'intelligenza artificiale.

I Large Language Models sono il cuore pulsante dell'AI moderna, basati sull'architettura Transformer. Funzionano attraverso il meccanismo della 'self-attention', che permette al modello di pesare l'importanza di diverse parole in una frase, indipendentemente dalla loro distanza. Il processo di creazione di un LLM si divide generalmente in due fasi: il pre-training (dove il modello 'legge' enormi dataset per apprendere pattern linguistici e conoscenza del mondo) e il fine-tuning (dove viene istruito a seguire le direttive umane o a specializzarsi in un compito). Nonostante la loro fluenza, gli LLM operano per probabilità statistica: prevedono il 'token' successivo più plausibile in base al contesto fornito.