Modelli linguistici fino a 3 volte più veloci: non serve avere una mega GPU

 
 
17-7-2025
Scienza e Tecnologia - Alla base del miglioramento c'è una nuova variante della tecnica nota come speculative decoding , che consiste nell'utilizzare un modello linguistico più piccolo (detto "drafter") per anticipare la generazione del modello principale. Se ... ...
Gli articoli sono stati selezionati e posizionati in questa pagina in modo automatico. L'ora o la data visualizzate si riferiscono al momento in cui l'articolo è stato aggiunto o aggiornato in Libero 24x7