reinforcement learning

Ordina per:Più recentePiù letto

Deep Think 2.5 è l'AI più potente di Google, ma vale davvero 250 dollari al mese?

Fonte della foto: everyeye.it - Tech & Scienza

Google sottolinea inoltre l'introduzione di nuove tecniche di reinforcement learning per migliorare la gestione dei 'ragionamenti paralleli', e ha iniziato a distribuire il modello utilizzato alle ...

everyeye.it - Tech & Scienza - 1-8-2025

Persone:ultra

Organizzazioni:google openai

Prodotti:jet force gemini varianti

Tags:deep think abbonati

Claude AI, come funziona e quanto costa l'alternativa a ChatGPT

La seconda fase si basa sul " Reinforcement Learning from Human Feedback ", un processo che utilizza feedback umani per ottimizzare le risposte in base a criteri di sicurezza, chiarezza e ...

Money.it - 31-7-2025

Persone:claude claude opus

Organizzazioni:anthropic openai

Prodotti:jet force gemini intelligenza artificiale

Tags:chatgpt modello

AI addestrata per creare malware invisibile a Microsoft Defender

Al prossimo Black Hat sarà presentato un modello open source basato su reinforcement learning che può imparare ad aggirare Microsoft Defender for Endpoint, uno degli EDR più diffusi in ambito enterprise. Il ricercatore ha costruito un ambiente in cui il modello - Qwen 2.

Notizie.AI - 24-7-2025

Persone:ricercatori

Organizzazioni:edr microsoft defender for endpoint

Prodotti:api gpu

Tags:malware invisibile microsoft defender

EA Sports FC 26: un nuovo trailer commentato svela le principali novità del gameplay

Il posizionamento dei portieri è stato completamente rivisto grazie all'uso del reinforcement learning, promettendo interventi più intelligenti e coerenti. Anche il sistema di dribbling è stato ...

IGN Italia - 23-7-2025

Persone:ibra calciatori

Organizzazioni:playstyles fut

Prodotti:gameplay intelligenza artificiale

Luoghi:bellingham musiala

Tags:ea sports fc 26 trailer commentato

Dopo OpenAI anche Gemini Deep Think conquista la medaglia d'oro all'IMO 2025

Inoltre la versione coinvolta nell'edizione 2025 delle Olimpiadi della Matematica è stata ulteriormente addestrata con tecniche di reinforcement learning all'avanguardia, potendo quindi gestire in ...

Hardware Upgrade - 22-7-2025

Persone:gregor dolinar lean

Organizzazioni:openai imo

Prodotti:jet force gemini auricolari

Tags:gemini deep think medaglia d'oro

Così Apple addestra e ottimizza i modelli AI di Apple Intelligence

Successivamente, i dati sono stati affinati su una nuova piattaforma asincrona attraverso supervised fine - tuning , un ulteriore addestramento con esempi annotati da umani, e reinforcement learning ,...

01Net - 22-7-2025

Organizzazioni:apple models

Prodotti:dispositivi mobili chip

Luoghi:cupertino

Tags:modelli apple intelligence

OpenAI, l'IA conquista l'oro all'Olimpiade Internazionale della Matematica 2025

Questo successo, secondo OpenAI, è stato possibile non grazie a metodologie specializzate su singole tipologie di problemi, bensì tramite nuove tecniche di reinforcement learning generalizzato e l'...

Hardware Upgrade - 21-7-2025

Persone:alexander wei sam altman

Organizzazioni:openai international math olympiad 2025

Prodotti:intelligenza artificiale ssd

Luoghi:imo state

Tags:olimpiade internazionale matematica 2025

Apple svela come ha addestrato i suoi nuovi modelli di intelligenza artificiale

Il risultato? Performance molto più alte nei test in lingue non inglesi, grazie anche al reinforcement learning e a prompt scritti da madrelingua. 4. Da dove ha preso Apple i dati per addestrare i ...

iPhoneItalia - 21-7-2025

Organizzazioni:apple condé nast

Prodotti:intelligenza artificiale cloud

Tags:modelli apple intelligence

Un malware AI ha superato le difese di Microsoft Defender: milioni di PC a rischio?

Avery ha addestrato un modello linguistico open source (Qwen 2.5) utilizzando tecniche di reinforcement learning , investendo circa 1.500 - 1.600 dollari e impiegando tre mesi di lavoro . Il ...

Hardware Upgrade - 16-7-2025

Persone:kyle avery ricercatori

Organizzazioni:outflank gddr7

Prodotti:pc fotocamera

Luoghi:las vegas a18

Tags:microsoft defender malware

Guardate questo video di un cane robot che scala un muro!

La particolarità del progetto risiede in una combinazione tra design flessibile e algoritmi di Reinforcement Learning, che hanno permesso al robot di apprendere in simulazione (metodo utilizzato ...

everyeye.it - Tech & Scienza - 14-7-2025

Persone:reinforcement learning

Organizzazioni:atlas

Prodotti:robot

Luoghi:giappone tokyo

Tags:video kleiyn

reinforcement learning

il nostro network