vllm

Ordina per:Più recentePiù letto

OpenAI porta l'IA su laptop e smartphone con due nuovi modelli open source

Per gli sviluppatori, OpenAI ha reso disponibili documentazioni dettagliate su piattaforme come Hugging Face, vLLM, Ollama e llama.cpp, facilitando l'integrazione e il fine - tuning dei modelli per ...

Zeus News - 11 ore fa

Persone:oss

Organizzazioni:openai cerebras

Prodotti:intelligenza artificiale smartphone

Tags:gpt 120b

OpenAI lancia modelli AI che funzionano su laptop e smartphone

Ha stretto partnership con Microsoft Azure , Hugging Face , vLLM, Ollama , e una lunga lista di aziende per rendere questi modelli accessibili ovunque. Microsoft sta addirittura creando versioni GPU -...

Punto Informatico - 6-8-2025

Persone:oss

Organizzazioni:hugging face openai microsoft

Prodotti:smartphone laptop

Tags:modelli oss 20b

OpenAI gpt - oss: lo stato dell'arte dell'AI, ora open e alla portata di tutti

A tal fine, prima del lancio ha stretto partnership con piattaforme di deployment leader come Hugging Face, Azure, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks,...

01Net - 5-8-2025

Persone:oss deepseek

Organizzazioni:openai gpt cerebras

Prodotti:open intelligenza artificiale

Luoghi:stati uniti

Tags:modelli gpt

OpenAi lancia due modelli open - weight e invade il campo di DeepSeek e Llama

... implementare i guardrail e integrare i modelli con Hugging Face, vLLM, Ollama, llama.cpp e le principali piattaforme di GPU/accelerator. Consigli24 I migliori consigli su prodotti di tecnologia, ...

Il Sole 24 Ore - 5-8-2025

Persone:oss sam altman

Organizzazioni:openai agi

Prodotti:gpu open

Luoghi:stati uniti

Tags:deepseek gpt

Red Hat, il futuro dell'AI è sempre più 'open'

In questo modo si rende sostanzialmente agnostico il modello dall'infrastruttura sottostante, ottimizzandolo con la tecnologia vLLM'. Il prodotto specifico è Inference Server la cui tecnologia è ...

Impresa City - 23-7-2025

Persone:galli rodolfo falcone

Organizzazioni:red hat rhel 10

Prodotti:cloud sistema operativo

Luoghi:boston g11 media

Tags:tecnologia modelli

Le Voci dell'AI " Episodio 108: Batching continuo: il segreto dietro la velocità di risposta dei modelli di AI nel cloud

Il successo di vLLM riflette la crescente necessità del settore di soluzioni scalabili, efficienti e open source per offrire inferenza di alta qualità a un numero sempre maggiore di utenti, quindi ...

01Net - 8-7-2025

Persone:vincenzo lomonaco ricercatori

Organizzazioni:vllm università di pisa

Prodotti:cloud gpu

Tags:batching token

vllm

il nostro network