Il modello S1 in locale — reasoning reso trasparente

The S1 Model running locally — Reasoning made transparent

14 febbraio 2025 · 4 min di lettura

Introduzione

Il modello S1 (inizio febbraio 2025) ha attirato attenzione per le sue capacità di reasoning con training minimale. Secondo il paper, arriva vicino a modelli come OpenAI O1 e DeepSeek-R1 con soli 1.000 esempi e circa 50 USD di costo training.

Approccio: supervised fine-tuning su un modello pre-addestrato standard, in 26 minuti.

Qui documentiamo un primo test pratico su conoscenza generale e reasoning legale.

Approccio di training

L’idea chiave è test-time scaling con budget forcing: durante l’inferenza si può forzare il modello a proseguire nel ragionamento o fermarsi prima, migliorando in parte qualità e autocorrezione senza nuovi dati.

Installazione locale

Usiamo l’implementazione Hugging Face moot20/s1-32B-MLX-8bits con supporto GPU MLX.


import mlx.core as mx
from mlx_lm import load, generate

mx.set_default_device(mx.gpu)
model, tokenizer = load("moot20/s1-32B-MLX-8bits")

prompt = "who was the first person to walk on the moon?"
if tokenizer.chat_template is not None:
    messages = [{"role": "user", "content": prompt}]
    prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True)

response = generate(model, tokenizer, prompt=prompt, verbose=True)

L’output mostra reasoning step-by-step leggibile e prestazioni stabili.

Reasoning legale

Secondo test: versione condensata della sentenza Brown v. Board of Education (1954).

S1 riconosce bene:

la questione legale centrale,
la struttura logica,
l’impatto psicologico della segregazione.

Limiti:

ordine argomentativo non sempre lineare,
alcuni passaggi intermedi mancanti.

Conclusione

S1 è uno sviluppo molto interessante per modelli di reasoning efficienti nei costi. Con pochi dati fornisce già una buona capacità analitica.

In domini ad alta precisione (come il diritto) resta variabilità qualitativa, ma la direzione è promettente per portare reasoning avanzato in ambienti locali.