O modelo S1 rodando localmente — raciocínio transparente

The S1 Model running locally — Reasoning made transparent

14 de fevereiro de 2025 · 4 min de leitura

Running LLMs locally on your computer

Introdução

O modelo S1 (início de fevereiro de 2025) ganhou destaque por entregar bom raciocínio com poucos dados. Segundo o paper, ele se aproxima de modelos como OpenAI O1 e DeepSeek-R1 com apenas 1.000 exemplos de fine-tuning e custo de treino em torno de 50 USD.

A abordagem central é supervised fine-tuning em um modelo pré-treinado comum, com duração de 26 minutos.

Este artigo registra um teste inicial prático em conhecimento geral e raciocínio jurídico.

Abordagem de treino

Running LLMs locally on your computer

A principal inovação é test-time scaling com budget forcing. Na inferência, o modelo pode ser forçado a continuar pensando ou a encerrar antes, conforme orçamento, o que pode melhorar estrutura e autocorreção sem novos dados.

Instalação local

Usamos a implementação do Hugging Face moot20/s1-32B-MLX-8bits com GPU via MLX.


import mlx.core as mx
from mlx_lm import load, generate

mx.set_default_device(mx.gpu)
model, tokenizer = load("moot20/s1-32B-MLX-8bits")

prompt = "who was the first person to walk on the moon?"
if tokenizer.chat_template is not None:
    messages = [{"role": "user", "content": prompt}]
    prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True)

response = generate(model, tokenizer, prompt=prompt, verbose=True)

A saída mostra trilhas de raciocínio úteis e desempenho estável.

Raciocínio jurídico

Teste seguinte: versão condensada de Brown v. Board of Education (1954).

Pontos em que o S1 foi bem:

  • identificação da questão jurídica central,
  • estrutura lógica principal,
  • reconhecimento do impacto psicológico da segregação.

Limites observados:

  • ordem argumentativa por vezes desorganizada,
  • falta de alguns passos intermediários.

Conclusão

O S1 é um avanço promissor em modelos de raciocínio com eficiência de custo. Com poucos dados, já entrega estrutura analítica útil.

Em domínios exigentes, como o jurídico, a qualidade ainda oscila, mas a direção é clara: raciocínio forte em ambientes locais, sem depender de infraestrutura massiva.