O modelo S1 rodando localmente — raciocínio transparente

14 de fevereiro de 2025 · 4 min de leitura
Introdução
O modelo S1 (início de fevereiro de 2025) ganhou destaque por entregar bom raciocínio com poucos dados. Segundo o paper, ele se aproxima de modelos como OpenAI O1 e DeepSeek-R1 com apenas 1.000 exemplos de fine-tuning e custo de treino em torno de 50 USD.
A abordagem central é supervised fine-tuning em um modelo pré-treinado comum, com duração de 26 minutos.
Este artigo registra um teste inicial prático em conhecimento geral e raciocínio jurídico.
Abordagem de treino
A principal inovação é test-time scaling com budget forcing. Na inferência, o modelo pode ser forçado a continuar pensando ou a encerrar antes, conforme orçamento, o que pode melhorar estrutura e autocorreção sem novos dados.
Instalação local
Usamos a implementação do Hugging Face moot20/s1-32B-MLX-8bits com GPU via MLX.
import mlx.core as mx
from mlx_lm import load, generate
mx.set_default_device(mx.gpu)
model, tokenizer = load("moot20/s1-32B-MLX-8bits")
prompt = "who was the first person to walk on the moon?"
if tokenizer.chat_template is not None:
messages = [{"role": "user", "content": prompt}]
prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True)
response = generate(model, tokenizer, prompt=prompt, verbose=True)
A saída mostra trilhas de raciocínio úteis e desempenho estável.
Raciocínio jurídico
Teste seguinte: versão condensada de Brown v. Board of Education (1954).
Pontos em que o S1 foi bem:
- identificação da questão jurídica central,
- estrutura lógica principal,
- reconhecimento do impacto psicológico da segregação.
Limites observados:
- ordem argumentativa por vezes desorganizada,
- falta de alguns passos intermediários.
Conclusão
O S1 é um avanço promissor em modelos de raciocínio com eficiência de custo. Com poucos dados, já entrega estrutura analítica útil.
Em domínios exigentes, como o jurídico, a qualidade ainda oscila, mas a direção é clara: raciocínio forte em ambientes locais, sem depender de infraestrutura massiva.