Large Language Models são modelos de deep learning treinados em grandes volumes de texto para compreender e gerar linguagem natural. A partir de 2022/2023, tornaram-se ferramentas práticas de produtividade e desenvolvimento.
Principais famílias
| Família | Empresa | Modelos |
|---|---|---|
| GPT / o-series | OpenAI | GPT-4o, o3, o4-mini |
| Claude | Anthropic | Opus, Sonnet, Haiku |
| Gemini | Flash, Pro, Ultra | |
| Llama | Meta | Llama 3, 3.1, 3.2 |
| Mistral | Mistral AI | Mistral, Mixtral |
Conceitos fundamentais
- Token: unidade básica de texto processada pelo modelo (~0,75 palavras em inglês)
- Context window: limite de tokens que o modelo processa por vez (4k a 1M+)
- Temperature: controla aleatoriedade da resposta (0 = determinístico, 1+ = criativo)
- Top-p / Top-k: estratégias de amostragem que afetam diversidade do output
- System prompt: instrução persistente que define comportamento do modelo
- Tool use / Function calling: capacidade do modelo de chamar funções externas
Formas de acesso
- API direta: Anthropic API, OpenAI API, Google AI Studio / Vertex AI
- Gateway unificado: openrouter agrega múltiplos provedores numa API só
- CLI / Agentes: llm-claude-code, llm-codex operam diretamente no terminal
Observabilidade
Para monitorar uso, custo e qualidade em produção: langfuse
Ferramentas de coding com LLMs
- llm-claude-code: CLI da Anthropic, com suporte nativo a sdd
- llm-codex: Codex CLI da OpenAI, orientado a agente autônomo
- llm-gemini: Gemini via API/AI Studio, multimodal
Ver também: sdd | langfuse | openrouter