Large Language Models são modelos de deep learning treinados em grandes volumes de texto para compreender e gerar linguagem natural. A partir de 2022/2023, tornaram-se ferramentas práticas de produtividade e desenvolvimento.

Principais famílias

FamíliaEmpresaModelos
GPT / o-seriesOpenAIGPT-4o, o3, o4-mini
ClaudeAnthropicOpus, Sonnet, Haiku
GeminiGoogleFlash, Pro, Ultra
LlamaMetaLlama 3, 3.1, 3.2
MistralMistral AIMistral, Mixtral

Conceitos fundamentais

  • Token: unidade básica de texto processada pelo modelo (~0,75 palavras em inglês)
  • Context window: limite de tokens que o modelo processa por vez (4k a 1M+)
  • Temperature: controla aleatoriedade da resposta (0 = determinístico, 1+ = criativo)
  • Top-p / Top-k: estratégias de amostragem que afetam diversidade do output
  • System prompt: instrução persistente que define comportamento do modelo
  • Tool use / Function calling: capacidade do modelo de chamar funções externas

Formas de acesso

  • API direta: Anthropic API, OpenAI API, Google AI Studio / Vertex AI
  • Gateway unificado: openrouter agrega múltiplos provedores numa API só
  • CLI / Agentes: llm-claude-code, llm-codex operam diretamente no terminal

Observabilidade

Para monitorar uso, custo e qualidade em produção: langfuse

Ferramentas de coding com LLMs

Ver também: sdd | langfuse | openrouter