Schema Markup JSON-LD Automático com OpenClaw

Porquê os Dados Estruturados São Decisivos em 2026

O Schema Markup é um vocabulário normalizado — definido em Schema.org — que permite comunicar ao Google (e a outros motores de busca) informação semântica precisa sobre o conteúdo de uma página: o que é, quem o escreveu, qual o preço, qual a classificação, quais as perguntas e respostas disponíveis. Esta informação é injectada no HTML da página em formato JSON-LD dentro de uma tag <script type="application/ld+json"> — invisível para o utilizador, mas crítica para os bots de indexação.

Em 2026, a importância dos dados estruturados extrapolou o SEO clássico. Os AI Overviews do Google e os motores de resposta gerativos (ChatGPT Search, Perplexity) dependem fortemente de schema markup para verificar factos, extrair preços, ratings e disponibilidade em tempo real, e decidir quais as fontes a citar. Sem schema, uma página torna-se opaca para esta camada de IA — mesmo que o seu conteúdo seja excelente.

O problema é que implementar schema correctamente à escala é complexo:

Cada tipo de página (produto, artigo, FAQ, local, evento) tem um schema distinto com campos obrigatórios e opcionais diferentes
Erros de sintaxe JSON invalidam o schema inteiro sem qualquer aviso visível
Sites com 50, 100 ou 500 páginas tornam a implementação manual impraticável
A manutenção — actualizar preços, disponibilidade, ratings — é um processo recorrente que ninguém faz manualmente de forma consistente

É precisamente aqui que ferramentas de automação ganham relevância. Plataformas como a Alli AI e a Schema App automatizam a geração e injecção de schema — mas a um custo de subscrição mensal significativo, com configuração que exige integração com o CMS, e sem a flexibilidade de um agente que podes instruir em linguagem natural. O OpenClaw resolve o mesmo problema com uma abordagem radicalmente diferente: sem subscrição adicional, sem integração de plataforma, e com controlo total sobre o output.

Como o OpenClaw Aborda a Geração de Schema

O OpenClaw tem acesso a um browser controlado que lhe permite navegar para qualquer URL, ler o conteúdo da página, analisar a sua estrutura e gerar output estruturado. Para geração de schema, o fluxo de trabalho é simples: o agente lê a página, identifica o tipo de conteúdo, extrai os campos relevantes e compõe o JSON-LD correspondente.

Há duas formas principais de alimentar o agente com as URLs a processar:

Método A — Navegação directa via browser

O agente abre o browser, navega para cada URL, lê o DOM e o conteúdo visível, e gera o schema. Ideal para sites pequenos (até ~20 páginas) ou quando queres processar páginas individualmente com revisão interactiva entre cada uma.

Método B — CSV de URLs em lote

O agente recebe um ficheiro CSV com uma lista de URLs e metadados adicionais (título, descrição, preço, categoria…), itera sobre cada linha, e gera o schema para cada entrada. Ideal para sites com dezenas ou centenas de páginas e para pipelines de automação recorrentes.

Na prática, o método B é o mais poderoso para escala. Um CSV exportado directamente do teu CMS ou da Google Search Console já contém a maior parte da informação necessária para gerar schema de qualidade.

Passo-a-Passo: Configurar o OpenClaw para Geração de Schema

1. Preparar o contexto do agente

Antes de iniciar a sessão, cria um ficheiro de instruções de sistema (CLAUDE.md ou equivalente no teu directório de trabalho) com as regras que o agente deve seguir durante toda a sessão de geração de schema. Isto evita ter de repetir instruções a cada URL.

                    
# CLAUDE.md — instruções para sessão de schema markup

Objectivo: Gerar JSON-LD Schema Markup válido para cada URL fornecida.

Regras obrigatórias:
- Usar sempre o formato JSON-LD dentro de <script type="application/ld+json">
- Identificar automaticamente o @type correcto para cada página
- Incluir sempre: @context, @type, e todos os campos obrigatórios do tipo
- Validar a estrutura antes de apresentar (sem campos null ou vazios)
- Apresentar um bloco JSON-LD por URL, pronto a copiar/colar
- Se o tipo não for determinável, usar WebPage como fallback
                    
                

2. Preparar o CSV de URLs (Método B)

Exporta a lista de URLs do teu site. O formato mínimo necessário é uma coluna com a URL. Colunas adicionais enriquecem o output:

                    
url,tipo,titulo,preco,moeda,rating,num_reviews,disponivel

https://loja.pt/produto/cadeira-a,Product,Cadeira Ergonómica A,299.90,EUR,4.7,183,true

https://loja.pt/produto/mesa-b,Product,Mesa de Escritório B,449.00,EUR,4.5,97,true

https://loja.pt/blog/como-escolher-cadeira,Article,Como Escolher a Cadeira Certa,,,,

https://loja.pt/faq,FAQPage,Perguntas Frequentes,,,,

3. O prompt inicial da sessão

Com o CSV preparado e o CLAUDE.md no directório, inicia o OpenClaw e usa este prompt como ponto de partida:

                    
Lê o ficheiro produtos.csv no directório actual. Para cada linha,
gera o JSON-LD Schema Markup adequado ao tipo indicado na coluna
"tipo". Usa os dados das outras colunas para preencher os campos
do schema. Para campos não presentes no CSV mas necessários no
schema (ex: description, image), navega até à URL e extrai-os
directamente da página.

Apresenta o output como blocos de código numerados,
um por URL, precedidos pela URL a que correspondem.
Quando terminares todas as linhas, apresenta um resumo
com o número de schemas gerados por tipo.
                    
                

4. Revisão e injecção

O agente processa o CSV linha a linha, navega para as páginas onde necessário para recolher campos em falta, e produz os blocos JSON-LD. Depois de rever o output (a ferramenta de validação do Schema.org permite colar e validar instantaneamente), a injecção no site pode ser feita de três formas:

Manualmente: Colar o bloco <script type="application/ld+json">...</script> no <head> de cada página — adequado para sites estáticos ou volumes pequenos
Via CMS: WordPress (com plugin SEO como Yoast ou RankMath), Shopify, Webflow e a maioria dos CMS modernos têm campos nativos ou plugins para injectar schema personalizado por página
Via OpenClaw: O próprio agente pode ser instruído a injectar o schema directamente nos ficheiros HTML locais — útil para sites estáticos geridos em repositório Git

Caso Prático: 50 Páginas de Produto numa Sessão

Para tornar este tutorial concreto, vamos percorrer o fluxo completo para um e-commerce com 50 páginas de produto que precisa de schema Product com AggregateRating.

Contexto do caso prático

Site: E-commerce de mobiliário de escritório, 50 produtos activos

Objectivo: Schema Product + AggregateRating para todos os produtos, com preço e disponibilidade

Fonte de dados: CSV exportado do backoffice do e-commerce com URL, nome, preço, stock, ratings

Modelo usado: Claude Sonnet 4.6 via API (pay-as-you-go) — custo estimado para 50 páginas: $0.80–$1.50

O CSV de entrada

O backoffice exporta directamente um CSV com as colunas relevantes. Para as colunas em falta (descrição detalhada, URL da imagem principal), o agente vai navegar até à página e extrair.

                    
url,nome,preco,moeda,stock,rating,num_reviews,marca,sku

...50 linhas de produto...

O prompt para os 50 produtos

                    
Lê produtos.csv. Para cada linha, gera um bloco JSON-LD do tipo
Product com os seguintes campos obrigatórios:

@context, @type, name, description, image, sku, brand (com @type
Brand), offers (com @type Offer: price, priceCurrency, availability,
url), aggregateRating (com @type AggregateRating: ratingValue,
reviewCount).

Para description e image: navega à URL do produto e extrai
directamente da página. Para availability: se stock > 0 usa
"https://schema.org/InStock", senão "https://schema.org/OutOfStock".

Processa todas as 50 linhas sem parar para confirmação.
No final, lista as URLs onde não conseguiste extrair description
ou image e indica o motivo.
                    
                

Exemplo de output gerado para um produto

// Produto 1 — https://loja.pt/produto/cadeira-ergonomica-pro

<script type="application/ld+json">

{

  "@context": "https://schema.org",

  "@type": "Product",

  "name": "Cadeira Ergonómica Pro X200",

  "description": "Cadeira de escritório com suporte lombar ajustável, apoio de braços 4D e assento em malha respirável. Certificação EN 1335.",

  "image": "https://loja.pt/imagens/cadeira-pro-x200-main.jpg",

  "sku": "CAD-X200-PRE",

  "brand": { "@type": "Brand", "name": "ErgoDesk" },

  "offers": {

    "@type": "Offer",

    "price": "299.90",

    "priceCurrency": "EUR",

    "availability": "https://schema.org/InStock",

    "url": "https://loja.pt/produto/cadeira-ergonomica-pro"

  },

  "aggregateRating": {

    "@type": "AggregateRating",

    "ratingValue": "4.7",

    "reviewCount": "183"

  }

}

</script>

Resultados típicos para 50 produtos

~18 min

Tempo total para 50 produtos com navegação activa

~$1.20

Custo API estimado com Sonnet 4.6

48/50

Schemas completos sem intervenção manual (média)

100%

JSON válido (sem erros de sintaxe)

Os 2 schemas incompletos (em média) correspondem tipicamente a páginas com imagens servidas via CDN com URLs obfuscadas ou páginas com conteúdo carregado via JavaScript depois do DOM inicial — situações que o agente assinala no relatório final para revisão manual.

Outros Tipos de Schema que o OpenClaw Gera

O fluxo acima foi demonstrado para Product, mas a abordagem funciona para qualquer tipo de schema suportado pelo vocabulário Schema.org:

Article / NewsArticle / BlogPosting: Para posts de blog, artigos de imprensa ou conteúdo editorial. Inclui headline, author, datePublished, image, publisher. O agente extrai datas de publicação do meta ou do conteúdo visível.

FAQPage: Para páginas de perguntas frequentes ou secções FAQ dentro de outras páginas. O agente identifica pares pergunta/resposta no DOM e estrutura-os em mainEntity com objectos Question e Answer. Particularmente valioso para aparecer em featured snippets.

LocalBusiness: Para páginas de negócios locais, clínicas, restaurantes ou qualquer entidade com morada física. Inclui address, telephone, openingHours, geo — campos que alimentam directamente o Knowledge Panel do Google.

HowTo: Para páginas de tutoriais e guias passo-a-passo. O agente identifica a sequência de passos no conteúdo e estrutura-os em step com HowToStep — o tipo de schema que alimenta as rich results de "como fazer" nos resultados de pesquisa.

BreadcrumbList: Para navegação hierárquica. O agente lê os breadcrumbs visíveis na página e estrutura a lista de itens com BreadcrumbList — melhora a apresentação do URL nos resultados de pesquisa e reforça a arquitectura de informação do site para os bots.

OpenClaw vs. Ferramentas Dedicadas de Schema

Vale a pena enquadrar o posicionamento do OpenClaw face às ferramentas dedicadas que existem no mercado para este propósito:

Critério	OpenClaw	Alli AI	Schema App
Custo	Custo de API (~$1/50 pág.)	A partir de $299/mês	A partir de $99/mês
Integração CMS	Manual / via agente	Nativa (WP, Shopify…)	Nativa + plugin
Flexibilidade de schema	Total (qualquer tipo)	Limitada a templates	Alta mas guiada por UI
Automação recorrente	Requer agendamento manual	Automática e contínua	Automática e contínua
Curva de aprendizagem	Baixa (linguagem natural)	Média (onboarding)	Alta (configuração técnica)

O OpenClaw não substitui uma plataforma dedicada em cenários onde a sincronização de schema em tempo real (actualização de preços ou stock a cada alteração no CMS) é crítica. Para esses casos, a integração nativa das plataformas especializadas tem vantagem. O OpenClaw é a melhor opção para geração de schema ad-hoc, sites sem CMS convencional, auditorias pontuais, e qualquer contexto onde a flexibilidade e o controlo sobre o output importam mais do que a automação contínua.

Validação e Próximos Passos

Após gerar o schema com o OpenClaw, o passo seguinte obrigatório é validar. Usa estas ferramentas antes de injectar em produção:

validator.schema.org — Validador oficial do Schema.org. Cola o JSON-LD gerado directamente e verifica erros de sintaxe e campos obrigatórios em falta. Gratuito e sem registo.

Google Rich Results Test — Confirma se o schema gerado é elegível para rich results no Google (estrelas de avaliação, preços, FAQs nos resultados de pesquisa). Mostra um preview da rich result esperada.

Google Search Console → Melhorias — Após publicar o schema, a Search Console começa a reportar erros e avisos de schema detectados pelo Googlebot dentro de 48–72 horas. É o feedback mais fiável sobre o impacto real do schema em indexação.

Experimenta a Geração de Schema com OpenClaw

Prepara um CSV com as URLs do teu site, inicia uma sessão no OpenClaw e gera o teu primeiro lote de JSON-LD. Para SEO técnico a sério, dados estruturados correctos são uma das melhorias de maior impacto com menor esforço — especialmente quando automatizados.

Repositório GitHub Ver: Auditoria SEO de Meta-Tags

Perguntas Frequentes

O schema gerado pelo OpenClaw é validado automaticamente?

O OpenClaw gera JSON-LD sintaticamente correcto — o modelo de linguagem garante estrutura JSON válida. No entanto, a validação semântica (campos obrigatórios segundo as directrizes do Google, tipos correctos para cada campo) deve ser feita com o validator.schema.org ou o Google Rich Results Test antes de injectar em produção. No prompt, podes instruir o agente a incluir um comentário por cada campo que não conseguiu preencher — facilita a revisão.

Quantas páginas o OpenClaw consegue processar numa sessão?

Depende do modelo e da janela de contexto. Com Sonnet 4.6, é prático processar 50–100 páginas numa sessão contínua. Para volumes superiores, divide o CSV em lotes de 50 e corre sessões separadas — o custo por sessão mantém-se baixo. Para sites com centenas de páginas, considera usar o método CSV com dados pré-preenchidos do backoffice em vez de navegação activa para cada URL, o que reduz significativamente o tempo e custo por página.

Posso usar o OpenClaw para actualizar schema existente (ex: preços)?

Sim. Podes instruir o agente a ler os ficheiros HTML locais (ou o código fonte das páginas), identificar os blocos JSON-LD existentes, e substituir apenas os campos que mudaram (preço, disponibilidade, rating). Para sites em CMS, o agente pode navegar à página de administração e editar o campo de schema personalizado directamente — se o agente tiver acesso ao browser autenticado no backoffice.

O schema gerado afecta o tempo de carregamento da página?

O impacto é negligenciável. Um bloco JSON-LD típico (Product com AggregateRating) tem entre 500 e 1500 bytes — menos de 1.5 KB. Injectado no <head>, não bloqueia o rendering nem afecta métricas Core Web Vitals. O Google recomenda explicitamente JSON-LD como o formato preferido para schema precisamente por ser não-intrusivo para a performance da página.