Vai al contenuto principale
POST
/
v1
/
jobs
Async jobs
curl --request POST \
  --url https://scrape.cleariflow.com/v1/jobs \
  --header 'Content-Type: application/json' \
  --data '
{
  "request": {},
  "priority": 123
}
'
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000"
}

Per iniziare

URL base

https://scrape.cleariflow.com/v1/jobs

Creare un job

Accoda uno scrape asincrono con lo stesso payload ScrapeRequest usato dall’endpoint sincrono.

Esempio di richiesta

curl -X POST 'https://scrape.cleariflow.com/v1/jobs' \
  -H 'Content-Type: application/json' \
  -d '{
    "request": {
      "api_key": "YOUR_UNIQUE_API_KEY",
      "url": "https://example.com"
    },
    "priority": 10
  }'
Questa richiesta riuscita restituisce un identificatore del job:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000"
}

Parametri per creare un job

request
Object
obbligatorio
Un oggetto ScrapeRequest con gli stessi campi dell’endpoint di scraping sincrono (url, render, actions, cookies, ecc.).
priority
Integer
Priorità del job. I valori più alti vengono elaborati per primi. Predefinito: 0.

Ottenere lo stato del job

Interroga un job per ID per verificarne lo stato e recuperare i risultati al completamento.

URL base

https://scrape.cleariflow.com/v1/jobs/{job_id}

Esempio di richiesta

curl 'https://scrape.cleariflow.com/v1/jobs/550e8400-e29b-41d4-a716-446655440000'
Mentre il job è in esecuzione:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "running"
}
Al completamento con successo:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "done",
  "result": {
    "ok": true,
    "html": "<!DOCTYPE html><html>...</html>",
    "meta": {
      "url": "https://example.com",
      "status_code": 200,
      "duration_ms": 8123
    }
  }
}

Valori di stato del job

StatoDescrizione
queuedIl job è in attesa in coda.
runningLa sessione del browser è attiva.
doneScraping completato; result contiene l’output.
failedScraping fallito; error contiene una descrizione.

Parametri della risposta

job_id
String
Identificatore univoco del job asincrono.
status
String
Stato attuale del job: queued, running, done o failed.
result
Object
L’oggetto risultato dello scraping (stessa struttura della risposta dell’endpoint sincrono). Presente quando status è done.
error
String
Messaggio di errore. Presente quando status è failed.
meta
Object
Metadati aggiuntivi sull’esecuzione del job.