Saltar al contenido principal
POST
/
v1
/
jobs
Async jobs
curl --request POST \
  --url https://scrape.cleariflow.com/v1/jobs \
  --header 'Content-Type: application/json' \
  --data '
{
  "request": {},
  "priority": 123
}
'
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000"
}

Primeros pasos

URL base

https://scrape.cleariflow.com/v1/jobs

Crear un trabajo

Encole un trabajo de scraping asíncrono con la misma carga ScrapeRequest que usa el endpoint síncrono.

Solicitud de ejemplo

curl -X POST 'https://scrape.cleariflow.com/v1/jobs' \
  -H 'Content-Type: application/json' \
  -d '{
    "request": {
      "api_key": "YOUR_UNIQUE_API_KEY",
      "url": "https://example.com"
    },
    "priority": 10
  }'
Esta solicitud exitosa devuelve un identificador de trabajo:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000"
}

Parámetros para crear un trabajo

request
Object
requerido
Un objeto ScrapeRequest con los mismos campos que el endpoint de scraping síncrono (url, render, actions, cookies, etc.).
priority
Integer
Prioridad del trabajo. Los valores más altos se procesan primero. Por defecto: 0.

Obtener estado del trabajo

Consulte un trabajo por ID para verificar su estado y recuperar resultados al completarse.

URL base

https://scrape.cleariflow.com/v1/jobs/{job_id}

Solicitud de ejemplo

curl 'https://scrape.cleariflow.com/v1/jobs/550e8400-e29b-41d4-a716-446655440000'
Mientras el trabajo está en ejecución:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "running"
}
Cuando el trabajo se completa con éxito:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "done",
  "result": {
    "ok": true,
    "html": "<!DOCTYPE html><html>...</html>",
    "meta": {
      "url": "https://example.com",
      "status_code": 200,
      "duration_ms": 8123
    }
  }
}

Valores de estado del trabajo

StatusDescription
queuedEl trabajo está en cola de espera.
runningLa sesión del navegador está activa.
doneScraping completado; result contiene la salida.
failedScraping fallido; error contiene una descripción.

Parámetros de respuesta

job_id
String
Identificador único del trabajo asíncrono.
status
String
Estado actual del trabajo: queued, running, done o failed.
result
Object
El objeto de resultado del scraping (misma estructura que la respuesta del endpoint síncrono). Presente cuando status es done.
error
String
Mensaje de error. Presente cuando status es failed.
meta
Object
Metadatos adicionales sobre la ejecución del trabajo.