Zum Hauptinhalt springen
POST
/
v1
/
jobs
Async jobs
curl --request POST \
  --url https://scrape.cleariflow.com/v1/jobs \
  --header 'Content-Type: application/json' \
  --data '
{
  "request": {},
  "priority": 123
}
'
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000"
}

Erste Schritte

Basis-URL

https://scrape.cleariflow.com/v1/jobs

Job erstellen

Stellen Sie einen asynchronen Scraping-Job in die Warteschlange mit derselben ScrapeRequest-Nutzlast wie beim synchronen Endpunkt.

Beispielanfrage

curl -X POST 'https://scrape.cleariflow.com/v1/jobs' \
  -H 'Content-Type: application/json' \
  -d '{
    "request": {
      "api_key": "YOUR_UNIQUE_API_KEY",
      "url": "https://example.com"
    },
    "priority": 10
  }'
Diese erfolgreiche Anfrage liefert eine Job-ID:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000"
}

Parameter zum Erstellen eines Jobs

request
Object
erforderlich
Ein ScrapeRequest-Objekt mit denselben Feldern wie beim synchronen Scraping-Endpunkt (url, render, actions, cookies usw.).
priority
Integer
Job-Priorität. Höhere Werte werden zuerst verarbeitet. Standard: 0.

Job-Status abfragen

Fragen Sie einen Job anhand seiner ID ab, um den Status zu prüfen und Ergebnisse nach Abschluss abzurufen.

Basis-URL

https://scrape.cleariflow.com/v1/jobs/{job_id}

Beispielanfrage

curl 'https://scrape.cleariflow.com/v1/jobs/550e8400-e29b-41d4-a716-446655440000'
Während der Job läuft:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "running"
}
Bei erfolgreichem Abschluss:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "done",
  "result": {
    "ok": true,
    "html": "<!DOCTYPE html><html>...</html>",
    "meta": {
      "url": "https://example.com",
      "status_code": 200,
      "duration_ms": 8123
    }
  }
}

Job-Statuswerte

StatusBeschreibung
queuedJob wartet in der Warteschlange.
runningBrowser-Sitzung ist aktiv.
doneScraping abgeschlossen; result enthält die Ausgabe.
failedScraping fehlgeschlagen; error enthält eine Beschreibung.

Antwortparameter

job_id
String
Eindeutige Kennung des asynchronen Jobs.
status
String
Aktueller Job-Status: queued, running, done oder failed.
result
Object
Das Scraping-Ergebnis (gleiche Struktur wie die synchrone Endpunkt-Antwort). Vorhanden, wenn status done ist.
error
String
Fehlermeldung. Vorhanden, wenn status failed ist.
meta
Object
Zusätzliche Metadaten zur Job-Ausführung.