Zum Hauptinhalt springen

Erste Schritte

Synchrones Scraping

Der scrape-Endpunkt startet eine Browser-Sitzung und liefert gerendertes HTML in einer einzigen Anfrage — ideal für Integrationen mit niedriger Latenz.

Asynchrone Jobs

Die jobs-Endpunkte stellen Scraping-Aufgaben in die Warteschlange und ermöglichen das Abfragen von Status und Ergebnissen — ideal für hohes Volumen oder langsame Seiten.

REST-Architektur

Die Web-Scraping-API folgt REST-Prinzipien mit vorhersehbaren, ressourcenorientierten URLs und standardmäßigen HTTP-Statuscodes für nahtlose Integration und Fehlerbehandlung.

HTTPS-Sicherheit

Alle API-Kommunikation wird mit TLS 1.2 oder höher verschlüsselt, um Datenintegrität und Datenschutz zu gewährleisten.

API-Versionierung

Die Web-Scraping-API bleibt durch Versionierung abwärtskompatibel und befindet sich derzeit in Version 1.

Authentifizierung

Ihr API-Schlüssel ist die ausschließliche Berechtigung für den Zugriff auf die Web-Scraping-API. Jeder Cleariflow-Dienst erfordert einen eigenen Schlüssel. Übergeben Sie Ihren Schlüssel im JSON-Body als api_key.

Basis-URL

https://scrape.cleariflow.com

Browser-Rendering

Seiten werden in einem echten Headless-Browser gerendert. JavaScript wird vollständig ausgeführt, bevor Inhalte zurückgegeben werden. Integrierter SSRF-Schutz blockiert Anfragen an localhost und private IP-Bereiche.

Antwort- und Fehlercodes

Bei fehlgeschlagenen Anfragen liefert die API strukturierte JSON-Fehlerantworten mit spezifischen Codes und Beschreibungen zur effektiven Fehlerbehebung.
CodeTypBeschreibung
200OKAlles funktionierte wie erwartet.
202AcceptedAsynchroner Job wurde erfolgreich in die Warteschlange gestellt.
400Bad requestFehlerhafte Anfrage — ungültige URL, blockiertes Ziel oder fehlerhafte Nutzlast.
401UnauthorizedDie Anfrage war nicht zulässig — in der Regel fehlt der API-Schlüssel oder er ist ungültig.
422Quota reachedDie Anfrage wurde abgebrochen, da nicht genügend API-Guthaben vorhanden ist (kostenlose Tarife).
429Too many requestsDas Anfragenlimit pro Sekunde wurde erreicht. Bei kostenlosen Tarifen gilt ein Limit von 1 Anfrage pro Sekunde.
500Internal server errorDie Anfrage konnte aufgrund eines Serverfehlers nicht abgeschlossen werden.