跳转到主要内容
POST
/
v1
/
jobs
Async jobs
curl --request POST \
  --url https://scrape.cleariflow.com/v1/jobs \
  --header 'Content-Type: application/json' \
  --data '
{
  "request": {},
  "priority": 123
}
'
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000"
}

入门

基础 URL

https://scrape.cleariflow.com/v1/jobs

创建任务

使用与同步端点相同的 ScrapeRequest 负载将异步抓取任务入队。

请求示例

curl -X POST 'https://scrape.cleariflow.com/v1/jobs' \
  -H 'Content-Type: application/json' \
  -d '{
    "request": {
      "api_key": "YOUR_UNIQUE_API_KEY",
      "url": "https://example.com"
    },
    "priority": 10
  }'
成功请求返回任务 ID:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000"
}

创建任务参数

request
Object
必填
与同步抓取端点字段相同的 ScrapeRequest 对象(urlrenderactionscookies 等)。
priority
Integer
任务优先级。数值越高越先处理。默认:0。

获取任务状态

通过 ID 轮询任务以检查状态,并在完成后获取结果。

基础 URL

https://scrape.cleariflow.com/v1/jobs/{job_id}

请求示例

curl 'https://scrape.cleariflow.com/v1/jobs/550e8400-e29b-41d4-a716-446655440000'
任务运行中:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "running"
}
任务成功完成时:
{
  "job_id": "550e8400-e29b-41d4-a716-446655440000",
  "status": "done",
  "result": {
    "ok": true,
    "html": "<!DOCTYPE html><html>...</html>",
    "meta": {
      "url": "https://example.com",
      "status_code": 200,
      "duration_ms": 8123
    }
  }
}

任务状态值

状态说明
queued任务在队列中等待。
running浏览器会话活跃中。
done抓取完成;result 包含输出。
failed抓取失败;error 包含错误描述。

响应参数

job_id
String
异步任务的唯一标识符。
status
String
当前任务状态:queuedrunningdonefailed
result
Object
抓取结果对象(与同步端点响应结构相同)。当 statusdone 时返回。
error
String
错误消息。当 statusfailed 时返回。
meta
Object
有关任务执行的额外元数据。