Crawl4AI Web Scraper

Web scraping using local Crawl4AI instance. Use for fetching full page content with JavaScript rendering. Better than Tavily for complex pages. Unlimited usage.

התקנה


              $clawhub install crawl-for-ai

Crawl4AI Web Scraper

Local Crawl4AI instance for full web page extraction with JavaScript rendering.

Endpoints

Proxy (port 11234) — Clean output, OpenWebUI-compatible

Returns: [{page_content, metadata}]
Use for: Simple content extraction

Direct (port 11235) — Full output with all data

Returns: {results: [{markdown, html, links, media, ...}]}
Use for: When you need links, media, or other metadata

Usage


# Via script
node {baseDir}/scripts/crawl4ai.js "url"
node {baseDir}/scripts/crawl4ai.js "url" --json

Script options:

--json — Full JSON response

Output: Clean markdown from the page.

Configuration

Required environment variable:

CRAWL4AI_URL — Your Crawl4AI instance URL (e.g., http://localhost:11235)

Optional:

CRAWL4AI_KEY — API key if your instance requires authentication

Features

JavaScript rendering — Handles dynamic content
Unlimited usage — Local instance, no API limits
Full content — HTML, markdown, links, media, tables
Better than Tavily for complex pages with JS

API

Uses your local Crawl4AI instance REST API. Auth header only sent if CRAWL4AI_KEY is set.

פרטים

גרסה: v1.0.1
הורדות: 1,753
כוכבים: 4
ClawHub: צפייה ב-ClawHub

Skills פופולריים

Ad creative search assistant. Results displayed via ad.h5.miaozhisheng.tech. Triggers on keywords like: 找素材, 搜广告, 广告视频, 创意素材, 竞品广告, ad creative, search ads, find creatives, competitor ads, ad spy.

Get current weather and forecasts (no API key required).

Docker Essentials

Essential Docker commands and workflows for container management, image operations, and debugging.