Cloudflare spustil nový /crawl endpoint pro automatické procházení webů

Zdroják » Zprávičky » Cloudflare spustil nový /crawl endpoint pro automatické procházení webů

Nálepky:

Cloudflare oznámil, že služba Browser Rendering nyní obsahuje nový endpoint /crawl, který umožňuje procházet (crawlovat) celý web jediným API voláním. Tento nástroj je nyní dostupný v otevřené beta verzi pro uživatele s bezplatnými i placenými plány.

Co umí /crawl:
• Stačí poslat URL startovní stránky a Cloudflare automaticky objeví a zpracuje všechny stránky webu, včetně renderování JavaScriptu.
• Výsledky lze získat ve formátech HTML, Markdown nebo strukturovaném JSON.
• Automatické objevování stránek funguje přes sitemapu i odkazy na stránkách.
• Podporuje Incremental crawling – zpracuje jen nově změněné stránky, což šetří čas a prostředky.
• Je možné nastavit hloubku procházení, limity stránek nebo zahrnutí/vyloučení určitých cest.
• /crawl respektuje pravidla robots.txt, včetně crawl-delay, takže neprochází stránky, které to výslovně zakazují.

Jak to funguje:

Pošlete POST žádost s URL – API vrátí job ID.
Pomocí GET pak můžete získat stav nebo výsledky zpracování.

Příklad:

# Initiate a crawl
curl -X POST 'https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl' \
  -H 'Authorization: Bearer <apiToken>' \
  -H 'Content-Type: application/json' \
  -d '{
    "url": "https://blog.cloudflare.com/"
  }'

# Check results
curl -X GET 'https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl/{job_id}' \
  -H 'Authorization: Bearer <apiToken>'Code language: PHP (php)

Původní zpráva: https://developers.cloudflare.com/changelog/post/2026-03-10-br-crawl-endpoint/

Adam Heglas

Student se zájmem o IT, programování a kybernetickou bezpečnost. Baví mě se učit novým věcem a posouvat své schopnosti dál. Když zrovna nesedím u kódu, věnuji se fitness a počítačovým hrám.

Komentáře

Odebírat

0 Komentářů

Nejstarší

Nejnovější Nejvíce hlasů

Proč vám model napíše Python, i když jste si řekli o Rust

Výkonnostní propast mezi Pythonem a ostatními jazyky se za poslední rok a půl skoro zavřela. Dnešní modely zvládají Rust i Go srovnatelně dobře. Když jim ale volbu necháte, sáhnou stejně po Pythonu. A u knihoven je to ještě výraznější: mezi funkčně srovnatelnými balíčky je až 84procentní rozdíl v kvalitě generovaného kódu. Proč to tak je a co s tím.

WP2Shell: Kritická hrozba pro samotné jádro WordPressu. Útočníci mohou získat kontrolu nad webem

Zranitelnost ve WordPressu není žádná novinka. Kdo provozuje weby postavené na této platformě, ví, že bezpečnostní záplaty chodí prakticky pořád. O to větší pozornost by měla vzbudit chyba, u které nic z toho neplatí. A přesně takový je případ zranitelnosti, která dostala přezdívku wp2shell. potřeb. Zranitelný kontaktní formulář, děravý e-shopový plugin, opomenutá kontrola oprávnění v nějaké obskurní rozšiřující knihovně – to je denní chleba každého, kdo sleduje bezpečnostní feedy. Zpráva „nová chyba ve WordPress pluginu“ má tak nízkou informační hodnotu, že ji většina lidí přejde bez mrknutí oka.

Mýtus jedné aplikace: proč PWA nenahradí vývoj pro každou platformu

PWA mohou webu přidat ikonu na ploše, fungování bez připojení, notifikace a některé systémové funkce. Nejsou ale cestou k jednomu klientu pro všechny platformy. Vyplatí se tam, kde se lidé k webu vracejí a ocení okamžitý vstup z odkazu. Jakmile aplikace musí spolehlivě běžet na pozadí nebo fungovat stejně na každém zařízení, bývá vhodnější nativní řešení.

Cloudflare spustil nový /crawl endpoint pro automatické procházení webů

Nálepky:

Adam Heglas

Komentáře

Proč vám model napíše Python, i když jste si řekli o Rust

WP2Shell: Kritická hrozba pro samotné jádro WordPressu. Útočníci mohou získat kontrolu nad webem

Mýtus jedné aplikace: proč PWA nenahradí vývoj pro každou platformu

Sledujte Zdroják:

Hádej co? Cookies!