Přejít k navigační liště

Zdroják » Zprávičky » Cloudflare spustil nový /crawl endpoint pro automatické procházení webů

Cloudflare spustil nový /crawl endpoint pro automatické procházení webů

Zprávičky Různé

Cloudflare oznámil, že služba Browser Rendering nyní obsahuje nový endpoint /crawl, který umožňuje procházet (crawlovat) celý web jediným API voláním. Tento nástroj je nyní dostupný v otevřené beta verzi pro uživatele s bezplatnými i placenými plány.

Co umí /crawl:
• Stačí poslat URL startovní stránky a Cloudflare automaticky objeví a zpracuje všechny stránky webu, včetně renderování JavaScriptu.
• Výsledky lze získat ve formátech HTML, Markdown nebo strukturovaném JSON.
• Automatické objevování stránek funguje přes sitemapu i odkazy na stránkách.
• Podporuje Incremental crawling – zpracuje jen nově změněné stránky, což šetří čas a prostředky.
• Je možné nastavit hloubku procházení, limity stránek nebo zahrnutí/vyloučení určitých cest.
/crawl respektuje pravidla robots.txt, včetně crawl-delay, takže neprochází stránky, které to výslovně zakazují.

Jak to funguje:

  1. Pošlete POST žádost s URL – API vrátí job ID.
  2. Pomocí GET pak můžete získat stav nebo výsledky zpracování.

Příklad:

# Initiate a crawl
curl -X POST 'https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl' \
  -H 'Authorization: Bearer <apiToken>' \
  -H 'Content-Type: application/json' \
  -d '{
    "url": "https://blog.cloudflare.com/"
  }'

# Check results
curl -X GET 'https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl/{job_id}' \
  -H 'Authorization: Bearer <apiToken>'Code language: PHP (php)

Původní zpráva: https://developers.cloudflare.com/changelog/post/2026-03-10-br-crawl-endpoint/

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted

Frugal computing: architektura pro dobu dražší infrastruktury

Vývojáři se naučili zrychlovat dotazy, přidávat cache, škálovat služby a hlídat účet za cloud. Frugal computing začíná o jednu otázku dřív: musí se výpočet, přesun dat, volání modelu nebo uložení vůbec stát? Rostoucí spotřeba datových center a nové evropské reportování ho posouvají do návrhu architektury, dřív než do závěrečné poznámky o udržitelnosti v prezentaci.

Odysseus: PewDiePie vydal open-source AI workspace, který běží na vašem vlastním hardwaru

AI
Komentáře: 0
Felix Kjellberg, youtuber se 110 miliony odběratelů, strávil rok učením se programovat a fine-tuningem vlastních AI modelů. Výsledkem je Odysseus – bezplatný, open-source workspace pro práci s umělou inteligencí, který neposílá žádná data do cloudu. Projekt má týden, přes 61 000 hvězdiček na GitHubu a znovu otevírá otázku, komu vlastně patří váš digitální kontext.

Když Git už nestačí: jak izolovat databázový stav pro pokusy AI agentů

Gitová větev vývojářům oddělí kód, ale databáze často zůstává společná. U AI agentů je to slabé místo: rychle spouštějí migrace, mění data a zkoušejí víc cest najednou. Databázová větev jim dá vlastní pracovní prostor, jenže tím práce nekončí. Ještě je potřeba řešit citlivá data, oprávnění, životnost větve i zbytek stavu aplikace.