Přejít k navigační liště

Zdroják » Zprávičky » Cloudflare spustil nový /crawl endpoint pro automatické procházení webů

Cloudflare spustil nový /crawl endpoint pro automatické procházení webů

Zprávičky Různé

Cloudflare oznámil, že služba Browser Rendering nyní obsahuje nový endpoint /crawl, který umožňuje procházet (crawlovat) celý web jediným API voláním. Tento nástroj je nyní dostupný v otevřené beta verzi pro uživatele s bezplatnými i placenými plány.

Co umí /crawl:
• Stačí poslat URL startovní stránky a Cloudflare automaticky objeví a zpracuje všechny stránky webu, včetně renderování JavaScriptu.
• Výsledky lze získat ve formátech HTML, Markdown nebo strukturovaném JSON.
• Automatické objevování stránek funguje přes sitemapu i odkazy na stránkách.
• Podporuje Incremental crawling – zpracuje jen nově změněné stránky, což šetří čas a prostředky.
• Je možné nastavit hloubku procházení, limity stránek nebo zahrnutí/vyloučení určitých cest.
/crawl respektuje pravidla robots.txt, včetně crawl-delay, takže neprochází stránky, které to výslovně zakazují.

Jak to funguje:

  1. Pošlete POST žádost s URL – API vrátí job ID.
  2. Pomocí GET pak můžete získat stav nebo výsledky zpracování.

Příklad:

# Initiate a crawl
curl -X POST 'https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl' \
  -H 'Authorization: Bearer <apiToken>' \
  -H 'Content-Type: application/json' \
  -d '{
    "url": "https://blog.cloudflare.com/"
  }'

# Check results
curl -X GET 'https://api.cloudflare.com/client/v4/accounts/{account_id}/browser-rendering/crawl/{job_id}' \
  -H 'Authorization: Bearer <apiToken>'Code language: PHP (php)

Původní zpráva: https://developers.cloudflare.com/changelog/post/2026-03-10-br-crawl-endpoint/

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted
Inline Feedbacks
Zobrazit všechny komentáře

Aktualizace WordPressu: Co se děje pod kapotou, když kliknete na tlačítko

Kliknete na „Update" a za chvíli je hotovo. Jenže co se přesně stalo? WordPress stáhl balíček, přepsal stovky souborů, upravil databázi — a na pár vteřin váš web zmizel pro všechny návštěvníky. Většinou to proběhne bez problémů. Ale když se to rozbije, chcete přesně vědět kde a proč. Pojďme si celý proces rozebrat od začátku do konce.

Je čas přejít na ESM-only. Ekosystém je připravený

V únoru 2025 vyzval Anthony Fu, autor populárních nástrojů kolem Vue, Nuxtu a Vite, ekosystém k opuštění duálního publikování npm balíčků a přechodu na ESM-only. S odstupem více než roku je jasné, že měl pravdu - a že se ekosystém posunul ještě rychleji, než sám čekal. Node.js dnes umí require() i na ESM moduly, podíl balíčků s podporou ESM přesáhl třetinu a komunita označuje rok 2026 za „rok plné adopce ESM".