Přejít k navigační liště

Zdroják » Autoři » Archivy pro Jan Kadlec

Archiv autora: Jan Kadlec

Copywriter na odpočinku. Přemíru volného času tráví akademickým životem, teoretickou ekonomií a sledováním startupového podnikání.

Články Různé

Minulý víkend v Praze proběhla akce IPO48, akcelerátor internetových projektů. Poznatky, trendy a poznámky o nezbytnosti angličtiny v internetovém startupovém podnikání v trojroli netechnicky založeného kritického pozorovatele, účastníka a pomocného organizátora stručně shrnuje Jan Kadlec.

Robots.txt nestačí. AI crawleři mění, jak weby chrání obsah

Robots.txt zůstává základní signál pro slušné crawlery, ale už neumí popsat hlavní problém: stejný veřejný obsah může sloužit klasickému vyhledávání, AI odpovědím, tréninku modelů i načtení na pokyn uživatele. Provozovatel webu proto musí oddělit účel přístupu, ověřovat identitu botů, měřit dopad na infrastrukturu a u hodnotného obsahu řešit i vynucení pravidel mimo samotný robots.txt.

Jak funguje WordPress Cron a proč občas selhává

„Cron mi nějak neběhá." Klasická věta, která ve WordPress světě může znamenat cokoli od špatně nastavené WP_SITEURL, přes loopback zablokovaný Cloudflarem, až po fatal error v callbacku, který nechal viset transient doing_cron. WP-Cron totiž není skutečný scheduler — je to pseudo-cron závislý na návštěvnosti webu a HTTP loopbacku, se všemi pastmi, které si dokážete představit. Tenhle článek je hloubkový průchod jeho vnitřnostmi: co se reálně děje při spawn_cron(), kde vznikají race conditions, proč selhává a čím ho v produkci nahradit.