Knihovna TweeQL nabízí jednoduchý způsob přístupu k obsahu služby Twitter, a to pomocí dotazů, které připomínají SQL, například SELECT text FROM twitter WHERE text contains 'obama'; Knihovna je napsána v Pythonu a dostupná pod BSD licencí.
Robots.txt zůstává základní signál pro slušné crawlery, ale už neumí popsat hlavní problém: stejný veřejný obsah může sloužit klasickému vyhledávání, AI odpovědím, tréninku modelů i načtení na pokyn uživatele. Provozovatel webu proto musí oddělit účel přístupu, ověřovat identitu botů, měřit dopad na infrastrukturu a u hodnotného obsahu řešit i vynucení pravidel mimo samotný robots.txt.
„Cron mi nějak neběhá." Klasická věta, která ve WordPress světě může znamenat cokoli od špatně nastavené WP_SITEURL, přes loopback zablokovaný Cloudflarem, až po fatal error v callbacku, který nechal viset transient doing_cron. WP-Cron totiž není skutečný scheduler — je to pseudo-cron závislý na návštěvnosti webu a HTTP loopbacku, se všemi pastmi, které si dokážete představit. Tenhle článek je hloubkový průchod jeho vnitřnostmi: co se reálně děje při spawn_cron(), kde vznikají race conditions, proč selhává a čím ho v produkci nahradit.
AI code review zvládá první průchod — shrnout diff, najít rutinní vzory a upozornit na chybějící test. Jako náhrada lidského review ale neobstojí: data ukazují vyšší abandonment a často nízký poměr signálu k šumu. Nasazení proto stojí na pravidlech, úzkém mandátu a měření, ne na výběru dodavatele.
Existuje aj LINQ to twitter – http://linqtotwitter.codeplex.com/
— s.