Globální scan otevřených .git repozitářů

Články ‐ Vladimír Smitka ‐ Různé ‐ 30. 8. 2018

Na začátku července jsem se rozhodl udělat průzkum českého internetu, abych zjistil, kolik webů není správně nakonfigurováno a má povolen přístup ke složce .git s repozitářem. Z dřívějška jsem měl v databázi mnoho webů s tímto problémem a zajímalo mne, jaký je skutečný stav. Průzkum se nakonec rozrostl na celý internet.

Nálepky:

Text vyšel původně na autorově webu.

Vážnost problému

Jedná se o poměrně ošidný problém. Je možné získat současné i minulé soubory webu a vydolovat z nich mnoho informací o struktuře webu samotného, a někdy i velmi citlivá data, jako jsou hesla k databázím, API klíče, nastavení vývojového prostředí a pod.

Podle best practices by samozřejmě v repozitáři žádná taková data být neměla, nicméně při minulých bezpečnostních scanech jsem se přesvědčil, že mnoho tvůrců tato doporučení nedodržuje.

Jak problém poznat

Nejprve se podíváme, jak se problém projevuje. Pokud používáte git k deploymentu svého projektu, tak byste složku .git neměli mít ve veřejně přístupné části webu. Pokud ji tam z nějakého důvodu opravdu mít musíte, je třeba zajistit, aby k ní byl blokován přístup z vnějšku.

Ověřit si to můžete lehce tak, že zkusíte otevřít adresu <vas-web>/.git/HEAD – pokud máte vše správně nastaveno, tak by to nemělo jít. Záludnost této zranitelnosti spočívá v tom, že ji lze lehce přehlédnout. Pokud totiž navštívíte pouze adresu <vas-web>/.git/, dostanete v naprosté většině případů chybu 403 – přístup odepřen. Na první pohled se tak může zdát, že blokace funguje, jedná se však o falešný pocit bezpečí. Pravda je ale taková, že chybu 403 způsobí neexistence souboru index.html nebo index.php a to, že máte zakázán výpis adresářů (autoindex). Přímý přístup k jednotlivým souborům může být však stále možný.

Pokud se vám při tomto druhém testu zobrazí adresářová struktura, je problém ještě horší, repozitář lze stáhnout opravdu velmi lehce a navíc může být dohledatelný na Google. Git repozitář má známou strukturu, a tak z něj lze jednoduše získat jednotlivé známé soubory a extrahovat z nich reference na jednotlivé objekty/packy repozitáře a ty následně přímo postahovat. Tímto způsobem jde většinou zrekonstruovat velkou část repozitáře. Pro rekonstrukci existují nástroje, které tuto činnost značně zjednoduší – GitTools.

I bez náročné rekonstrukce se může podařit získat o webu mnoho informací. Z binárního souboru <vas-web>/.git/index lze například odvodit struktura aplikace – jaké používá knihovny, najít zajímavé endpointy (např. file uploadery) atd. Pokud vás nebaví hledat řetězce přímo v binárním souboru, existuje pomocník, který vám ho dekóduje – Gin.

Samozřejmě existují výjimky, kde přístupnost repozitáře nevadí: weby, které celý svůj obsah již veřejně sdílí například na GitHubu, nebo weby složené pouze z několika statických souborů. Nicméně i v těchto případech si myslím, že by přístup k souborům a složkám začínajících tečkou (s výjimkou .well-known) neměl být možný. Připravil jsem proto několik pravidel pro webové servery Nginx a Apache, které přístupy ošetří.

Začináme scanovat

Vraťme se k samotnému scanu. Začal jsem stejným způsobem, jakým provádím většinu svých scanů – sestavil seznam webů ke kontrole, napsal scanovací skript (Python, Requests, Concurrent.futures + ThreadPoolExecutor), zpracoval výsledky a upozornil dotčené weby.

Postup

seznam – ze svých předchozích průzkumů mám již poměrně obsáhlou databázi českých webů – sestavil jsem ji pro Průzkum českých WP a z velké části jsem se o ni podělil v repozitáři Michala Špačka. První bod vyřešen – zhruba 1,5 milionu domén ke zkoumání.
skript – skripty z předchozích scanů jsou vcelku podobné, upravil jsem je tedy tak, aby hlídaly přítomnost souboru /.git/HEAD, kde se v obsahu vyskytuje řetězec refs.
výsledky – za necelé 2 dny jsem nalezl 1925 českých webů s přístupným .git repozitářem a na malém kontrolním vzorku jsem ověřil, že se jedná opravdu o problém – nalezl jsem jak hesla do DB, tak neautentifikované uploadery.
kontakt – posledním krokem bylo dohledat kontakty a oslovit je, to je vždy nejnáročnější část, hlavně když máte téměř 2000 webů…

Vzhledem k velkému číslu webů je třeba prioritizovat – když je chyba na velkém známém webu, dopady mohou být mnohem horší než v případě malé zapomenuté stránky. Můj postup nemusí být úplně fér, neboť pro tyto případy mám osvědčený proces – nechám pomocí skriptu se selenium browserem udělat screenshoty všech webů a následně si s nimi „zahraji hru“ v prohlížeči obrázků se Steam Controllerem, kdy vybírám weby, které by bylo vhodné kontaktovat.

Přednostně se jedná o následující:

známé weby (velké riziko, že problém postihne mnoho návštěvníků)
vývojáři a webové agentury (riziko, že chybu udělali i u svých klientů a když se o ní nedozví, tak ji budou dále opakovat)
zajímavé weby „páchající dobro“

Získávání kontaktů

Takto jsem byl schopen weby roztřídit během zhruba jedné a půl hodiny. Dále bylo potřeba dohledat kontakty – to je většinou ruční práce s nejistými výsledky, protože se e-mail často nedostane ke kompetentní osobě. Tímto způsobem jsem dohledal a kontaktoval prvních zhruba 200 postižených webů. V tento moment jsem si však uvědomil, že to lze u tohoto konkrétního problému udělat mnohem lépe, protože v souboru /.git/logs/HEAD je seznam commitů (příspěvků) do repozitáře. Seznam většinou obsahuje i kontakty přímo na vývojáře, kteří commit provedli, ačkoli ani zde není zaručena 100% úspěšnost, protože někdy jsou použity interní nebo nevalidní adresy. Každopádně to je skvělý prostor pro další automatizaci. Napsal jsem tedy další skript, který získal kontakty na vývojáře a následně je kontaktoval.

Nový postup měl velký úspěch. Velmi jednoduše jsem rozeslal téměř 2000 upozornění relevantním osobám. Měsíc po odeslání upozornění jsem provedl kontrolní scan a otevřených .git zbylo pouze 874 – to je velmi dobrá 55% úspěšnost.

Pokračování na Slovensku

Rozhodl jsem se tento postup zopakovat také pro Slovensko.

seznam – použil jsem seznam domén, které poskytuje přímo SK-NIC
skript – skript z předchozího scanu jsem lehce upravil pro získávání e-mailů
výsledky – za necelý den jsem nalezl 931 webů s otevřeným gitem
kontakt – automaticky jsem rozeslal upozornění na získané emaily

Jednoduché!

Scanujeme „celý“ internet

Po druhém scanu jsem začal mít vyšší ambice. Když je takto jednoduché proscanovat 2 státy, jak těžké může být oscanovat celý svět?

Odpověď je – velmi těžké.

Prvním úkolem bylo získat seznam domén pro testování. Část jsem jich měl z předchozích scanů (např. z Alexa Top Million – stažení), pro globální scan to však nestačilo. Bylo třeba vytvořit nový zdroj. Nebylo to poprvé, kdy jsem sáhl po logu DNS dotazů z projektu OpenData Rapid 7. Jedná se o 3,5 TB velký textový soubor ve formátu JSON, kde jsou uvedeny jednotlivé dotazy:

{"timestamp":"1530259463","name":"<domain>","type":"<a/cname/mx/..>","value":"<ip>"}

Díky tomu, že jsou v Linuxu běžně dostupné nástroje pro práci s gzip (zcat,…), nebylo zpracování taktového množství dat velkým problémem.

Filtrování a optimalizace

Aby výzkum netrval několik let, bylo nutné provést redukci a vybrat si pouze „zajímavé“ domény. Filtroval jsem tedy pouze A dotazy na domény druhého řádu vybraných koncovek (generické, evropské státy +.eu, další větší státy, oblíbené nové koncovky: top, xyz atd.). Takto jsem sestavil seznam více než 230 milionů domén ke kontrole.

Od počátku bylo jasné, že bude třeba úkol rozdělit na více serverů. Seznam jsem tedy rozdělil do bloků po 2 milionech domén. Připravil jsem malou aplikaci v PHP, která dokázala postupně vybavovat bloky jednotlivým serverům a zaznamenávala, jaký server si jaký blok převzal. Servery si pak bloky stahovaly automaticky.

Velmi brzy se ukázalo, že knihovna Requests pro tento účel nebude ta pravá. Problémem bylo nastavování timeoutů – Requests umí nastavit pouze connection timeout a bohužel nelze nastavit data timeout. Pokud tedy daný server odpověděl, ale nedodával data dostatečně rychle nebo vůbec, thread se zasekl (test stahoval pouze jeden malý statický soubor, odezva by proto měla být rychlá). Během pár desítek minut se běžně stávalo, že takto viselo několik tisíc spojení a scan se extrémně zpomalil.

Oba typy timeoutů umí nastavovat URLlib 3, zkusil jsem tedy použít ji. U ní jsem nejprve narazil na drobný problém v tom, že jednoduše neprozrazovala URL cílové stránky po přesměrováních (do výsledků jsem započítával pouze cílové stránky – ohromné množství domén slouží pouze k přesměrování). To jsem však po chvíli studování dokumentace vyřešil (kód: retries.history[-1].redirect_location). Scan začal fungovat spolehlivěji, nicméně byl stále velmi pomalý a po krátké době navíc začala docházet i RAM.

Acyncio a aiohttp

Rozhodl jsem se tedy vyzkoušet (pro mě) novinku – asyncio a knihovnu aiohttp. To byl krok správným směrem. Získal jsem zhruba 20x rychlejší scan a rapidní snížení paměťových nároků. Problém byl u slabších strojů v tom, že nebyly schopny vytvořit 2 000 000 futures (úkolů), musel jsem tedy interně daný blok navíc dále rozkouskouvat na menší části dle schopností serveru (i slabá VPS zvládala 100 000). Scan se opět rozjel a brzy se objevila další komplikace, narazil jsem na limit otevřených souborů v základním nastavení linuxového jádra. Navýšil jsem limit a scanování se mohlo konečně rozjet naplno.

Tarpity a honeypoty

Během výzkumu jsem velmi často narážel na různé tarpity (speciální servery, které naschvál přijmou požadavek, ale již neodpoví žádnými daty – slouží jako nástrahy pro zpomalení scanů), nebo jednoduše pomalé servery. Častým problémem byla i geografická vzdálenost – snažil jsem se tedy ze seznamu vyčlenit některé geografické skupiny a ručně je spustit z blízkého datacentra – to jsem použil například pro Austrálii. Všechny tyto problémy se samozřejmě projevovaly při globálním scanu v mnohem větší míře než při menších lokálních výzkumech. Další komplikací byly různé honeypoty (nástrahy na detekci útoků), které mé servery posílaly na rozličné blacklisty a rozesílaly abuse stížnosti poskytovatelům VPS, se kterými jsem to následně musel řešit. I kvůli riziku zablokování jsem scan rozložil mezi několik poskytovatelů:

Digital Ocean – zde běžela většina VPS, DO často využíváme pro své projekty
Linode – velký podíl na scanu měly stroje tohoto poskytovatele, zde oceňuji aktivní práci security teamu, se kterým jsem komunikoval během řešení abuse, mají pro podobné projekty pochopení
Hetzner – chtěl jsem je otestovat, ukázalo se, že za danou cenu poskytují velmi dobrý výkon
BinaryLane – pro scan Austrálie

Výsledek scanu

Celý scan trval prakticky 4 týdny a zhruba v polovině tohoto času jsem se rozhodl zdvojnásobit počet zapojených strojů – v největší špičce bylo do výzkumu zapojeno 18 VPS a 4 fyzické servery. Pro podobný scan je důležitá především dobrá konektivita a benefitem je více jader CPU.

Proč jsem nepoužil službu, jako je Amazon Lambda? Důvodem je, že jsem přesně nevěděl, co mne při scanování bude čekat za problémy a nedokázal jsem předem odhadnout náročnost. Nechtěl jsem být po provedení scanu nemile překvapen účtem za služby :-) Cenu VPS lze proti tomu vcelku jednoduše odhadnout. Celý scan vyšel zhruba na $250 (bez fyzických strojů, které již máme).

Výsledkem scanu bylo 390 000 webových stránek s otevřeným adresářem .git.

Kontaktování

V druhé části scanu jsem tyto weby opětovně navštívil a vyhledal e-mailové kontakty ze souboru /.git/logs/HEAD. Ani zde samozřejmě nebyly vždy použitelné e-maily, přesto jsem takto získal 290 000 e-mailových adres svázaných s různým doménami. Ty bylo třeba dále zpracovat, protože mnoho kontaktů bylo asociováno s více než jednou doménou a několik z nich dokonce s více než 4000. Samozřejmě jsem nechtěl jednomu člověku posílat 4000 e-mailových upozornění, a tak jsem seznam agregoval dle e-mailové adresy a sestavil každému kontaktu seznam jeho domén, u nichž jsem ho objevil. Ze seznamu jsem dále vyloučil evidentně „strojové“ adresy serverů, kde je minimální šance, že vůbec budou doručeny, natož přečteny.

Touto operací vznikl seznam 90 tisíc unikátních e-mailů, na které jsem následně během týdne rozesílal upozornění. Pro podrobnější informace o chybě a možnostech její nápravy jsem připravil landing page smitka.me, na kterou jsem v e-mailu odkázal.

Nepodařilo se doručit zhruba 18000 e-mailů, protože již neexistovaly, nebo nebyly reálné. Dle zpětné vazby byla dále část e-mailů klasifikována jako spam, přestože při testech na mail-tester.com měly zprávy skóre 10/10 – pravděpodobně to bylo z důvodu většího množství reportovaných odkazů.

Po rozeslání e-mailů jsem si vyměnil dalších zhruba 300 dalších zpráv s postiženými stranami pro upřesnění problému. Obdržel jsem téměř 2000 děkovných e-mailů, 30 upozornění na false positive, 2 obvinění ze spamu/scamu a jednu výhružku kanadskou policií.

Analýza dat

Po dokončení rozesílání následoval další výzkumný úkol – zjistit, na jakých technologiích jsou postižené weby postaveny. Pustil jsem tedy na nalezené weby nástroj WAD doplněný o aktuální definice z Wappalyzer (soubor apps.json). Tento nástroj bohužel již není příliš udržovaný, funguje jen v Python 2 a nemá moc dobře ošetřeny výjimky. Nemohl jsem mu tedy jednoduše předložit seznam domén k otestování, protože jediná chyba by měla za následek pád celé aplikace. Spustil jsem proto scany jednotlivě, ale s využitím nástroje parallel:

cat sites.txt | parallel -j 20 --bar --tmpdir  ./wad --files wad -u {} -f csv

Velkou pomůckou byl pro mne také emulátor terminálu a správce relací MobaXterm. Na GitHub jsem umístil několik ukázek skriptů, které jsem pro scan použil.

Výsledky

Nejrozšířenějším jazykem pro tvorbu webů je PHP, takže se dalo čekat, že nejvíce postižených webů bude využívat právě ten.

Velmi zajímavá čísla dostaneme, pokud tyto výsledky znormalizujeme podle zastoupení jednotlivých jazyků (podle W3techs):

Pokud by bylo zastoupení všech jazyků stejné, tak by nejhorší situace byla u Python vývojářů a PHP bylo až na 3. místě.

Dále mě zajímalo, jaké HTTP servery a operační systémy weby používají:

Byl jsem překvapen zastoupením serveru Tengine (čínský fork Nginx).

Mezi operačními systémy samozřejmě vede Linux a v něm distribuce Ubuntu. Můj oblíbený CentOS je na 3. místě.

V poslední části přehledu jsem se zaměřil na použité CMS, e-shopová řešení a aplikační frameworky.

Není překvapením, že WordPress v této kategorii dominuje. Pouze zhruba 12 % těchto WP webů používá poslední minor verze s bezpečnostními záplatami. Může to být proto, že když WP detekuje složku .git (nebo jiný VCS), tak vypne automatické aktualizace jádra a nechá starost s nimi na vývojáři. S posledními verzemi je situace obdobná i v případě CMS Drupal a Joomla – většinou se jedná o starší verze.

Obdobně jako v předchozím případě je tomu i ve světě e-commerce. WordPress plugin WooCommerce je nasazen na většině postižených e-shopů.

Detekce frameworku je často složitější, mnoho z nich o sobě nedává znát. V některých případech se však framework detekovat podařilo a ukázalo se, že nejvíce postižených stránek v této kategorii používá CodeIgniter.

Další plány

V dalším plánu je provedení opětovné kontroly po několika týdnech a pokus o znovukontaktování tvůrců. Kontrolovat se bude mnohem menší dataset, a tak chci přidat 2 funkce pro redukování false positive:

kontrolu, zda je veřejně dostupný hash commitu na githubu pro veřejné repozitáře
prověření indexu, zda repozitář obsahuje dynamické soubory, abych vyloučil například různé statické landingpage

Závěr

Závěrem bych chtěl všem doporučit více hlídat, co nahráváte do svého webového prostoru – nejedná se jen o verzovací systémy, ale například i o různé dočasné testovací skripty. Je dobré také pamatovat na to, že se věci mění – konfigurace serveru i členové týmu. To, co se dnes nezdá být problémem, jím může zítra být.

P.S.: Hledáme Python vývojáře

Vladimír Smitka

Síťař, vývojář a bezpečnostní výzkumník, zakladatel firmy Lynt services s.r.o. A network engineer, developer and security researcher, founder of Lynt.cz.

Komentáře

Odebírat

24 Komentářů

Nejstarší

Nejnovější Most Voted

Inline Feedbacks

Zobrazit všechny komentáře

Mlocik97

6 let před

Jedným slovom: „Woooooow“

Odpovědět

starenka

6 let před

requests MAJI nastavitelnej jak socket, tak connection timeout (viz https://twitter.com/smitka/status/1035057366692184065)

Odpovědět

Vladimír Smitka

Autor

Odpovědět na starenka

6 let před

Pravda, nějak jsem to v dokumentaci přehlédnul (nebo jsem v ten moment ještě nevěděl, co vlastně hledám) a zbytečně si tak přidělal práci…

Odpovědět

wsh

6 let před

Hodně dobrý počin a čtivý článek. Díky.

Odpovědět

nohwnd

6 let před

Velmi pekne shrnuti, po dlouhe dobe nejaky kvalitni clanek na zdrojaku.

Odpovědět

Michal Krause

6 let před

Nebylo by v těch pravidlech pro webové servery lepší vracet rovnou Not Found místo Forbidden? Přeci jen takhle může útočník předpokládat, že tam ten soubor/složka je, a hledat jiné způsoby jak se k nim dostat třeba prostřednictvím útoku na aplikaci.

Jinak díky za záslužnou práci, díky ní jsem také napravil jeden web, kde omylem patřičné pravidlo chybělo.

Odpovědět

Vojtěch Flaiming Oram

6 let před

Super článek a hlavně skvělá a užitečná práce :) Jinak u requests jsem taky narazil na stejný problém s timeouty, ale řešil jsem to s pomocí signálů (konkrétně SIGALRM). To funguje taky.

Odpovědět

Pavel

6 let před

Tesat do kamene, včetně obrázků a grafů! Výborný článek, nad jehož podstatou by se měli zamyslet všichni programátoři. Ať používají GIT, TFS a ať programují v PHP, Javě, .Netu nebo čemkoliv jiném.

Odpovědět

Ondrej

6 let před

Nejak me neni jasne jak se to nekomu povedlo treba u ror/djanga atp u php resp sdilenejch hostingu kam nahraju script a ono to funguje to chapu, pustim uwsgi, prehodim pred to treba nginx a je to, abych zpristupnil adresar tak bych se dal musel hrabat v konfiguraci. Kazdopadne zajimavej clanek dik!

Odpovědět

Vladimír Smitka

Autor

Odpovědět na Ondrej

6 let před

To je vlastně hodně dobrá otázka. Prozkoumal jsem několik webů, které to tak (ještě) mají.

Vždy tam byl předřazený Apache nebo Nginx, který byl s největší pravděpodobností nastaven tak aby servíroval statické (nebo možná existující) soubory. Bohužel bez omezení na složku /static (což je běžné ve světě Pythonu). Z většiny tak bylo možné stahovat přímo *.py soubory, což je ještě mnohem horší problém…

Odpovědět

Ondrej

Odpovědět na Vladimír Smitka

6 let před

To je masakr, ani by me nenapadlo ze nekdo neomezi servirovani static veci na slozku. Jinak treba v takovem settings. py u djanga bejva vyplnenej i email administratora, u ostatnich bude urcite taky neco, tak i tam by slo cerpat emaily.

Odpovědět

lenoch

6 let před

Já nechápu, proč vůbec někdo nahrává adresář .git na produkční server? To považuji za zásadní chybu. Nahrát ho tam a pak vymýšlet jak zakázat přístup – proboha proč?

Odpovědět

Ondrej

Odpovědět na lenoch

6 let před

Tak ono kdyz dovolis vypisovat vse tak je pro tebe git nejmensi problem, tam vetsinou nemas hesla…

Odpovědět

Pet

Odpovědět na lenoch

6 let před

Protoze pouzivaji ten git pro nasazeni a verzovani. Nemusi pak kopirovat veci treba pres ftp a lepe se jim to udrzuje.

Odpovědět

daddyy

Odpovědět na lenoch

6 let před

Já spíše nechápu takovou hloupou otázku, sic je pro mě zarážející že v public diru má někdo .git ale spíše je efektivnější toto vyrobit tak, aby public dir obsahoval opravdu pouze to co je public :-)

Odpovědět

Ondrej

6 let před

Jinak mě napadlo, nebylo by lepší v tomto scanovacím případě používat na místo GETu HEAD metodu? Nemusíš čekat než server vrátí tělo HEAD souboru i když jasný, tam skoro nic není…

Neuvažoval jsi na to scanování použít celery, jestli znáš? Přímo se mě to na to nabízí, než do toho tahat nějaké php prvky co si tahají něco ze seznamu…

Odpovědět

Vladimír Smitka

Autor

Odpovědět na Ondrej

6 let před

Ano, to jsou dobré triky, přesně toto hojně používáme v našem nástroji PPC Robot pro základní kontrolu URL adres – celery nám řídí frontu a URL checkery posílají jen HEAD. Bohužel né všechny servery HEAD akceptují a také se někdy stává, že i na neexistující stránku vrátí web 200… S GETem a kontrolou obsahu je větší jistota. Pokud bych chtěl jen najít co nejvíce „cílů“ v co nejmenším čase a nevadilo mi tolik false positive, tak by to bylo super řešení. Rozdávání úkolů lze řešit mnoha lepšími způsoby, než to, jak jsem to provedl já. PHP bylo po ruce a měl jsem to hotové za pár minut a mohl jsem si to hostovat na běžném webserveru.

Každopádně je super přicházet s dalšími nápady, jak to udělat v některých oblastech lépe. Může se to hodit pro budoucí obdobné projekty. Já to nabastlil tak, abych s co nejmenším úsilím dosáhl výsledku (což je patrné i z kódu scanneru) :-).

Odpovědět

Jakub Vrána

6 let před

Skvělý nápad, ambiciózní rozsah, skvělé provedení!

Mám jen jeden dotaz. Proč zrovna bloky po 2 miliónech domén? S menšími bloky by asi bylo méně problémů. Proč ne třeba 100 tisíc?

Odpovědět

Vladimír Smitka

Autor

Odpovědět na Jakub Vrána

6 let před

Není za tím žádný komplexní důvod. Přišlo mi to jako rozumné číslo. Podle původního CZ scanu jsem si myslel, že prozkoumat 2 miliony domén bude trvat zhruba 2 dny. Chtěl jsem aby každý stroj byl nejvíce samostatný a mohlo na něm běžet co nejvíce věcí paralelně/v loopu. A říkal jsem si, že kdyby náhodou ten stroj padnul, nebo byl zrušen kvůli abuse, tak přijdu max o 2 dny práce, což pro mě bylo akceptovatelné. V reálu se ukázalo, že tak moc věcí paralelně stejně nepustím a také, že blok netrvá 2 dny, ale spíše 3-5 (podle toho jaká část světa na něj padla a jak to bylo zrovna silné VPS) :-)

Kdybych to opakoval, tak bych volil asi o něco menší blok, někde mezi 500k a milionem. 500k je pořád hodnota, kterou malinko lepší stroje zvládaly nacpat do loopu (možná by zvládly i o něco více).

Odpovědět

Petr Jelinek

6 let před

Zajimava (a prospesna) zabava. :-)

Nebylo by pokracovani o papirovani? Mam na mysli, jak probihala komunikace ohledne scanovani, spamu apod. Urcite nejsem sam, koho zajima co ho ceka, kdyz se rozhodne pachat dobro (nebo zlo – podle vkusu kazdyho soudruha). Nejpikantnejsi urcite bude ta vyhruzka od policie. :-)

Btw, vliv na reputaci se nejspis dostavil – kdys jsem se pokusil v praci otevrit https://smitka.me:

… has been blocked … category: Suspicious

Odpovědět

Vladimír Smitka

Autor

Odpovědět na Petr Jelinek

6 let před

Pokračování se chystá, jak jsem psal. Tak bych chtěl zhruba po měsíci postižené weby znovu projet a zjistit, jaký účinek to mělo. Také se zrovna s několika stranami snažím vykomunikovat sdílení jejich nevhodné konfigurace serveru, abych zjistil, kde problém ve skutečnosti vznikl. V plánu mám i detailnější zjištění, kde postižené weby běží, zda z toho nevypadnou nějací „podezřelí“ poskytovatelé.

Co se týká papírování, tak to mě nenapadlo, že by to někoho mohlo zajímat :-) Co konkrétně by tě zajímalo? Mám tu některé abuse (především z Korei), hezký mail, jaký jsem idiot a podobně. Pak je spousty běžné komunikace, kdy buď já vysvětluji, kde je problém, nebo mi naopak protistrana vysvětluje proč to pro ni problém není. Mail, co jsem posílal já, někdo sdílel na twitteru, mohu ho případně dohledat. Co se týká policie, tak to bohužel (bohudík) nebyla výhružka od policie, ale výhružka policiií s poměrně nudným a neurčitým popisem co je v jejich jurisdikci ilegální. Ošklivější e-maily mi chodí, když posílám upozornění na české obecné kontakty.

Mimochodem, víš co máte v práci za firewall? Rád bych to prozkoumal :-)

Odpovědět

Ondrej

Odpovědět na Vladimír Smitka

6 let před

To spatne nastaveni by me taky ukrutne zajimalo…

Odpovědět

Petr Jelinek

Odpovědět na Vladimír Smitka

6 let před

Aha, tak tu výhrůžku jsem špatně pochopil. Takže nepřišlo nic z „oficiálních“ míst?

No, zajímalo mě, jak například probíhá komunikace s poskytovatelem – jestli je to něco jako „ještě jednou dostaneme hlášku, tak odpojíme“, nebo jestli se spíš snažej zjistit co se děje, jak probíhá přesvědčování o dobrejch úmyslech apod. :-) Došlo i na nějakou žádost o obnovení služeb nebo vyřazení z black listu?

Bohužel jsem pro Security příliš malej brouk, takže se od nich nic nedozvim (a nikdy jsem se o to nijak zvlášť nezajímal), nicméně hlášky o blokování obsahujou obvykle „Bluecoat“ – netušim, jestli je to název filtru nebo zdroj black listů apod., ale třeba ti to něco řekne…? Každopádně se nejspíš něco změnilo, protože dneska už je to jenom „Warning – Uncategorised Website“. :-)

Odpovědět

Martin Hassman

Odpovědět na Vladimír Smitka

6 let před

Vladimíre, já tu za sebe cítím prostor pro text, ve kterém by se jen ukázalo jak dobře čí špatně může probíhat taková komunikace.

V textu by mohly být takové dva příklady dvou (podle tebe) skvělých komunikací (anonymizované, s odstraneným balastem, který není pro čtenáře zajímavý – tj. trochu zkrácené).

Vedle toho dva zoufalé případy. A pak dva případy mezi (třeba, kde se vzájemně přesvědčujete, zda to je nebo není problém a čí).

Bylo by to na skvělý článek. V angličtině i češtině. Ty texty už máš, jen z nich něco zajímavého vybrat. Pro lidi, kteří nikdy nikoho neupozorňovali na bezpečnostní problém, by to bylo velmi poučné. My bychom to rádi přetiskli. S poladěním rád pomůžu.

Odpovědět

Globální scan otevřených .git repozitářů

Nálepky:

Vážnost problému

Jak problém poznat

Začináme scanovat

Postup

Získávání kontaktů

Pokračování na Slovensku

Scanujeme „celý“ internet

Filtrování a optimalizace

Acyncio a aiohttp

Tarpity a honeypoty

Výsledek scanu

Kontaktování

Analýza dat

Výsledky

Další plány

Závěr

Vladimír Smitka

Komentáře

Strategie a AI jako klíč. Do Prahy přijely špičky technologického světa

Přístupnost není jen o splnění norem: nový pohled na inkluzivní design

Efektivnější vývoj UI nebo API: Co si odnést z WebExpo 2025?

Sledujte Zdroják:

Hádej co? Cookies!