MD5 je velmi často používaná funkce pro výpočet hashů.
Začátečníci ji často používají pro ošetření hesel, což není dobrý nápad, protože existuje mnoho způsobů, jak původní heslo získat.
Tento článek popisuje konkrétní metody, jak na to.
Celá bezpečnost je postavena na faktu, že vyzkoušet všechna hesla trvá neúměrně dlouho. Tedy mělo by. Problém v algoritmu md5()
je zejména v tom, že jde o funkci velmi rychlou. Na běžném počítači není problém vypočítat přes milion hashů za sekundu.
Pokud budeme heslo lámat postupným zkoušením kombinací, jedná se o útok hrubou silou.
Strategií existuje několik:
Metod existuje mnohem víc, tento článek popisuje jen ty nejčastější.
Postupně se zkoušejí všechny kombinace písmen, čísel a ostatních znaků.
Vygenerované pokusy se postupně zahashují a porovnají s originálním hashem.
Takže například:
aaaaaaabaaacaaadaaaeaaaf...
Problém tohoto útoku je právě v samotném algoritmu md5()
, pokud bychom zkoušeli jen malá písmena anglické abecedy a čísla, tak vyzkoušení všech kombinací na běžně dostupném počítači zabere maximálně desítky minut.
Důležité proto je volit dlouhá hesla, pokud možno náhodná se speciálními znaky.
Lidé si obvykle volí slabá hesla, která existují ve slovníku.
Pokud tohoto faktu využijeme, můžeme rychle vyřadit nepravděpodobné varianty, jako je například 6w1SCq5cs
a místo toho raději hádat existující slova.
Podle předešlých úniků hesel velkých firem dále víme, že si uživatelé volí velké písmeno na začátku hesla a číslo na konci. Schválně - má to i vaše heslo? :)
Protože jednomu heslu odpovídá vždy stejný hash, lze snadno přepočítat obrovskou databázi, ve které se budou hesla nejprve vyhledávat.
Hledání je totiž vždy řádově rychlejší, než hashe hledat znovu a znovu.
Navíc při větším úniku dat lze takto hesla promalovat paralelně a rychle tak získat třeba 10 % všech hesel uživatelů.
Dobrá databáze hesel je například Crack Station.
Mnoho jednoduchých hesel zná přímo Google, protože indexuje stránky, které hashe obsahují.
Google používám vždy jako první možnost. :)
Dirichletův princip popisuje, že pokud máme množinu hashů, které mají vždy 32 znaků, tak existují aspoň 2 různá hesla o délce 33 znaků (o jedna delší), která generují stejný hash.
V praxi nedává smysl kolize hledat, ale někdy sám autor aplikace hádání usnadní, protože kolize přepočítá.
Například:
$password = 'heslo';for ($i = 0; $i <= 1000; $i++) {$password = md5($password);}echo $password; // 1000x zahashováno přes md5()
V takovém případě dává smysl hádat spíše kolize, než původní hash.
Bastlení zdar!
Jan Barášek Více o autorovi
Autor článku pracuje jako seniorní vývojář a software architekt v Praze. Navrhuje a spravuje velké webové aplikace, které znáte a používáte. Od roku 2009 nabral bohaté zkušenosti, které tímto webem předává dál.
Rád vám pomůžu:
Nabízím trénink vývojářů, konzultace, školení a analýzu návrhových vzorů. Osobně v Praze nebo online.
Napište mi, pokud si nevíte rady.
Lektor: Jan Barášek
Články píše Jan Barášek © 2009-2025 | Kontakt | Mapa webu
Status | Aktualizováno: ... | cs