Domov Bezpečnostní Co je bayesovský filtr? - definice z techopedie

Co je bayesovský filtr? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Bayesovský filtr?

Bayesovský filtr je počítačový program využívající bayesovskou logiku nebo bayesovskou analýzu, což jsou synonymní termíny. Používá se k vyhodnocení záhlaví a obsahu e-mailových zpráv a k určení, zda se jedná o spam - nevyžádaný e-mail nebo elektronický ekvivalent hromadné nebo nevyžádané pošty). Bayesovský filtr se nejlépe používá spolu s antivirovými programy.

Techopedia vysvětluje Bayesovský filtr

Bayesovský filtr pracuje s pravděpodobností výskytu určitých slov v záhlaví nebo obsahu e-mailu. Některá slova označují vysokou pravděpodobnost, že e-mail je spam, například Viagra a refinancování. Filtr nezačne vědět, že je pravděpodobné, že slovo označuje vysokou pravděpodobnost nevyžádané pošty. Uživatelé musí ručně identifikovat e-mail jako spam. Když je nalezeno dostatečné množství slov a e-mail je identifikován jako spam, Bayesovský filtr se „naučí“ identifikovat slovo pomocí funkcí pravděpodobnosti. Totéž se děje s mnoha dalšími slovy a frázemi. V průběhu času se bayesovský filtr stává stále účinnějším při identifikaci spamu pro konkrétního uživatele. Když pravděpodobnost dosáhne určitého prahu, například 95 procent, pak je e-mail označen jako spam a často přesunut do nevyžádané složky (nebo někdy dokonce automaticky odstraněn). Uživatel si ho může pravidelně prohlížet a rozhodnout se, zda jej smaže nebo ne. Některé spamové programy jej případně přesunou do karanténního umístění, kde si uživatelé mohou zobrazit e-mail a zkontrolovat rozhodnutí softwaru.

Počáteční „školení“ může být často vylepšeno, aby se snížilo falešně pozitivních nebo falešných negativů, pokud se zjistí nesprávné úsudky. To umožňuje Bayesovskému filtru softwaru přizpůsobit se neustále se vyvíjející povaze spamu.

Některé filtry spamu také používají heuristiku spolu s Bayesovským filtrem. Předdefinovaná pravidla nastavuje uživatel, aby dále zvýšila přesnost identifikace e-mailu jako spamu. Tato pravidla mohou zahrnovat počet výskytů daného slova, eliminovat nebo ignorovat neutrální slova jako „the“, „a“ nebo „some“ nebo identifikovat posloupnosti děl, jako je „Viagra is good“, na rozdíl od použití pravděpodobnosti funkce všech čtyř jednotlivých slov.

Spamerové mohou používat techniku ​​zvanou Bayesovská otrava ke snížení účinnosti spamových filtrů pomocí Bayesovského filtrování. Některé techniky zahrnují injektování legitimního textu ze zpráv nebo literárních zdrojů, použití náhodných neškodných slov, která se zřídka nacházejí v spamu, nebo dokonce nahrazení textu obrázky.

Mnoho e-mailových klientů z bezpečnostních důvodů deaktivuje zobrazování obrázků. Spam tedy může oslovit méně příjemců.

Bayesovský filtr využívající Bayesovskou logiku lze použít ke klasifikaci jakéhokoli druhu dat. Medicína, věda a strojírenství našli uplatnění. Zajímavé je, že vědečtí vědci spekulovali, že dokonce i lidský mozek může použít bayesovskou logickou metodologii pro klasifikaci podnětů a stanovení specifického chování při reakci.

Co je bayesovský filtr? - definice z techopedie