Q:
Proč je matice záměny užitečná v ML?
A:Existuje řada způsobů, jak hovořit o tom, proč je matice zmatení v strojovém učení (ML) cenná - ale jedním z nejjednodušších způsobů je vysvětlit, že matice zmatení je zdrojem vizualizace dat.
Matice zmatení umožňuje divákům na první pohled vidět výsledky použití klasifikátoru nebo jiného algoritmu. Použitím jednoduché tabulky k zobrazení analytických výsledků zmatená matice v podstatě zredukuje vaše výstupy do přehlednějšího pohledu.
Matice zmatení používá k uspořádání výsledků konkrétní terminologii. Existují pravdivá pozitiva a pravdivá negativa, stejně jako falešná pozitiva a falešná negativa. Pro složitější matici zmatení nebo matici založenou na srovnávací klasifikaci mohou být tyto hodnoty zobrazeny jako skutečné a predikované třídy pro dva odlišné objekty.
Bez ohledu na sémantickou terminologii jsou výsledky seskupeny do čtvercové (nebo obdélníkové) tabulky.
Toto zobrazení usnadňuje analytikům zjistit, jak přesně byl algoritmus v klasifikaci výsledků. (Přečtěte si nové generátory, aby moderní algoritmy pracovaly na ASCII čl.)
Užitečnost matice záměny se týká složitosti projektů ML a také způsobu, jakým jsou informace formátovány a dodávány uživatelům. Představte si řadu lineárních výsledků včetně falešných pozitiv, falešných negativů, pravdivých pozitivů a pravdivých negativů. (Přečtěte si strojové učení 101.)
Uživatel by musel shrnout všechny tyto lineární výsledky do grafu, aby pochopil, jak algoritmus pracoval a jak přesný byl. Díky matici zmatení jsou tyto informace jednoduše prezentovány ve výkonném vizuálním modelu.
Předpokládejme například, že je stroj vyzván k klasifikaci 20 obrázků, z nichž pět je ovoce a pět je zelenina. Pokud matice záměny obsahuje následující obsah (zleva nahoru ve směru hodinových ručiček): 7, 5, 3, 5, pak matice ukazuje, že sedm bylo správně identifikováno jako zelenina, zatímco tři byly správně klasifikovány jako ovoce.
Dalších 10, jak je znázorněno, jsou výsledky, kdy program nedokázal správně identifikovat obraz.
Matice zmatení bude užitečná ve všech druzích analytiků ML. Pozorováním tohoto zdroje mohou uživatelé zjistit, jak řešit problémy, jako je rozměrnost a přeplnění, a další způsoby, jak optimalizovat algoritmus.