Obsah:
Definice - Co znamená charakterizace?
Charakterizace je metodologie velkých dat, která se používá pro generování popisných parametrů, které účinně popisují vlastnosti a chování konkrétní datové položky. To je pak použito v nepodřízených učebních algoritmech za účelem nalezení vzorů, klastrů a trendů bez začlenění popisků tříd, které mohou mít zkreslení. Má své využití v clusterové analýze a dokonce i hlubokém učení.
Techopedia vysvětluje charakterizaci
Charakterizace velkých dat je technika pro transformaci nezpracovaných dat na užitečné informace, která se používá v algoritmech strojového učení a dolování dat. Charakterizace v podstatě generuje kondenzované reprezentace toho, co je obsah informací skrytý v datech. Proto jej lze použít jako prostředek k měření a sledování událostí, změn a nových naléhavých chování ve velkých dynamických datových proudech.
Některé výhody charakterizace:
- Může generovat užitečné metriky pro sledování a měření událostí a anomálií v souborech dat
- Vytváří malé stopy základních informací
- Rychle provádí převod dat na informace, což přiblíží odvětví k úplné transformaci dat na informace a poznání
- Je užitečný pro indexování a označování konkrétních objektů, událostí a dalších funkcí ve sbírce dat
