Obsah:
Definice - Co znamenají nestrukturovaná data?
Nestrukturovaná data představují všechna data, která nemají rozpoznatelnou strukturu. Je neorganizovaný a syrový a může být netextový nebo textový. Například e-mail je dobrým příkladem nestrukturovaných textových dat. Obsahuje čas, datum, podrobnosti o příjemci a odesílateli, předmět atd., Ale tělo e-mailu zůstává nestrukturované. Nestrukturovaná data mohou být také identifikována jako volně strukturovaná data, přičemž zdroje dat obsahují strukturu, ale ne všechna data v sadě dat sledují stejnou strukturu.
V podnicích zaměřených na zákazníka mohou být data nalezená v nestrukturované podobě prozkoumána, aby se zlepšil vztahový marketing a řízení vztahů se zákazníky (CRM). Protože aplikace sociálních médií, jako jsou Facebook a Twitter, vstupují do hlavního proudu, vývoj nestrukturovaných dat pravděpodobně předčí vývoj strukturovaných dat.
Techopedia vysvětluje nestrukturovaná data
Nestrukturovaná data se vztahují k datům, která následují ve formě, která je méně uspořádaná než položky, jako jsou tabulky, databázové tabulky nebo jiné lineární nebo uspořádané sady dat. Ve skutečnosti je termín „datová sada“ užitečný, protože je spojen s daty, která jsou čistá, přístupná pole, bez jakéhokoli dalšího obsahu a která je propojena nebo označena ve specifické struktuře.
Další příklady nestrukturovaných textových dat zahrnují dokumenty Word, prezentace PowerPoint, rychlé zprávy, software pro spolupráci, dokumenty, knihy, příspěvky v sociálních médiích a lékařské záznamy. Netexturovaná nestrukturovaná data se obvykle vytvářejí v médiích, jako jsou zvukové soubory MP3, obrázky JPEG a videosoubory Flash atd.
Nestrukturovaná data obvykle neobsahují předdefinovaný datový model a nemusí se dobře shodovat s relačními tabulkami. Nestrukturovaná data jsou obvykle těžká. Může však zahrnovat čísla a data, jakož i fakta. To vede k nejasnostem, které je obtížné identifikovat pomocí konvenčních softwarových programů.
Ukládání obrovských objemů nestrukturovaných dat generovaných v podniku, pokud je špatně spravováno, může vést k vyšším výdajům. Data v tištěných dokumentech nebo v elektronickém formátu musí být skenována, aby vyhledávací aplikace mohla analyzovat nápady, v závislosti na slovech používaných v určitých kontextech. Toto je známé jako podnikové nebo sémantické vyhledávání.