Obsah:
Definice - Co znamená Scraping obsahu?
Škrábání obsahu je nezákonný způsob krádeže původního obsahu z legitimních webových stránek a zveřejnění odcizeného obsahu na jiné stránky bez vědomí nebo svolení vlastníka obsahu. Škrabky obsahu se často pokoušejí předat ukradený obsah jako své vlastní a neposkytují vlastníkům obsahu atribut.
Sběr obsahu lze provést pomocí ručního kopírování a vkládání, nebo může používat sofistikovanější techniky, jako je použití speciálního softwaru, programování HTTP nebo analyzátory HTML nebo DOM.
Většina obsahu, který se stává předmětem stírání, je materiál chráněný autorskými právy; jeho repostování bez souhlasu vlastníka autorských práv je trestným činem. Webové stránky škrabek jsou však hostovány po celém světě a škrabky, které jsou požádány o odstranění obsahu chráněného autorskými právy, mohou domény prostě změnit nebo zmizet.
Techopedia vysvětluje obsah škrábání
Škrabky obsahu mohou řídit návštěvnost svých webových stránek tím, že stírají vysoce kvalitní obsah s hustotou klíčových slov z jiných webů. Na to jsou obzvláště citlivé bloggeri, pravděpodobně proto, že je nepravděpodobné, že by jednotliví bloggerové zahájili legální útok proti škrabkám. Škrabci se vybízejí, aby pokračovali v této praxi, protože vyhledávače zatím nenašli účinný způsob, jak odfiltrovat jedinečný obsah od poškrábaného obsahu, což škrabákům umožňuje i nadále těžit.
Správci webových stránek se mohou chránit před škrábanci jednoduchými opatřeními, například přidáním odkazů na své vlastní stránky v obsahu. To jim alespoň umožní získat přenos zeškrábaného obsahu. Mezi sofistikovanější metody zacházení se škrabáním boti patří:
- Komerční anti-bot aplikace
- Chytání robotů pomocí honeypotu a blokování jejich IP adres
- Blokování robotů pomocí kódu JavaScript