Domov Blogování Co je škrábání obsahu? - definice z techopedie

Co je škrábání obsahu? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Scraping obsahu?

Škrábání obsahu je nezákonný způsob krádeže původního obsahu z legitimních webových stránek a zveřejnění odcizeného obsahu na jiné stránky bez vědomí nebo svolení vlastníka obsahu. Škrabky obsahu se často pokoušejí předat ukradený obsah jako své vlastní a neposkytují vlastníkům obsahu atribut.


Sběr obsahu lze provést pomocí ručního kopírování a vkládání, nebo může používat sofistikovanější techniky, jako je použití speciálního softwaru, programování HTTP nebo analyzátory HTML nebo DOM.


Většina obsahu, který se stává předmětem stírání, je materiál chráněný autorskými právy; jeho repostování bez souhlasu vlastníka autorských práv je trestným činem. Webové stránky škrabek jsou však hostovány po celém světě a škrabky, které jsou požádány o odstranění obsahu chráněného autorskými právy, mohou domény prostě změnit nebo zmizet.

Techopedia vysvětluje obsah škrábání

Škrabky obsahu mohou řídit návštěvnost svých webových stránek tím, že stírají vysoce kvalitní obsah s hustotou klíčových slov z jiných webů. Na to jsou obzvláště citlivé bloggeri, pravděpodobně proto, že je nepravděpodobné, že by jednotliví bloggerové zahájili legální útok proti škrabkám. Škrabci se vybízejí, aby pokračovali v této praxi, protože vyhledávače zatím nenašli účinný způsob, jak odfiltrovat jedinečný obsah od poškrábaného obsahu, což škrabákům umožňuje i nadále těžit.


Správci webových stránek se mohou chránit před škrábanci jednoduchými opatřeními, například přidáním odkazů na své vlastní stránky v obsahu. To jim alespoň umožní získat přenos zeškrábaného obsahu. Mezi sofistikovanější metody zacházení se škrabáním boti patří:

  • Komerční anti-bot aplikace
  • Chytání robotů pomocí honeypotu a blokování jejich IP adres
  • Blokování robotů pomocí kódu JavaScript
Co je škrábání obsahu? - definice z techopedie