Domov Databáze Co je to apache lucene? - definice z techopedie

Co je to apache lucene? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená Apache Lucene?

Apache Lucene je projekt s otevřeným zdrojovým kódem pro vysoce výkonnou a plnohodnotnou knihovnu textového vyhledávače, která je psána výhradně pomocí Java.

Je schopen fulltextového vyhledávání v dokumentech, takže se jedná o technologii, která je vhodná pro každou aplikaci, která vyžaduje tuto funkci, zejména pokud jde o platformu napříč platformami.

Poprvé byl vyvinut společností Doug Cutting v roce 1999 a v září 2001 se stal oficiálně součástí rodiny open-source Java projektů Apache Foundation v září 2001. V únoru 2005 byl povýšen na špičkový projekt Apache.

Techopedia vysvětluje Apache Lucene

Apache Lucene je vysoce výkonný vyhledávač s konceptem „dokumentu obsahujícího pole textu“ ve své základní logické architektuře. To nabízí velkou flexibilitu a umožňuje Lucene API stát se nezávislým na jakémkoli formátu souboru.


Jakýkoli text z formátů, jako jsou MS Word, HTML, XML, PDF a OpenDocument, lze indexovat, pokud lze extrahovat textové informace, což znamená, že s obrázky nemůže nic dělat.


Lucene je vhodný pro jakoukoli aplikaci, která potřebuje fulltextové indexování a vyhledávání, ale je všeobecně uznáván jako skvělý nástroj pro implementaci internetových vyhledávačů a pro lokální vyhledávání na jednom místě.


Mezi vlastnosti patří:

  • Škálovatelné a vysoce výkonné indexování - na moderním hardwaru může zpracovat více než 150 Gb za hodinu a vyžaduje pouze 1 Mb na hromadu požadavků na paměť.
  • Výkonné, přesné a efektivní vyhledávací algoritmy - nabízí mnoho typů výkonných dotazů, jako jsou fráze, zástupné znaky, blízkost a rozsahové dotazy. Má také pole vyhledávání a třídění podle libovolného pole.
  • Cross platform - čistě implementace Java a dostupná také v jiných programovacích jazycích.
Co je to apache lucene? - definice z techopedie