Obsah:
Definice - Co znamená Apache Lucene?
Apache Lucene je projekt s otevřeným zdrojovým kódem pro vysoce výkonnou a plnohodnotnou knihovnu textového vyhledávače, která je psána výhradně pomocí Java.
Je schopen fulltextového vyhledávání v dokumentech, takže se jedná o technologii, která je vhodná pro každou aplikaci, která vyžaduje tuto funkci, zejména pokud jde o platformu napříč platformami.
Poprvé byl vyvinut společností Doug Cutting v roce 1999 a v září 2001 se stal oficiálně součástí rodiny open-source Java projektů Apache Foundation v září 2001. V únoru 2005 byl povýšen na špičkový projekt Apache.
Techopedia vysvětluje Apache Lucene
Apache Lucene je vysoce výkonný vyhledávač s konceptem „dokumentu obsahujícího pole textu“ ve své základní logické architektuře. To nabízí velkou flexibilitu a umožňuje Lucene API stát se nezávislým na jakémkoli formátu souboru.
Jakýkoli text z formátů, jako jsou MS Word, HTML, XML, PDF a OpenDocument, lze indexovat, pokud lze extrahovat textové informace, což znamená, že s obrázky nemůže nic dělat.
Lucene je vhodný pro jakoukoli aplikaci, která potřebuje fulltextové indexování a vyhledávání, ale je všeobecně uznáván jako skvělý nástroj pro implementaci internetových vyhledávačů a pro lokální vyhledávání na jednom místě.
Mezi vlastnosti patří:
- Škálovatelné a vysoce výkonné indexování - na moderním hardwaru může zpracovat více než 150 Gb za hodinu a vyžaduje pouze 1 Mb na hromadu požadavků na paměť.
- Výkonné, přesné a efektivní vyhledávací algoritmy - nabízí mnoho typů výkonných dotazů, jako jsou fráze, zástupné znaky, blízkost a rozsahové dotazy. Má také pole vyhledávání a třídění podle libovolného pole.
- Cross platform - čistě implementace Java a dostupná také v jiných programovacích jazycích.