Domov Rozvoj Co je regulární výraz? - definice z techopedie

Co je regulární výraz? - definice z techopedie

Obsah:

Anonim

Definice - Co znamená regulární výraz?

Regulární výraz je metoda používaná v programování pro párování vzorů. Regulární výrazy poskytují flexibilní a výstižné prostředky, aby odpovídaly řetězcům textu. Například regulární výraz lze použít k prohledávání velkých objemů textu a ke změně všech výskytů „kočky“ na „pes“.


Regulární výrazy se používají pro systémy zvýrazňující syntaxi, ověřování dat a ve vyhledávačích, jako je Google, k pokusu o určení algoritmické shody s dotazem, který uživatel požaduje.


Regulární výrazy jsou také známy v krátké podobě jako regex nebo regexp.

Techopedia vysvětluje regulární výraz

Nástroje, textové editory a programovací jazyky používají regulární výrazy k manipulaci a vyhledávání vzorů textu. Zatímco některé jazyky integrují regulární výrazy do jádra syntaxe jazyka, jako TCL, Awk, PERL a RUBY, jiné používají regulární výrazy prostřednictvím knihoven, jako jsou Java, C ++ a C. To znamená, že existují implementační rozdíly, takže regulární výraz, který funguje dobře s jednou aplikací může nebo nemusí pracovat s jinou aplikací. Existují jemné rozdíly.


Regulární výrazy mohou být neuvěřitelně silné. V zásadě, pokud lze vzor definovat, lze vytvořit regulární výraz. Jednoduchý vzorec může být něco tak jednoduchého, jako je nalezení všech situací, kdy věta končí v „tom“ a je nahrazena „který“. Vzorek by mohl být složitější provedením stejné náhrady, ale pouze při 3. a 5. výskytu zápasu. Nebo by to mohlo být ještě složitější pomocí různých sad odpovídajících znaků v závislosti na frekvenci a umístění předchozích odpovídajících znaků.


Tři hlavní složky regulárního výrazu jsou kotvy, které se používají ke specifikaci polohy vzoru ve vztahu k řádku textu, znakové sady, které odpovídají jednomu nebo více znakům na jedné pozici, a modifikátory, které určují počet opakování předchozí znaková sada se opakuje.


Operace, které pomáhají při vytváření regulárních výrazů, jsou:

  • Kvantifikace: Kvantifikátory určují, jak často se může předchozí prvek vyskytovat.
  • Seskupení: Operátoři mohou stanovit jejich rozsah a prioritu pomocí závorek.
  • Booleovské podmínky: Pro operátory a skupiny lze uvést podmínku OR nebo AND.
Regulární výrazy používají algoritmy, jako je deterministická konečná automatizace (DFA) a nedeterministická konečná automatizace (NFA), aby odpovídaly řetězci. V NFA je pro každou dvojici stavových a vstupních symbolů několik možných dalších stavů, zatímco DFA přijímá konečný řetězec symbolů.

Co je regulární výraz? - definice z techopedie