Mario Sedlak
Computer
Hauptthemen

Reguläre Ausdrücke

Reguläre Ausdrücke werden zum Suchen nach Textteilen verwendet. Mit regulären Ausdrücken kann man z. B. alle Stellen in einem Text finden, wo drei gleiche Zeichen hintereinander stehen.

Im Prinzip sind reguläre Ausdrücke eine Erweiterung der von DOS bekannten Jokerzeichen * und ? zum Suchen von Dateien.

Nachteile

Mit regulären Ausdrücken kann man so viel machen, dass manche Leute glauben, man kann damit alles machen. Aber das stimmt nicht, das ist ein Hype.

Z. B. schwärmen viele für reguläre Ausdrücke zur Logfile-Auswertung. Na gut, dachte ich mir, dann probiere ich damit einmal herauszufinden, welche der dynamisch erstellten Webseiten im Durchschnitt die längste Ausführungszeit haben. Aber Pech gehabt: Genau das ist mit regulären Ausdrücken nicht möglich! Das kann nur eine richtige Datenbank.

In der Praxis bin ich außerdem auf folgende Probleme gestoßen:

Mein Fazit

Wenn einem eine Datenbank zur Verfügung steht, fallen viele populäre Anwendungen von regulären Ausdrücken weg. Textdateien und reguläre Ausdrücke sind eindeutig leistungsschwächer als eine Datenbank. Wenn man "für den Anfang" mit ihnen arbeitet, wird man irgendwann später, wenn die Anforderungen so nicht mehr bewältigbar sind, alles nochmals neu mit einer Datenbank machen müssen.

Nur zum Durchsuchen von unstrukturiertem Text sind reguläre Ausdrücke konkurrenzlos.

Weiter

Künstliche Intelligenz

Siehe auch

Seite erstellt am 8.3.2009 – letzte Änderung am 3.9.2010