Service » E-Mail » Mailfilter

ID #1132

Wie können RegExes bei der Filterung von E-Mails sinnvoll eingesetzt werden?

Die Einsatzmöglichkeiten der Regular Expressions bei der Filterung Ihres E-Mail Verkehrs sind äusserst vielfältig, aufgrund der Komplexität und Mächtigkeit der RegExes kann die Verwendung der regulären Ausdrücke jedoch bei falscher Konfiguration auch äusserst gefährlich sein!

Nachfolgend finden Sie daher einige sinnvolle und praktische Beispiele, wie Sie RegExes bei der Filterung Ihres Mailverkehrs nutzen können.

Hierzu ist es jedoch zunächst erforderlich, kurz auf die Grundelemente der RegExes einzugehen:

(?i)

Hiermit definieren Sie, dass die RegEx sowohl Groß- und Kleinschreibung berücksichtigen soll.

[148ahle]

Ein beliebiges aus der Menge der in eckigen Klammern angegebenen Zeichen soll vorkommen. Wenn mehrere der Zeichen in der Menge hintereinander kommen, kann man diese durch ein - abkuerzen, z.B. [a-f] für [abcdef].

[a-z]

Durch diese Angabe werden alle Kleinbuchstaben von "a" bis "z" berücksichtigt.

[A-Z]

Analog zu den Kleinbuchstaben werden hiermit alle Großbuchstaben von "A" bis "Z" berücksichtigt.

[0-9]

Umfasst alle Ziffern von "0" bis "9".

\d

Alternativ zur Angabe [0-9] können mit dieser Angabe auch alle Ziffern angegeben werden.

\s

Ein beliebiges Whitespace (Leerzeichen oder Tabulator).

|

Dies ist das "Oder"-Zeichen für Regular Expressions.

.

Der Punkt steht für ein beliebiges Zeichen.

*

Das vorangegangene Zeichen kann beliebig oft (auch gar nicht) vorkommen.

+

Das vorangegangene Zeichen kann beliebig oft,es muss jedochmindestens einmal vorkommen.

?

Das vorangegangene Zeichen ist optional.


Nachfolgend finden Sie nun einige praktische und einfache Beispiele für die Verwendung von Regular Expressions:

 

(?i)v[i1]agra
Die zu überprüfende Zeichenkette muss nun folgende Bedingungen erfüllen, damit die Regular Expression zutrifft (matcht):

1. (?i) : Die Groß- und Kleinschreibung spielt keine Rolle

2. v: In der Zeichenkette muss ein "v" vorhanden sein

UND

3. [i1]: Dem "v" muss entweder ein "i" ODER eine "1" folgen

UND

4. agra: Den oben beschriebenen Zeichen muss die Zeichenfolge "agra" folgen.

Unter anderem können durch das oben beschriebene Beispiel folgende Schreibweisen abgedeckt werden:

- ViAgrA
- V1aGRa
- viagra


(?i)t[e3]{2}n
Die zu überprüfende Zeichenkette muss nun folgende Bedingungen erfüllen, damit die Regular Expression zutrifft (matcht):

1. (?i) : Die Groß- und Kleinschreibung spielt keine Rolle

2. t: In der Zeichenkette muss ein "t" vorhanden sein

UND

3. [e3]{2}: Dem "t" müssen entweder "ee" , "e3" , "33" oder "3e" folgen. Durch die Angabe "{2}" definieren wir, dass das vorangestellte Zeichen zweimal vorhanden sein muss. Da es sich hierbei um eine Menge handelt, müssen zwei Zeichen aus der menge hintereinander folgen

UND

4.
n: Den oben beschriebenen Zeichen muss das Zeichen "n" folgen.

Unter anderem können durch das oben beschriebene Beispiel folgende Schreibweisen abgedeckt werden:

- teen
- t33n
- T33N
- te3n

(?i)v\s*[i|1]\s*[a4@]\s*g\s*r\s*[a4@]
Die zu überprüfende Zeichenkette muss nun folgende Bedingungen erfüllen, damit die Regular Expression zutrifft (matcht):

1. (?i) : Die Groß- und Kleinschreibung spielt keine Rolle

2. v: In der Zeichenkette muss ein "v" vorhanden sein

UND
3. \s*: Es koennen beliebig viele Whitespaces kommen

UND
4. [i|1]: Es muss ein "i", ein "|" oder eine "1" folgen

UND
5. \s*: Es koennen beliebig viele Whitespaces kommen

UND
6. [a4@]: Es muss ein "a", eine "4" oder ein "@" folgen

UND
7. \s*: Es koennen beliebig viele Whitespaces kommen

UND

8. g: Es muss der Buchstabe "g" vorhanden sein

UND

9. \s*: Es koennen beliebig viele Whitespaces kommen

UND

10. r: Es muss der Buchstabe "r" vorhanden sein

UND

11. \s*: Es koennen beliebig viele Whitespaces kommen

UND

12. [a4@]: Es muss ein "a", eine "4" oder ein "@" folgen

Unter anderem können durch das oben beschriebene Beispiel folgende Schreibweisen abgedeckt werden:

- viagra
- vi@gr@
- v | @ g r @
- v 1a g r@

 

Wie Sie bereits an diesen einfachen Beispielen erkennen können, ist die Anwendungsvielfalt der Regular Expressions schier unbegrenzt. Bereits bei der Verwendung von simplen Angaben kann eine Vielfalt an Zeichenketten abgedeckt werden und eine deutlich größere Trefferquote bei der Filterung von Mails erzielt werden.

ACHTUNG: Wir möchten nochmals darauf hinweisen, dass Regular Expressions nur mit größter Sorgfalt eingesetzt werden sollten, da bei einer Fehlkonfiguration die Gefahr, dass auch erwünschte Mails gefiltert werden, äussert hoch ist!

UniProvider Tags: Mailfilter

Verwandte Artikel:

Letzte Änderung des Artikels: 2008-06-23 00:23
Verfasser des Artikels: UniProvider Support
Revision: 1.1

Digg it! Artikel ausdrucken Jetzt Weiterempfehlen Als PDF-Datei anzeigen
Übersetzungsvorschlag für Übersetzungsvorschlag für
Bewertung der Nützlichkeit dieses Artikels:

Durchschnittliche Bewertung: 0 von 5 (0 Bewertungen)

vollkommen überflüssig 1 2 3 4 5 sehr wertvoll

Kommentieren nicht möglich