Glossar

Parser

Die Bezeichnung Parser kommt sowohl aus dem Englischen als auch dem Lateinischen. Im Englischen ist sie abgeleitet von „to parse“, was übersetzt für analysieren steht. Im Lateinischen wird „pars“ als Synonym für Teil verwendet. Bei einem Parser handelt es sich um eine Software, die dafür zuständig ist, Daten zu analysieren, zu zerlegen und in ein Format umzuwandeln, das für die weitere Verarbeitung geeignet ist. Außerdem liefert ein Parser nach der Umwandlung ergänzende Beschreibungen der Datenstruktur. Im Internet prüft ein Parser den Quellcode der Website, zerlegt ihn und wandelt ihn in eine Form um, mit der die Webbrowser umgehen können.

Wie arbeiten die im Internet verwendeten Parser?

Die Basis der Parser sind so genannte Lexer. Bei diesem Begriff handelt es sich um eine Verkürzung der Bezeichnung lexikalischer Scanner. Sie sind für die Zerlegung der zu bearbeitenden Datensätze zuständig. Bei einer mit HTML ausgezeichneten Website nimmt der Lexer eine Zerlegung der Inhalte in den eigentlichen HTML-Code und den Fließtext vor. Dabei sucht der Lexer nach den typischen Anzeichen von HTML-Code in Form der spitzen Klammern zur Eröffnung und zum Beenden einer Code-Sequenz. Der Parser selbst ist dann dafür zuständig, herauszufinden, welche der HTML-Befehle zusammen gehören. Das heißt, er muss auch erkennen können, wie die einzelnen Tags miteinander verschachtelt wurden. Das muss immer korrekt geschehen, denn nur so kann später der Browser die Inhalte einer Website richtig anzeigen. Hier erweist sich WordPress als fortschrittlich, denn es bietet die Möglichkeit, falsch verschachtelte HTML-Tags automatisch korrigieren zu lassen.

Welche Arten der Parser gibt es?

Zuerst einmal werden die Parser durch die Nutzung der grammatikalischen Regeln unterschieden. Daraus ergeben sich die Bezeichnungen kontextfreie und kontextsensitive Parser. Zu Letzteren gehört Parsing Expression Grammars, auch kurz Packrat genannt. Die Palette der kontextfreien Parser ist etwas umfangreicher:
• Top-Down (LL und LF)
• Bottom-Up (LR, SLR, LALR)
• Chart-Parser
• Left-Corner (LC)

Daran wird deutlich, dass die Parser auch nach anderen Kriterien unterschieden werden. Das geschieht beispielsweise durch die Technik der Implementierung und die spezifische Vorgehensweise bei der Analyse der zu verarbeitenden Daten.


Interessiert? Erfahren Sie mehr zum Thema "Parser" - kontaktieren Sie uns jetzt

We create for You

Unter der Überschrift „Kreation“ vereinen wir die 4 Kernkompetenzen von baseplus®: Das Design, die Entwicklung, das Online Marketing und Print, in der jeweils anmutenden Farbe. Das konsequente Color-Coding dient der optimierten Benutzerführung, die Claims kommunizieren jeden Bereich zusätzlich.

Klicken Sie hier, um zu sehen was wir meinen