Jobbörsen Nachrichten

Die Suchfunktionalität der Jobbörsen – eine semantische Tragödie?

Prof. Dr. Christoph Beck
Prof. Dr. Christoph Beck

19.7.2009/ghk. Es gibt einige Dinge, die Stellensuchende bei der Nutzung von Jobbörsen als suboptimal empfinden. Darunter sind Suchfunktionen, die jede größere Jobbörse ihren Nutzern zur Verfügung stellt, um aus Tausenden von Stellenangeboten das Passende herauszufiltern. Der Jobsuchende muß sich mit verschiedenen Möglichkeiten der Suchabfrage auseinandersetzen, die von den Jobbörsen gelieferte Trefferqualität und Paßgenauigkeit ist durchaus noch verbesserungsfähig.

Strukturierte Suchabfragen

Suchabfragen mit Hilfe von standardisierten Suchparametern wie Ort, Branche, Tätigkeit oder Publikationsdatum stellen Jobbörsen vor keine besonderen Schwierigkeiten. Sobald eine neue Stellenanzeige veröffentlicht wird, erfolgt entweder durch den Arbeitgeber oder die Jobbörse eine Klassifizierung der wichtigsten Kriterien. Dies kann automatisch erfolgen oder – wie es einige Jobbörsen praktizieren – die Stellenanzeige wird als Qualitätssicherungsmaßnahme manuell klassifiziert.

Schwieriger wird es bei einer Schnellsuche oder Freitext-Suche, wenn der Jobsuchende den gesamten Text einer Stellenanzeige nach bestimmten Begriffen durchsuchen möchte. Hier tritt bei einigen Jobbörsen eine semantische Ungenauigkeit zu Tage, die Trefferqualität zeigt dann von Jobbörse zu Jobbörse zum Teil erhebliche Unterschiede. Eine Untersuchung von Prof. Dr. Beck („Jobbörsen im Vergleich 2008″) stellte dies fest. Anhand einer manuellen Analyse von knapp 100.00 Stellenanzeigen wurde die bei Freitextsuchen festgestellte Paßgenauigkeit, also die inhaltliche Übereinstimmung einer gesuchten Tätigkeitsbeschreibung mit dem konkreten Stellenangebot aus der Datenbank der Jobbörse, zugeordnet.

Durchschnittliche Matching-Qualität

Prozent

Jobware

92,0%

Monster

81,9%

Arbeitsagentur.de

81,7%

Stellenanzeigen.de

70,8%

StepStone

62,1%

Jobpilot

55,3%

Jobscout24

53,5%

Quelle:  Jobbörsen im Vergleich 2008. Prof. Dr. Christoph Beck, Fachhochschule Koblenz

Einfluß auf die Ergebnisse haben auch Suchoptionen, die von den Jobbörsen bereitgestellt werden. So erlauben einzelne Jobbörsen sowohl die Suche im Titel als auch im Text der Stellenanzeigen. Wichtig ist ebenfalls, ob ein Suchbegriff, der aus mehreren Worten (z.B. „Sales Manager“) besteht, mit Anführungszeichen in der Schnellsuche gekennzeichnet wird.

Ursachen einer semantischen Tragödie

Die Bestrebungen der Computer-Wissenschaftler zur Nutzung einer Meta-Sprache, einer Datenbeschreibungs-Sprache, gehen auf die wissenschaftliche Methode der Taxonomie zurück. Der Begriff Taxonomie setzt sich aus den beiden griechischen Wurzeln Taxis (Ordnung) und Nomo (Regel) zusammen. In der Linguistik beschäftigt sich die Taxonomie mit der Segmentierung und Klassifikation sprachlicher Einheiten, um mit diesen ein Sprachsystem zu beschreiben. In Bezug auf Dokumente bzw. Inhalte wird der Begriff Taxonomie für ein Klassifikationssystem, eine Systematik oder den Vorgang des Klassifizierens verwendet. Klassifizierungen können beispielsweise durch die Erfassung von Metadaten und/oder die Verwendung einer Ablagestruktur vorgenommen werden.

In der Meta-Sprache, der beschreibenden Darstellung von Daten, werden mit „Attributen“ und „Attributwerten“ die notwendigen methodischen Unterscheidungen geschaffen. Hierbei beschreibt ein „Attribut“ eine Daten-Ressource und nutzt „Attributwerte“ zur Definition der einzelnen möglichen Inhalte. Nach diesem Konzept wäre „Farbe“ ein Attribut und „blau“ ein Attributwert von „Farbe“. Ein solcher vordefinierter Wertebereich wird auch als „Vokabular“ bezeichnet.

Meta-Sprache XML

Viele Informatik-Experten sehen in einem so genannten „Meta-Sprach-Standard“ einen Königsweg für die Lösung der Informations-Flut und die damit einhergehende Ungenauigkeit bei automatischen Suchvorgängen.im Online-Recruiting. Die Kernaufgabe bei der semantischen Suche liegt nicht im Routine-Abgleich von Zeichensätzen oder „Search Strings“, sondern zunächst in der möglichst intelligenten Einschätzung, um welche Art Information es sich handelt und erst danach nach dem eigentlichen Inhalt.

Ein Lösungsansatz bietet hierbei die Weiterentwicklung XML („Extended Mark-up Language“). Auf diesen Ideen basieren auch die branchenspezifischen Verfeinerungen des HR-XML Standards (Human Resources XML). Im Mittelpunkt steht hierbei die Idee, Dokumente und Texte mit so genannten „Tags“, also Informations-Klassen zu kennzeichnen. Während ein konventionelles HTML-Dokument (also eine Webseite oder eine im HTML-Format publizierte Stellenanzeige) lediglich Inhalte und deren Formatierung (Fett, Kursiv, Aufzählung usw.) kennt, ergänzt der XML-Ansatz diese Dokumente noch mit zusätzlichen Angaben über die zugrunde liegenden Informationsklassen (Tags). So wird aus dem unspezifischen „20.10. 2008“ eben ein Einstellungs-Datum, ein Austrittsdatum oder ein anderes spezifisches Datum. Somit können solche „Tags“ auch nützliche Funktionen bei Suchfunktionen übernehmen.

Besonders schwierig wird es für die Suchalgorithmen der Jobbörsen, wenn Synonyme oder Umschreibungen von vergleichbaren Tätigkeitsbezeichnungen gesucht werden. So hat die Jobbörse der Arbeitsagentur zwar die Berufsbezeichnung „Gardemanger“ in ihren Datenbanken verzeichnet, die Tätigkeit als „Sandwich Artist“, wie sie von vielen Fast-food-Ketten verwendet wird, fehlt hingegen bei der Arbeitsagentur.

Die Praxis zeigt jedoch eine Mehrfachverwendung von Tätigkeitsbeschreibungen. So liefert die Jobsuchmaschne „Careerjet“ (Stand 27.10.2008) für diese Tätigkeit folgende Ergebnisse für die europäischen Länder:

  • Kaltmamsell                             3  Stellenangebote
  • Sandwich Artist                    19  Stellenangebote
  • Gardemanger                       47  Stellenangebote.

Hinter computergestützten Suchprozessen verbergen sich keine intelligenten Redakteure, sondern semantische Text-Analyse-Programme, die mit künstlicher Intelligenz die Tücken der menschlichen Sprache lösen sollen. Für das webbasierte Recruiting ist also die paßgenaue Wirkungsweise von maschineller Indizierung und semantischer Analyse, also die Einbeziehung von Synonymen und Umschreibungen, ein kritischer Erfolgsfaktor.

Die Welt der Personalbeschaffung ist heute fragmentierter und komplexer denn je. Jeder Teil des Rekrutierungs-Prozesses wurde weiterentwickelt, um größere Effizienz zu erreichen. Doch die erfolgreiche Integration der Such-Technologien und die zu erzielenden Treffer-Qualitäten bleiben in der Praxis noch eine Herausforderung.

Von der Theorie zur Praxis

Natürlich ist es noch ein weiter Weg, um die theoretischen Lösungsansätze in die allgemeine Praxis des Recruiting umzusetzen. Für Personaler und Stellensuchende gilt es zunächst abzuwarten, welche Prioritäten die Jobbörsen dem Problem der Trefferqualität zuordnen und die entsprechenden Investitionen in ihre IT-Systeme finanzieren.

Am Anfang dieser Weiterentwicklung steht natürlich die Sensibilisierung für die Problematik. Wenn Jobbörsen sich um eine nachhaltige Verbesserung der Treffergenauigkeit bemühen, schaffen sie sich automatisch einen Qualitätsvorsprung im Wettbewerb.

Weiterführende Links:

Jobbörsen im Vergleich. Studie von Prof. Dr. Beck – kostenloser Download >>> hier

Nachts, wenn alle Personalchefs schlafen … schlägt die Stunde der Jobsuchmaschinen >>>hier

HRM XML Standards >>>mehr bei HRM.de

.

1 Comment

  • Guten Tag!

    Zum diesem Artikel drängt sich mir eine Frage auf: Ist nun die Auffindbarkeit einer Anzeige bzw. die Passgenauigkeit der Suche abhängig von der Jobbörse oder von den Verantwortlichen der Stellenanzeige oder beides?

    Eine Volltextsuche durchsucht – wie der Name schon verrät – den Text einer Stellenanzeige auf ein oder mehrere eingegebene Suchwörter.
    Ich verstehe den Zusammenhang von Jobbörse und Ergebnisrichtigkeit einer Volltextsuche nicht, wenn doch die Verantwortung für den „Volltext“, also der Text der Stellenbeschreibung, bei dem Unternehmen liegt.

    Viele „grübelnde“ Grüße

    Patrick Gilles
    job affairs

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert