Anwenderkonferenz
Einführung
Managementansätze
Webknowledge - ein neuer Ansatz
Informationssuche
Informationsquellen
Maßnahmen
Archiv
e-Learning
Intangible Assents
Intranet
Kompetenzmanagement
Mitarbeiteraktivierung
Suchtechnololgie
Blogmonitoring
Marketing 2.0 - Die neue Macht des Kunden
10 Gründe gegen Second Life
Online Marketing ist nicht Marketing online
Bürgerjournalismus
Webmonitoring
So knackt man Suchmaschinen
Neue Konkurrenz für Google?
Wie sinnvoll sind eigentlich Meta-Tags?
Was ist eigentlich Click Popularity?
Was ist eigentlich SEM/SEO?
Suchmaschinen-Konferenz 2004 in Berlin
Studie: Top Ten Suchmaschinen
Das Open Directory Project (DMOZ)
Pragmatisches Wissensmanagement – Realität oder Utopie?
Wissensbewahrung

Newsletter
Webknowledge Blog
Glossar
Webbarometer
 /Webknowledge /Archiv/Suchtechnololgie/Das Open Directory Project (DMOZ)

Das Open Directory Project (DMOZ)



Das Open Directory Project beschäftigt keine bezahlten Editoren. Die Indexierung erfolgt von freiwilligen Mitarbeitern. Die Idee und der Name ist von "Open Source" hergeleitet, dessen Idee von der Linux-Community abstammt. Der finnische Student Linus Torvalds hatte Anfang der 90er Jahre sein Betriebssystem im Internet freigegeben, das sich sobald als Alternative zum Betriebssystem Microsoft Windows entwickelte. Der Erfolg von Linux ist der freiwilligen Mitarbeit von Tausenden von Programmierern zu verdanken, die das Betriebssystem mit Programmen, Systemroutinen, Treibern und Softwareprojekten unentgeltlich und frei zur Verfügung stellen. Die Hauptentwickler von Linux arbeiten mit wissenschaftlichem Eifer an dem Projekt und protokollieren ihre Fortschritte.
Dieser Grundidee hat auch das Open Directory Project seinen Erfolg zu bedanken, wonach auch Editoren durch freiwillige Teilnahme das ODP-Verzeichnis täglich mit mühseliger handarbeit aktualisieren und indexieren.


Auch wird jede Änderung und Aktualisierung automatisch in einem für Editoren sichtbaren Backoffice protokolliert. Die Editoren erhalten somit die Möglichkeit die Gründe ihrer Änderungen für Inhalte zu verfolgen und nachzuvollziehen. Editor kann grundsätzlich jeder werden, der sich für eine bestimmte Kategorie im Verzeichnis bewirbt und sich an die ODP-Richtlinien hält.

Datenbasis
Bei ODP handelt es sich um ein polyhierarchisches Kategorieverzeichnis. Inhalte von Webseiten werden nicht wie etwa bei Google als Volltext indexiert. Die Indexierung der Webseiten wird von freiwilligen Editoren ins Verzeichnis mit der Internetadresse (URL) und einer passenden Beschreibung zur Webseite vorgenommen. Somit bleibt gerade eine Suche nach speziellen Suchwörtern auf die im Verzeichnis dokumentierten Kurzbeschreibungen und den Namen der URLs beschränkt.
Derzeit sind 43 000 Editoren bei ODP aktiv beschäftigt, die insgesamt 2,2 Millionen Webseiten verwalten. Die Kategorien sind mit 440 000 an der Zahl sehr hoch und daher auch aufgrund der Polyhierarchie, die zudem noch in verschiedene Sprachen unterteilt ist, sehr komplex und unüberschaubar. Die Editoren haben meist in verschiedenen Bereichen freie Hand neue Klassen zu schaffen und Unterverzeichnisse mit neuen Klassen zu bereichern. Somit ist trotz vieler Regeln für Editoren ein willkürlich gestaltetes Verzeichnis unvermeidlich.

Content Management für Editoren
Die Software für die Suchfunktion namens Isearch wurde in das ODP implementiert.  Das Tool Isearch (ebenfalls Open Source, also frei) wird von dem Unternehmen Etymon ® entwickelt und angeboten. Weitere Veränderungen seitens ODP im Quelltext wurden nicht vorgenommen. Somit geht die Suche lediglich über die dem ISO Standard angepassten Booleschen Operatoren nicht hinaus.

Partnerseiten
Gerade Suchmaschinen mit automatischer Indexierung bieten als Zusatz auch ein Verzeichnis an. Hier wird oft auf ODP zugegriffen, wie beispielsweise bei der bekannten Suchmaschine Google unter dem Menü "Verzeichnis". Google nutzt hierbei eine Schnittstelle zu ODP. Inhalte werden von ODP auf eigener Google-Datenbank auf gewohnter Google-Oberfläche angeboten

Googles Verzeichnis bei Google.de
Ähnlich machen es auch Partner wie AOL Search, AltaVista, HotBot, Lycos und Netscape Search. Aktualisierungen und Inhalte durch ODP werden jedoch durch den zeitverzögerten Datentransport erst nach zwei Wochen bis mehrere Monate bei diesen Partnern wirksam. Insgesamt hat ODP über 350 Partner ansprechen können, die die ODP-Datenbank den Nutzern auf Webseiten präsentieren. Darunter sind auch französische, italienische, niederländische, polnische, schwedische und spanische Anbieter, die Inhalte in eigener Landessprache anbieten.
>> Liste der Suchmaschinen, die auf die DMOZ-Datenbank zurückgreifen

Ranking
Eine spezielle Ranking-Funktion besitzt ODP nicht. Hier wird nach dem Exact Match-Prinzip gesucht. Ein höheres Ranking haben jedoch Seiten, die vom Editor als cool gekennzeichnet wurden. (Editoren haben die Möglichkeit pro Webseite ihrer eigenen Kategorie eine URL als die Haupt-URL zu kennzeichnen. Diese werden bei der Result-Seite jeweils immer ganz oben gezeigt)

Metasuche
Nach der Suche bietet ODP die Ausweitung des Suchbegriffs auf andere Suchmaschinen, ohne die Anfrage erneut eingeben zu müssen. So kann die Suche auf weitere Suchmaschinen, die vor allem automatisch indexierte Datenbanken anbieten erweitert werden: AllTheWeb (Fast), AltaVista, Google, HotBot, Netscape, Northern Light und Yahoo.
"Fernsehen" search on: All the Web - AltaVista - Google - HotBot - Netscape - Northern Light - Yahoo

Filtersuche
Als Befürworter des Open Source ("Alle Informationen müssen frei sein") bietet ODP beispielsweise auch eine große Auswahl von pornographischen Inhalten an. Hierbei werden diese Inhalte von der Handhabung wie andere Kategorien behandelt. Daher bietet die deutsche DMOZ-Seite eine Filterfunktion für alle solche Seiten an, wenn man bei der Suchfunktion auf der Hauptseite "nach Inhalten für Kinder und Jugendliche" anwählt.
Bei der Suche, wie beispielsweise dem Pharma-Hersteller "Essex Pharma GmbH" wird aber aus dem Kontext das Wort "sex" erkannt und somit auch das gefiltert.

Weitere Funktionen sind die Suche nach Inhalten nur für Webseiten mit deutschsprachigem Inhalt. Die Suchfunktion bietet auch die Möglichkeit nach Suche in beliebiger Sprache, wobei die Suche hier sich aus der internationale Suche von DMOZ.org aus nicht unterscheidet. Die internationale Seite DMOZ.org dagegen bietet die Filterfunktion, vor allem nach Inhalten für Kinder und Jugendliche nicht auf der Hauptseite an, sondern erst bei der advanced search Funktion nach einem weiteren Klick auf das Link.


Patente
Das Urheberecht für die Software Isearch, die die Suchfunktion bei ODP (s. Retrieval) nach dem Standard ISO 23950 regelt, wird von Etymon ® entwickelt und angeboten. Isearch ist ebenfalls nach Open Source Richtlinien programmiert und somit auch frei.
http://www.etymon.com/Isearch/
Da es sich bei Isearch um kein kommerzielles Produkt handelt, ist auch kein Patent zu diesem Produkt weder in Deutschland (DPMA), noch in anderen Ländern verfügbar. Als Wortmarke ist ebenfalls weder DMOZ, noch Open Directory Project (ODP) weltweit geschützt.

von Evrim Sen
www.evrim-sen.com

Arten von Websites



 Aktuelles

Newsletter



Der Webknowlede Newsletter informiert regelmäßig mehr als 4.000 Abonnenten über die aktuellsten Themen rund um Social Media und Web insgesamt. Ihre Daten werden nicht an Dritte weitergegeben und Sie können sich jederzeit vom Newsletter abmelden.

 >> zum Newsletter

Auf Augenhöhe mit den Unternehmen



Das CIO Spezial der Wirtschaftswoche veröffentlicht im Dezember ein Interview mit Prof. Dr. Matthias Fank über aktuelle Entwicklungen im Bereich Informationsmanagement

Kommunikations- manager



Die Zeitschrift Kommunikationsmanager, veröffentlicht in ihrer Dezemberausgabe 2007 den innovativen Ansatz Webknowldge von Prof. Dr. Matthias Fank und Dr. Wolfgang Riecke am Beispel von Ford.

Podiumsdiskussion



Am 10. Dezember 2007 nimmt Prof. Dr. Matthias Fank an dem Forum IT-Recht an der Universität Hannover als Wirtschaftsexperte zu dem Thema "Second life - Ist virtuell alles besser" teil.

Vortrag: User Generated Content



Am 4. Dezember 2007 referiert Prof. Dr. Matthias Fank auf der Tagung Mittelstandstage - Business meets IT unter dem Titel "User Generated Content oder Wer hat Angst vor Web 2.0"

Kommunikations- management



Prof. Dr. Matthias Fank und Dr. Wolfgang Riecke veröffentlichen in der 33 Auslieferung der Loseblat-Sammlung Kommunikations- management den Beitrag: Monitoring von Internet-Foren als Frühwarnsystem

PR Magazin



In seiner Oktober-Ausgabe veröffentliche das PR Mgazin einen Beitrag über den Ford Fanward

Kommunikations- management



In seiner 32. Auslieferung veröffentlichte die Loseblatt-Sammlung Kommunikations- management den Beitrag: Neue Wege der Öffentlichkeitsarbeit am Beispiel des Ford FanAward von Prof. Dr. Matthias Fank und Dr. Wolfgang Riecke.



Information, Wissenschaft & Praxis



Prof. Dr. Matthias Fank und Dr. Wolfgang Riecke veröffentlichen ihre Webknowledge-Erfahrungen in der Sonderausgabe zu Competitve Intelligence

eCommerce Magazin



10 Gründe gegen Second Life - diesen Beitrag von Prof. Dr. Matthias Fank veröffentlichte das eCommerce Magazin in seiner September Ausgabe.