Warum katalogisieren schwierig ist
Ein guter Katalog enthält für jedes Bild alle denkbaren Stichwörter; Computerprogramme können (noch) nicht denken. Während des Katalogisierens in der Gegenwart vergebe ich Metadaten, nach denen ich zukünftig voraussichtlich suchen werde.
Welche Stichwörter aufnehmen?
Ich bin ein Hobbyfotograf und will nicht viel Zeit investieren ins Katalogisieren. Vorläufig ordne ich einem Bild nur Stichwörter zu, die im Augenblick für mich interessant sind. Ich kann mich einigermaßen gut an meine Bilder erinnern und notfalls kann ich mir vom Computerprogramm die Vorschauen aller Bilder anzeigen lassen, durch die ich recht schnell ein gesuchtes Bild finde.
Kategorie von Stichwort abgrenzen
Wann ist ein Begriff Stichwort, wann Kategorie? Je allgemeiner ein Begriff, desto eher ist er Kategorie. Stichwörter sind speziell. Bäume
sind eine Kategorie, Birke
ein Stichwort, Menschen
eine Kategorie, Birgit
ein Stichwort.
Ich vergebe jedem Bild anstelle Kategorien Stichwörter. Jeder Hierarchie-Knoten und das Blatt ist ein Stichwort. Der Knoten ("Landschaften") und das Blatt ("Berge") der Kategorie Landschaften > Berge
sind Stichwörter, ich gebe sie in der Einzahl in den Computer ein: Landschaft, Berg
.
Habe ich ein Bild in Prag fotografiert und es ist ein "Stadtbild", passt es zur Kategorie Städte > Prag
(Stichwörter: Stadt, Prag
). Ist darauf ein Turm vor Abendhimmel zu sehen, passen auch die Kategorien Türme
und Abendstimmungen
(Stichwörter: Turm
, Abendstimmung
). Ein Foto von einem Freund in Prag fällt vielleicht nicht in die Kategorie Städte > Prag
. Alle Prag-Bilder könnten zusätzlich der Kategorie Reisen
zugeordnet werden.
Beschränkte Computerprogramme
Was kann ein Bildarchiv-Computerprogramm nicht? Die folgenden Aussagen mögen nicht auf jedes Programm zutreffen.
Es findet keine Assoziationen: Habe ich als Stichwort Rose
eingegeben, findet es die Rose nicht über die Farbe. Suche ich nach Rot
, findet das Programm eine rote Rose nur, falls ich vorher dem Bild mit der Rose das Wort Rot
zuordnete. Man könnte einen persönlichen Assoziationskatalog erstellen. Daraus kann das Programm weitere Stichwörter vorschlagen, die für ein Bild übernommen werden können.
Man könnte einen Katalog erstellen, in dem Bilder mit bestimmten Stichwörtern oder Stichwort-Kombinationen automatisch einer Kategorie zugeordnet werden: Gibt man Pavian
ein, könnte das Bild automatisch der Kategorie Säugetiere > Primaten > Affen
zugeordnet werden. Das Problem ist: Nicht jedes Bild mit diesem Stichwort passt sinnvoll in diese Kategorie.
Alle Namen können eine Kategorie implizieren: Der Watzmann ist ein Berg
, Neuschwanenstein ein Schloss
und so weiter. Sucht man nach Schlössern, findet man Neuschwanenstein nur, falls das Bild mit Neuschwanenstein das Stichwort Schloss
hat oder der Kategorie Schlösser
zugeordnet ist.
Zurzeit muss man dem Bild viele Stichworte zuordnen, damit es gefunden wird bei Suchanfragen mit unterschiedlichen Wörtern, die passen. Es entsteht oft Redundanz, aber der Computer weiß nun einmal nicht, dass ein Bild mit Wolken auch ein Stück Himmel darstellt, dass ein Bild, fotografiert im Dezember, auf das Stichwort Winter
passen kann und der Mount Everest
ein Berg ist. Das Winterbild kann man durch eine Abfrage nach Datum finden, falls man daran denkt. Man kann aber kaum alle Berg- oder Gebäudenamen eingeben, falls man nach Bergen oder Gebäuden sucht. Wenig praktikabel ist, statt nach Kind
zu suchen, alle bekannten Personen über deren Geburtsdatum und Bild-Aufnahmezeitpunkt zu suchen, zum Beispiel falls Siegfried
1990 geboren wurde, nach Siegfried
und Jahr kleiner 2003
.
Wörter können vielfältig von ihrer Grundform abgewandelt werden (Konjugation, Deklination). Wer will, kann im Wortschatz Deutsch ein Wort eingeben und sich die verschiedenen Formen anschauen; oft sind es mehr, als man denkt, zum Beispiel sind 28 Formen für "gehen" aufgelistet. Es ist möglich, mir aber unbekannt, dass ein Computer jedes Stichwort zusätzlich in seiner Grundform abspeichert (Geschwindigkeit), und Suchwörter in die Grundform umwandelt. So müsste nicht der Sucher die Arbeit leisten, nach Auto
oder Autos
bzw. Auto*
zu suchen. Alternativ könnte das Programm alle Wörter nur in der Grundform abspeichern und bei jeder Suche die Suchbegriffe intern in die Grundform umwandeln.
Für viele Wörter gibt es Synonyme oder Abkürzungen, auch in der Umgangssprache. Wortschatz Deutsch liefert für Auto
:
Automobil, Fahrzeug, Gefährt, Kraftfahrzeug, Kraftwagen, PKW, Personenkraftwagen, Vehikel, Wagen, Karre, Schlitten, Vehikel, Wagen
.
Des weiteren kann ein Suchwort in einem zusammengesetzten Wort vorkommen. Hier, was Wortschatz Deutsch ausgibt für Auto
:
Fluchtauto, Polizeiauto, Elektroauto, Rennauto, Feuerwehrauto, Stattauto, Familienauto, Ersatzauto, Luxusauto, Privatauto, Traumauto, Stadtauto, Dreiliterauto, Mietauto, Müllauto, Kultauto, Spielzeugauto, Weltauto, Postauto, Serienauto, Unfallauto, Wunschauto, Dienstauto, Altauto, Personenauto, Siegerauto, Tretauto, Sparauto, Mittelklasseauto, Modellauto, Importauto, Lastauto, Lieblingsauto, Vorjahresauto, Kompaktauto, Erdgasauto, Wasserstoffauto, Schrottauto, Zweitauto, Hybridauto, Mondauto, Miniauto, Spaßauto, Brennstoffzellenauto, Westauto, Wunderauto, Kleinauto, Firmenauto, Testauto, Leihauto, Billigauto
.
Die zusammengesetzten Wörter vervielfachen sich mit der Synonymanzahl, zum Beispiel kann ich statt Leihauto auch Leihwagen sagen. Leihwagen könnte auch in der Mehrzahl als Leihwägen (süddeutsch) vorkommen.
Schreibfehler und die Rechtschreibreform sorgen für weitere Probleme. Das Computerprogramm sollte während des Katalogisierens alle bekannten Stichwörter in einer Liste anbieten und eine Ersatzfunktion, mit der zum Beispiel Faß ersetzt werden kann durch Fass. Oder es führt einen Katalog mit beiden Schreibweisen und bezieht diesen bei Suchen mit ein. Schreibfehler könnten beim Eingeben durch ein Korrekturprogramm überprüft werden.
Wie sähe ein "ideales" Computerprogramm aus?
- Es prüft beim Eingeben die Rechtschreibung, damit keine Tippfehler in die Datenbank gelangen
- Es kennt die Grundform aller Wörter, wandelt Suchwörter in die Grundform um und findet alle Bilder, denen Stichwörter zugeordnet wurden, die von der Grundform abweichen
- Es kennt Synonyme und findet zu einem Suchbegriff alle Bilder, denen Synonym-Stichwörter zugeordnet sind
- Es erkennt zusammengesetzte Wörter und findet diese auch, falls nur ein Teilwort gesucht wird
- Es bietet an, Bilder mit bestimmten Stichwörtern einer Kategorie automatisch zuzuordnen
- Es hat einen definierbaren Assoziations-Katalog und schlägt daraus weitere Stichwörter vor
Auswege
Was hilft? Habe ich Vorschaubilder, brauche ich einem Bild nicht alle erdenklichen Stichwörter zuzuordnen, solange ich das Bildarchiv überschauen kann, d.h., es enthält nicht zehntausende von Bildern. Ohne Vorschaubilder ist ein Archiv für mich wenig sinnvoll, da ich keine Lust habe, Dateien extra zu öffnen, Dias oder Negative herauszusuchen. Ich ordne Bildern nur Stichwörter zu, die mich momentan interessieren und nutze alle mir bekannten Eingabe-Beschleunigungen, die das Archiv-Programm bietet. Das ist Thema des folgenden Abschnitts.
, 19.12.1999.
Letzte Bearbeitung: 25.12.2008.