-
Lohmann, H.: KASCADE: Dokumentanreicherung und automatische Inhaltserschließung : Projektbericht und Ergebnisse des Retrievaltests (2000)
0.01
0.011004804 = product of:
0.044019215 = sum of:
0.044019215 = weight(_text_:und in 1494) [ClassicSimilarity], result of:
0.044019215 = score(doc=1494,freq=22.0), product of:
0.15475015 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06977331 = queryNorm
0.28445345 = fieldWeight in 1494, product of:
4.690416 = tf(freq=22.0), with freq of:
22.0 = termFreq=22.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.02734375 = fieldNorm(doc=1494)
0.25 = coord(1/4)
- Abstract
- Der Test hat gezeigt, dass die Ergänzung der bibliothekarischen Titelaufnahme um zusätzliche inhaltsrelevante Daten zu einer beeindruckenden Verbesserung der Suchergebnisse führt. Die Dokumentanreicherung sollte daher als Ziel bibliothekarischer Bemühungen um eine Verbesserung des OPAC-Retrievals weiterverfolgt werden. Der im Projekt eingeschlagene Weg, die Inhaltsverzeichnisse zu scannen, erwies sich allerdings als wenig sinnvoll. Zwar erzielte das Scanningverfahren gute Ergebnisse, auch arbeitete die Texterkennungssoftware sehr zuverlässig. Das Scanning bietet darüber hinaus die Möglichkeit, die dabei angefertigte Grafik-Datei mit dem Titelsatz im OPAC zu verknüpfen und so dem Nutzer als Entscheidungshilfe bei der Ergebnismengenbeurteilung an die Hand zu geben. Die Arbeiten am Aufbau der Testdatenbank brachten aber die Erkenntnis, dass die Anreicherung im Wege des Scanning technisch außerordentlich problematisch ist und einen nicht vorauszusehenden und letztlich auch nicht zu rechtfertigenden Aufwand erfordert. Diese Methode der Anreicherung kann daher für einen Praxiseinsatz nicht empfohlen werden.
Abgesehen von diesen Überlegungen müssten für einen praktischen Einsatz der KASCADE-Entwicklungen weitere Voraussetzungen geschaffen werden. Erforderlich wäre zunächst die Optimierung und Rationalisierung der Verfahrensabläufe selbst. Die Teilprogramme unter KasKoll sollten in ein kompaktes Programm integriert werden. Die Sortiervorgänge könnten vereinfacht werden, indem die Deskriptoren in eine relationale Datenbank überführt werden. Letztendlich wirken sich diese Punkte aber vor allem auf die Dauer der Maschinenlaufzeiten aus, die bei der Frage nach den Implementierungskosten letztlich nur eine untergeordnete Rolle spielen. Optimiert werden sollte die Oberfläche zur Steuerung des Verfahrens. Bereits jetzt laufen einige der Programme unter einer menügeführten Windows-Schnittstelle (Kasadew) ab, was für alle Verfahrensteile erreicht werden sollte. Schließlich ist zu klären, unter welchen Bedingungen das Gewichtungsverfahren im Praxisbetrieb ablaufen kann.
Da sich mit jedem Dokument, das zu dem im Gewichtungsverfahren befindlichen Gesamtbestand hinzukommt, die Werte aller bereits gewichteten Deskriptoren ändern können, müsste die Berechnung der Häufigkeitsverteilung jeder Grundform im Prinzip nach jeder Änderung im Dokumentbestand neu berechnet werden. Eine Online-Aktualisierung des Bestandes erscheint daher wenig sinnvoll. In der Praxis könnte eine Neuberechnung in bestimmten zeitlichen Abständen mit einem Abzug des OPAC-Bestandes unabhängig vom eigentlichen Betrieb des OPAC erfolgen, was auch insofern genügen würde, als die zugrunde liegenden Maße auf relativen Häufigkeiten basieren. Dadurch würde nur ein geringer Verzug in der Bereitstellung der aktuellen Gewichte eintreten. Außerdem würde der Zeitfaktor eine nur untergeordnete Rolle spielen, da ein offline ablaufender Gewichtungslauf erst bis zum nächsten Aktualisierungszeitpunkt abgeschlossen sein müsste. Denkbar wäre zusätzlich, für die Zeit zwischen zwei Aktualisierungen des OPACs für die in den Neuzugängen enthaltenen Begriffe Standardgewichte einzusetzen, soweit diese Begriffe bereits in dem Bestand auftreten. Bei entsprechender Optimierung und Rationalisierung der SELIX-Verfahrensabläufe, Nutzung der Gewichte auf der Retrievalseite für ein Ranking der auszugebenden Dokumente und Integration der THEAS-Komponente kann das Verfahren zu einem wirkungsvollen Instrument zur Verbesserung der Retrievaleffektivität weiterentwickelt werden.
- Footnote
- Zugl.: Köln, Fachhochsch., Fachbereich Bibliotheks- und Informationswesen, Hausarbeit
- Imprint
- Düsseldorf : Universitäts- und Landesbibliothek
- Series
- Schriften der Universitäts- und Landesbibliothek Düsseldorf; 31
-
Gugerli, D.: Suchmaschinen : die Welt als Datenbank (2009)
0.01
0.010725632 = product of:
0.04290253 = sum of:
0.04290253 = weight(_text_:und in 2160) [ClassicSimilarity], result of:
0.04290253 = score(doc=2160,freq=16.0), product of:
0.15475015 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06977331 = queryNorm
0.2772374 = fieldWeight in 2160, product of:
4.0 = tf(freq=16.0), with freq of:
16.0 = termFreq=16.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.03125 = fieldNorm(doc=2160)
0.25 = coord(1/4)
- Abstract
- Plötzlich diese Übersicht. Milliarden von Seiten, in Sekundenbruchteilen durchsucht, als Trefferliste sauber angezeigt, mit der größten Selbstverständlichkeit sortiert nach Rang und Namen. Google bestimmt die Routinen des Alltags und ist dennoch nicht die Suchmaschine schlechthin. Auch außerhalb des World Wide Web gibt es zahllose, technisch hochgerüstete Prozeduren des Suchens. Die gegenwärtige Selbstverständlichkeit der einen Suchmaschine läßt leicht übersehen, daß Suchmaschinen einen Interessenkonflikt induzieren zwischen jenen, die sie einsetzen wollen, und jenen, auf die sie angesetzt werden. Ihr prekärer Status im Spannungsfeld zwischen Übersicht und Überwachung wird verdrängt. Anhand von vier Fallstudien zeigt David Gugerli die Entwicklung der Suchmaschine auf, von den frühen Fernseh-Ratespielen, von Robert Lembkes Unterhaltungsshow »Was bin ich?«, über Eduard Zimmermanns Fahndungssendung »Aktenzeichen XY« und Horst Herolds »Kybernetik der Polizei« bis zu der von Ted Codd ausgehenden Entwicklung der relationalen Datenbank. Während Lembke auf die Feststellung von Normalität ausgerichtet war, suchte Zimmermann die Devianz, Herold die Muster und Codd die allgemeingültige Such- und Abfragesprache für in Form gebrachte Wissensbestände, die man seit Mitte der sechziger Jahre Datenbanken nennt. »Die Geschichte der Suchmaschine ist eine eminent politische. Mit Suchmaschinen lassen sich Hoffnungen auf Fundamentaldemokratisierung und informationelle Emanzipation ebenso verbinden wie Horrorvisionen eines Orwellschen Überwachungsstaats, der über ein technokratisches Wissensmonopol verfügt.«
-
Modern information retrieval (1999)
0.01
0.009384928 = product of:
0.037539713 = sum of:
0.037539713 = weight(_text_:und in 1852) [ClassicSimilarity], result of:
0.037539713 = score(doc=1852,freq=4.0), product of:
0.15475015 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06977331 = queryNorm
0.24258271 = fieldWeight in 1852, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0546875 = fieldNorm(doc=1852)
0.25 = coord(1/4)
- Content
- "This book is a comprehensive presentation of information retrieval from a computer science point of view" - "Trotz der genannten Kritik kann der Band insgesamt empfohlen werden. Für die Lehre muss die Dimension der Benutzerorientierung allerdings von Anfang an durch weitere Texte abgedeckt werden. Für Praktiker kann das Buch mit seinem Glossar und Index auch als Nachschlgewerk diesen. Das umfangreiche Literaturverzeichnis und Hinweise auf Forschungsthemen mit Referenzen am Ende jedes Kapitels bieten für alle Themen die Möglichkeit zur Vertiefung
-
Morville, P.: Ambient findability : what we find changes who we become (2005)
0.01
0.0075841667 = product of:
0.030336667 = sum of:
0.030336667 = weight(_text_:und in 1312) [ClassicSimilarity], result of:
0.030336667 = score(doc=1312,freq=32.0), product of:
0.15475015 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06977331 = queryNorm
0.19603643 = fieldWeight in 1312, product of:
5.656854 = tf(freq=32.0), with freq of:
32.0 = termFreq=32.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.015625 = fieldNorm(doc=1312)
0.25 = coord(1/4)
- Footnote
- Rez. in: nfd - Information Wissenschaft und Praxis 57(2006) H.3, S.177-178 (D. Lewandowski): "Wohl unbestritten ist, dass die Suche in Informationsbeständen eine immer größere Bedeutung erhält. Wir suchen nicht nur noch explizit, indem wir ein Informationssystem anwählen und dort eine Suche absetzen, sondern verwenden Suchfunktionen innerhalb von Programmen, auf Websites, innerhalb des Betriebssystems unseres Computers oder sogar ziemlich unbewusst, indem wir Informationen maßgeschneidert aufgrund einer einmal hinterlegten Suche oder eines automatisch erstellten Suchprofils erhalten. Man kann also in der Tat davon sprechen, dass wir von der Suche umgeben werden. Das ist mit dem Konzept der "Ambient Findability" gemeint. Angelehnt ist diese Bezeichnung an den Begriff der "Ambient Music" (in den 70er Jahren durch Brian Eno geprägt), die den Hörer umgibt und von ihm oft gar nicht aktiv wahrgenommen wird. Um eine Vorstellung von dieser Musik zu bekommen, eignet sich vielleicht am besten der Titel einer Platte eben von Brian Eno: "Music for Airports". Peter Morville, bekannt als Co-Autor des empfehlenswerten Buchs "Information Architecture for the World Wide Web"', hat sich nun mit der Veränderung der Suche auseinandergesetzt. Sein Buch bedient sich in ganz unterschiedlichen Disziplinen, um die Prozesse des Suchens, Stöberns und Findens aufzuzeigen. So finden sich Betrachtungen über die Orientierung des Menschen in unbekannten Umgebungen, über die Interaktion mit Informationssystemen, über das soziale Verhalten der Web-Nutzer (Stichworte: Content-Tagging, Folksonomies, Social Networking) und über technische Veränderungen durch die Verfügbarkeit von Informationssystemen in allen Lebenskontexten, vor allem auch über mobile Endgeräte. Das Buch ist in sieben Kapitel gegliedert. Das erste, "Lost and Found" betitelt, bietet auf wenigen Seiten die Definitionen der zentralen Begriffe ambient und findability, erläutert kurz das Konzept der Information Literacy und zeigt, dass die bessere Auffindbarkeit von Informationen nicht nur ein schöner Zusatznutzen ist, sondern sich für Unternehmen deutlich auszahlt.
Das zweite Kapitel ("A Brief History of Wayfinding") beschreibt, wie Menschen sich in Umgebungen zurechtfinden. Dies ist insofern interessant, als hier nicht erst bei Informationssystemen oder dem WWW begonnen wird, sondern allgemeine Erkenntnisse beispielsweise über die Orientierung in natürlichen Umgebungen präsentiert werden. Viele typische Verhaltensweisen der Nutzer von Informationssystemen können so erklärt werden. So interessant dieses Thema allerdings ist, wirkt das Kapitel leider doch nur wie eine Zusammenstellung von Informationen aus zweiter Hand. Offensichtlich ist, dass Morville nicht selbst an diesen Themen geforscht hat, sondern die Ergebnisse (wenn auch auf ansprechende Weise) zusammengeschrieben hat. Dieser Eindruck bestätigt sich auch in weiteren Kapiteln: Ein flüssig geschriebener Text, der es jedoch an einigen Stellen an Substanz fehlen lässt. Kapitel drei, "Information Interaction" beginnt mit einem Rückgriff auf Calvin Mooers zentrale Aussage aus dem Jahre 1959: "An information retrieval system will tend not to be used whenever it is more painful and troublesome for a customer to have information than for him not to have it." In der Tat sollte man sich dies bei der Erstellung von Informationssystemen immer vergegenwärtigen; die Reihe der Systeme, die gerade an dieser Hürde gescheitert sind, ist lang. Das weitere Kapitel führt in einige zentrale Konzepte der Informationswissenschaft (Definition des Begriffs Information, Erläuterung des Information Retrieval, Wissensrepräsentation, Information Seeking Behaviour) ein, allerdings ohne jeden Anspruch auf Vollständigkeit. Es wirkt vielmehr so, dass der Autor sich die gerade für sein Anliegen passenden Konzepte auswählt und konkurrierende Ansätze beiseite lässt. Nur ein Beispiel: Im Abschnitt "Information Interaction" wird relativ ausführlich das Konzept des Berrypicking nach Marcia J. Bates präsentiert, allerdings wird es geradezu als exklusiv verkauft, was es natürlich bei weitem nicht ist. Natürlich kann es nicht Aufgabe dieses Buchs sein, einen vollständigen Überblick über alle Theorien des menschlichen Suchverhaltens zu geben (dies ist an anderer Stelle vorbildlich geleistet worden'), aber doch wenigstens der Hinweis auf einige zentrale Ansätze wäre angebracht gewesen. Spätestens in diesem Kapitel wird klar, dass das Buch sich definitiv nicht an Informationswissenschaftler wendet, die auf der einen Seite mit den grundlegenden Themen vertraut sein dürften, andererseits ein wenig mehr Tiefgang erwarten würden. Also stellt sich die Frage - und diese ist zentral für die Bewertung des gesamten Werks.
Für wen wurde dieses Buch eigentlich geschrieben? Der Verlag, sonst für eher praktisch orientierte Computerbücher bekannt, ordnet es auf dem Umschlag den Bereichen "Marketing" sowie "Technology & Society" zu. Für letztere Zielgruppe ist es aber sicher weniger geeignet, da auch der gesellschaftliche Hintergrund zu dünn ist. So bleibt der Bereich Marketing oder doch eher die Zielgruppe derjenigen, die ohne fachbezogenes Studium in den Bereich Informationssysteme bzw. Informationsarchitektur "hineingeschlittert" sind. Für diese mag auch das Kapitel über "Information Interaction" (bedingt) geeignet sein, bietet es doch zumindest einen gut lesbaren Einblick in einige zentrale Punkte. Das vierte Kapitel ("Intertwingled") beschreibt den Zugriff auf Informationen mittels verschiedener Erdgeräte in unterschiedlichen Kontexten. Es geht hier neben neuen Ansätzen des Wegefindens, um lokalisierbare Objekte und Kleidung, in die Informationstechnologie mit eingebaut ist. Dabei handelt es sich um einen guten (und vor allem beispielreichen) Überblick der aufkommenden Technologien. Kapitel s behandelt die Integration von Push- und PullAnsätzen, wobei die zentrale Aussage lautet, dass beide Ansätze immer mehr zusammenwachsen und die Entscheidung für den einen oder den anderen Ansatz vom Nutzer spontan gemäß seinen Informationsbedürfnissen getroffen wird. In diesem Kapitel wird auch das Thema Personalisierung abgehandelt und auf die bei der Personalisierung entstehenden Probleme eingegangen. Lange Zeit wurde Personalisierung schlicht als ein Verfahren gesehen, aus einmal erfassten Nutzerdaten Empfehlungen abzuleiten. Dass dies nicht problemlos möglich ist, erläutert Morville an einigen Punkten. Etwas bedauerlich ist hier, dass die Erläuterungen sehr knapp gehalten sind. Gerade zu diesem interessanten Thema hätte man gerne mehr Details erfahren.
Im Kapitel über das "Sociosemantic Web" werden die groben Grundzüge der Klassifikationslehre erläutert, um dann ausführlich auf neuere Ansätze der Web-Erschließung wie Social Tagging und Folksonomies einzugehen. Auch dieses Kapitel gibt eher einen Überblick als den schon Kundigen vertiefende Informationen zu liefern. Das letzte Kapitel widmet sich schließlich der Art, wie Entscheidungen getroffen werden, der Network Culture, dem Information Overload, um schließlich zu den "Inspired Decisions" zu gelangen - Entscheidungen, die sowohl auf "sachlichen Informationen" (also den klassischen Zutaten der "informed decisions") als auch aus aus Netzwerken stammenden Informationen wie etwa Empfehlungen durch Freunde oder Community-Mitglieder irgendeiner Art gewonnen werden. Fasst man zusammen, so ist an Morvilles Text besonders bemerkenswert, dass nach einigen Jahren, in denen die Suche im Web als ein Problem der Suche in unstrukturierten Daten angesehen wurde, nun wieder verstärkt Erschließungsansätze, die auf klassische Erschließungsinstrumente zurückgreifen, propagiert werden. Zwar sollen sie nicht in ihrer ursprünglichen Form angewandt werden, da den Nutzern nicht zuzumuten ist, sich mit den entsprechenden Regeln auseinanderzusetzen, aber auch hinter der auf den ersten Blick zumindest chaotisch wirkenden Folksonomy ist das Prinzip der Klassifikation zu erkennen. Um die modernen Ansätze erfolgreich zu machen, bedarf es aber dringend Information Professionals, die das "beste aus beiden Welten" verbinden, um moderne, für den Nutzer optimale Informationssysteme zu schaffen. Für die Gesamtbewertung des Buchs gelten die bereits zu einzelnen Kapitels angeführten Kritikpunkte: In erster Linie bleibt das Buch zu sehr an der Oberfläche und wirkt irgendwie "zusammengeschrieben" anstatt als Ergebnis der tiefgreifenden Beschäftigung mit dem Thema. Als eine Einführung in aufkommende Technologien rund um die Suche ist es aber durchaus geeignet - gut lesbar ist der Text auf jeden Fall.
-
Rogers, R.: Digital methods (2013)
0.01
0.0075841667 = product of:
0.030336667 = sum of:
0.030336667 = weight(_text_:und in 3354) [ClassicSimilarity], result of:
0.030336667 = score(doc=3354,freq=8.0), product of:
0.15475015 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06977331 = queryNorm
0.19603643 = fieldWeight in 3354, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.03125 = fieldNorm(doc=3354)
0.25 = coord(1/4)
- BK
- 54.08 Informatik in Beziehung zu Mensch und Gesellschaft
- Classification
- 54.08 Informatik in Beziehung zu Mensch und Gesellschaft
- RSWK
- Informations- und Dokumentationswissenschaft / Internet / Methodologie
- Subject
- Informations- und Dokumentationswissenschaft / Internet / Methodologie
-
Arafat, S.; Ashoori, E.: Search foundations : toward a science of technology-mediated experience (2018)
0.01
0.0075841667 = product of:
0.030336667 = sum of:
0.030336667 = weight(_text_:und in 1159) [ClassicSimilarity], result of:
0.030336667 = score(doc=1159,freq=8.0), product of:
0.15475015 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06977331 = queryNorm
0.19603643 = fieldWeight in 1159, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.03125 = fieldNorm(doc=1159)
0.25 = coord(1/4)
- Classification
- AN 96000: Allgemeines / Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft
- RSWK
- Informationsverhalten / Informations- und Dokumentationswissenschaft
- RVK
- AN 96000: Allgemeines / Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft
- Subject
- Informationsverhalten / Informations- und Dokumentationswissenschaft