-
Oberhauser, O.: Automatisches Klassifizieren und Bibliothekskataloge (2005)
0.01
0.008905906 = product of:
0.035623625 = sum of:
0.035623625 = weight(_text_:und in 5099) [ClassicSimilarity], result of:
0.035623625 = score(doc=5099,freq=4.0), product of:
0.14685147 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06621197 = queryNorm
0.24258271 = fieldWeight in 5099, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0546875 = fieldNorm(doc=5099)
0.25 = coord(1/4)
- Abstract
- In der bibliothekarischen Welt sind die Vorzüge einer klassifikatorischen Inhaltserschließung seit jeher wohlbekannt. Auch im Zeitalter der Online-Kataloge gibt es dafür keinen wirklichen Ersatz, da - kurz formuliert - ein stichwortbasiertes Retrieval alleine mit Problemen wie Ambiguität und Mehrsprachigkeit nicht fertig zu werden vermag. Zahlreiche Online-Kataloge weisen daher Notationen verschiedener Klassifikationssysteme auf; allerdings sind die darauf basierenden Abfragemöglichkeiten meist noch arg unterentwickelt. Viele Datensätze in OPACs sind aber überhaupt nicht sachlich erschlossen, sei es, dass sie aus retrospektiv konvertierten Nominalkatalogen stammen, sei es, dass ein Mangel an personellen Ressourcen ihre inhaltliche Erschließung verhindert hat. Angesichts großer Mengen solcher Datensätze liegt ein Interesse an automatischen Verfahren zur Sacherschließung durchaus nahe.
-
Reiner, U.: Automatische DDC-Klassifizierung bibliografischer Titeldatensätze der Deutschen Nationalbibliografie (2009)
0.01
0.008814561 = product of:
0.035258245 = sum of:
0.035258245 = weight(_text_:und in 271) [ClassicSimilarity], result of:
0.035258245 = score(doc=271,freq=12.0), product of:
0.14685147 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06621197 = queryNorm
0.24009462 = fieldWeight in 271, product of:
3.4641016 = tf(freq=12.0), with freq of:
12.0 = termFreq=12.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.03125 = fieldNorm(doc=271)
0.25 = coord(1/4)
- Abstract
- Das Klassifizieren von Objekten (z. B. Fauna, Flora, Texte) ist ein Verfahren, das auf menschlicher Intelligenz basiert. In der Informatik - insbesondere im Gebiet der Künstlichen Intelligenz (KI) - wird u. a. untersucht, inweit Verfahren, die menschliche Intelligenz benötigen, automatisiert werden können. Hierbei hat sich herausgestellt, dass die Lösung von Alltagsproblemen eine größere Herausforderung darstellt, als die Lösung von Spezialproblemen, wie z. B. das Erstellen eines Schachcomputers. So ist "Rybka" der seit Juni 2007 amtierende Computerschach-Weltmeistern. Inwieweit Alltagsprobleme mit Methoden der Künstlichen Intelligenz gelöst werden können, ist eine - für den allgemeinen Fall - noch offene Frage. Beim Lösen von Alltagsproblemen spielt die Verarbeitung der natürlichen Sprache, wie z. B. das Verstehen, eine wesentliche Rolle. Den "gesunden Menschenverstand" als Maschine (in der Cyc-Wissensbasis in Form von Fakten und Regeln) zu realisieren, ist Lenat's Ziel seit 1984. Bezüglich des KI-Paradeprojektes "Cyc" gibt es CycOptimisten und Cyc-Pessimisten. Das Verstehen der natürlichen Sprache (z. B. Werktitel, Zusammenfassung, Vorwort, Inhalt) ist auch beim intellektuellen Klassifizieren von bibliografischen Titeldatensätzen oder Netzpublikationen notwendig, um diese Textobjekte korrekt klassifizieren zu können. Seit dem Jahr 2007 werden von der Deutschen Nationalbibliothek nahezu alle Veröffentlichungen mit der Dewey Dezimalklassifikation (DDC) intellektuell klassifiziert.
Die Menge der zu klassifizierenden Veröffentlichungen steigt spätestens seit der Existenz des World Wide Web schneller an, als sie intellektuell sachlich erschlossen werden kann. Daher werden Verfahren gesucht, um die Klassifizierung von Textobjekten zu automatisieren oder die intellektuelle Klassifizierung zumindest zu unterstützen. Seit 1968 gibt es Verfahren zur automatischen Dokumentenklassifizierung (Information Retrieval, kurz: IR) und seit 1992 zur automatischen Textklassifizierung (ATC: Automated Text Categorization). Seit immer mehr digitale Objekte im World Wide Web zur Verfügung stehen, haben Arbeiten zur automatischen Textklassifizierung seit ca. 1998 verstärkt zugenommen. Dazu gehören seit 1996 auch Arbeiten zur automatischen DDC-Klassifizierung bzw. RVK-Klassifizierung von bibliografischen Titeldatensätzen und Volltextdokumenten. Bei den Entwicklungen handelt es sich unseres Wissens bislang um experimentelle und keine im ständigen Betrieb befindlichen Systeme. Auch das VZG-Projekt Colibri/DDC ist seit 2006 u. a. mit der automatischen DDC-Klassifizierung befasst. Die diesbezüglichen Untersuchungen und Entwicklungen dienen zur Beantwortung der Forschungsfrage: "Ist es möglich, eine inhaltlich stimmige DDC-Titelklassifikation aller GVK-PLUS-Titeldatensätze automatisch zu erzielen?"
-
Fangmeyer, H.; Gloden, R.: Bewertung und Vergleich von Klassifikationsergebnissen bei automatischen Verfahren (1978)
0.01
0.007197059 = product of:
0.028788237 = sum of:
0.028788237 = weight(_text_:und in 149) [ClassicSimilarity], result of:
0.028788237 = score(doc=149,freq=2.0), product of:
0.14685147 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06621197 = queryNorm
0.19603643 = fieldWeight in 149, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=149)
0.25 = coord(1/4)
-
Bollmann, P.; Konrad, E.; Schneider, H.-J.; Zuse, H.: Anwendung automatischer Klassifikationsverfahren mit dem System FAKYR (1978)
0.01
0.007197059 = product of:
0.028788237 = sum of:
0.028788237 = weight(_text_:und in 150) [ClassicSimilarity], result of:
0.028788237 = score(doc=150,freq=2.0), product of:
0.14685147 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06621197 = queryNorm
0.19603643 = fieldWeight in 150, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=150)
0.25 = coord(1/4)
- Abstract
- Es wird ein Verfahren zum Vergelich von Klassifikationen vorgestellt. Es gestattet, die Abweichungen zwischen zwei Klassifikationen zu lokalisieren und erleichtert so die intellektuelle Kontrolle. Das Verfahren ist als Baustein des Systems FAKYR implementiert. Es wird auf Klassifikationen angeandt, die durch graphentheoretische Verfahren entstanden sind. Zunächst wird gezeigt, wie die Veränderung des Schnittes das Klassifikationsergebnis beeinflußt, anschließend wird das Vergleichsverfahren bei der automatischen Erstellung zweisprachiger Termklassen benutzt
-
Krauth, J.: Evaluation von Verfahren der automatischen Klassifikation (1983)
0.01
0.007197059 = product of:
0.028788237 = sum of:
0.028788237 = weight(_text_:und in 111) [ClassicSimilarity], result of:
0.028788237 = score(doc=111,freq=2.0), product of:
0.14685147 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06621197 = queryNorm
0.19603643 = fieldWeight in 111, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=111)
0.25 = coord(1/4)
- Abstract
- Ein wichtiges Problem der automatischen Klassifikation ist die Frage der Bewertung der Ergebnisse von Klassifikationsverfahren. Hierunter fallen die Aspekte der Beurteilung der Güte von Klassifikationen, des Vergleichs von Klassifikationen, der Validität von Klassifikationen und der Stabilität von Klassifikationsverfahren. Es wird ein Überblick über die verschiedenen Ansätze gegeben
-
Chan, L.M.; Lin, X.; Zeng, M.: Structural and multilingual approaches to subject access on the Web (1999)
0.01
0.007197059 = product of:
0.028788237 = sum of:
0.028788237 = weight(_text_:und in 162) [ClassicSimilarity], result of:
0.028788237 = score(doc=162,freq=2.0), product of:
0.14685147 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06621197 = queryNorm
0.19603643 = fieldWeight in 162, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=162)
0.25 = coord(1/4)
- Abstract
- Zu den großen Herausforderungen einer sinnvollen Suche im WWW gehören die riesige Menge des Verfügbaren und die Sparchbarrieren. Verfahren, die die Web-Ressourcen im Hinblick auf ein effizienteres Retrieval inhaltlich strukturieren, werden daher ebenso dringend benötigt wie Programme, die mit der Sprachvielfalt umgehen können. Im folgenden Vortrag werden wir einige Ansätze diskutieren, die zur Bewältigung der beiden Probleme derzeit unternommen werden
-
Zhang, X: Rough set theory based automatic text categorization (2005)
0.01
0.007197059 = product of:
0.028788237 = sum of:
0.028788237 = weight(_text_:und in 3822) [ClassicSimilarity], result of:
0.028788237 = score(doc=3822,freq=2.0), product of:
0.14685147 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06621197 = queryNorm
0.19603643 = fieldWeight in 3822, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=3822)
0.25 = coord(1/4)
- Abstract
- Der Forschungsbericht "Rough Set Theory Based Automatic Text Categorization and the Handling of Semantic Heterogeneity" von Xueying Zhang ist in Buchform auf Englisch erschienen. Zhang hat in ihrer Arbeit ein Verfahren basierend auf der Rough Set Theory entwickelt, das Beziehungen zwischen Schlagwörtern verschiedener Vokabulare herstellt. Sie war von 2003 bis 2005 Mitarbeiterin des IZ und ist seit Oktober 2005 Associate Professor an der Nanjing University of Science and Technology.
-
Lindholm, J.; Schönthal, T.; Jansson , K.: Experiences of harvesting Web resources in engineering using automatic classification (2003)
0.01
0.007197059 = product of:
0.028788237 = sum of:
0.028788237 = weight(_text_:und in 5088) [ClassicSimilarity], result of:
0.028788237 = score(doc=5088,freq=2.0), product of:
0.14685147 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06621197 = queryNorm
0.19603643 = fieldWeight in 5088, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=5088)
0.25 = coord(1/4)
- Footnote
- Auch unter: http://www.ariadne.ac.uk/issue37/lindholm/ und http://engine-e.lub.lu.se/