-
Sieglerschmidt, J.: Convergence of internet services in the cultural heritage sector : the long way to common vocabularies, metadata formats, ontologies (2008)
0.11
0.106692165 = product of:
0.21338433 = sum of:
0.19142398 = weight(_text_:juli in 2686) [ClassicSimilarity], result of:
0.19142398 = score(doc=2686,freq=2.0), product of:
0.44098085 = queryWeight, product of:
6.548176 = idf(docFreq=172, maxDocs=44421)
0.06734408 = queryNorm
0.43408683 = fieldWeight in 2686, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
6.548176 = idf(docFreq=172, maxDocs=44421)
0.046875 = fieldNorm(doc=2686)
0.021960348 = weight(_text_:und in 2686) [ClassicSimilarity], result of:
0.021960348 = score(doc=2686,freq=2.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.14702731 = fieldWeight in 2686, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.046875 = fieldNorm(doc=2686)
0.5 = coord(2/4)
- Source
- Kompatibilität, Medien und Ethik in der Wissensorganisation - Compatibility, Media and Ethics in Knowledge Organization: Proceedings der 10. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation Wien, 3.-5. Juli 2006 - Proceedings of the 10th Conference of the German Section of the International Society of Knowledge Organization Vienna, 3-5 July 2006. Ed.: H.P. Ohly, S. Netscher u. K. Mitgutsch
-
Panzer, M.: Semantische Integration heterogener und unterschiedlichsprachiger Wissensorganisationssysteme : CrissCross und jenseits (2008)
0.11
0.105640516 = product of:
0.21128103 = sum of:
0.15951999 = weight(_text_:juli in 335) [ClassicSimilarity], result of:
0.15951999 = score(doc=335,freq=2.0), product of:
0.44098085 = queryWeight, product of:
6.548176 = idf(docFreq=172, maxDocs=44421)
0.06734408 = queryNorm
0.36173904 = fieldWeight in 335, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
6.548176 = idf(docFreq=172, maxDocs=44421)
0.0390625 = fieldNorm(doc=335)
0.051761042 = weight(_text_:und in 335) [ClassicSimilarity], result of:
0.051761042 = score(doc=335,freq=16.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.34654674 = fieldWeight in 335, product of:
4.0 = tf(freq=16.0), with freq of:
16.0 = termFreq=16.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0390625 = fieldNorm(doc=335)
0.5 = coord(2/4)
- Abstract
- Klassische bibliothekarische Indexierungswerkzeuge werden bis heute nur selten fürs Retrieval nutzbar gemacht; die Wichtigkeit, verschiedene dieser Vokabularien zu harmonisieren und integriert zu verwenden, ist noch immer keine Selbstverständlichkeit. Im Rahmen des DFG-Projektes "CrissCross" wird, ausgehend von der deutschen Ausgabe der Dewey-Dezimalklassifikation, eine Verknüpfung zwischen der DDC und der Schlagwortnormdatei (SWD) aufgebaut, um eine verbale Suche über klassifikatorisch erschlossene Bestände zu ermöglichen. Als Verbreiterung der Basis des verbalen Zugriffs wird außerdem das Mapping der amerikanischen LCSH und des französischen RAMEAU angestrebt. Nach einer kurzen Vorstellung von CrissCross und der Abgrenzung gegenüber ähnlichen Unterfangen werden Rückwirkungen semantischer Integration auf die verknüpften Vokabulare diskutiert. Wie müssen und können sich z.B. Thesauri verändern, wenn sie mit anderen (strukturheterologen) Systemen verknüpft sind? Dabei liegt ein Schwerpunkt der Analyse auf dem semantischen Verhältnis üblicher Mappingrelationen zu den verknüpften Begriffen (besonders im Hinblick auf Polysemie). Außerdem wird der Mehrwert fürs Retrieval auf der Basis solcher Wissensorganisationssysteme, z.B. durch automatisierten Zugriff über Ontologien, diskutiert.
- Source
- Kompatibilität, Medien und Ethik in der Wissensorganisation - Compatibility, Media and Ethics in Knowledge Organization: Proceedings der 10. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation Wien, 3.-5. Juli 2006 - Proceedings of the 10th Conference of the German Section of the International Society of Knowledge Organization Vienna, 3-5 July 2006. Ed.: H.P. Ohly, S. Netscher u. K. Mitgutsch
-
Effektive Information Retrieval Verfahren in Theorie und Praxis : ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005 (2006)
0.06
0.060254686 = product of:
0.12050937 = sum of:
0.063807994 = weight(_text_:juli in 973) [ClassicSimilarity], result of:
0.063807994 = score(doc=973,freq=2.0), product of:
0.44098085 = queryWeight, product of:
6.548176 = idf(docFreq=172, maxDocs=44421)
0.06734408 = queryNorm
0.14469561 = fieldWeight in 973, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
6.548176 = idf(docFreq=172, maxDocs=44421)
0.015625 = fieldNorm(doc=973)
0.05670138 = weight(_text_:und in 973) [ClassicSimilarity], result of:
0.05670138 = score(doc=973,freq=120.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.37962294 = fieldWeight in 973, product of:
10.954452 = tf(freq=120.0), with freq of:
120.0 = termFreq=120.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.015625 = fieldNorm(doc=973)
0.5 = coord(2/4)
- Abstract
- Information Retrieval hat sich zu einer Schlüsseltechnologie in der Wissensgesellschaft entwickelt. Die Anzahl der täglichen Anfragen an Internet-Suchmaschinen bildet nur einen Indikator für die große Bedeutung dieses Themas. Der Sammelbandband informiert über Themen wie Information Retrieval-Grundlagen, Retrieval Systeme, Digitale Bibliotheken, Evaluierung und Multilinguale Systeme, beschreibt Anwendungsszenarien und setzt sich mit neuen Herausforderungen an das Information Retrieval auseinander. Die Beiträge behandeln aktuelle Themen und neue Herausforderungen an das Information Retrieval. Die intensive Beteiligung der Informationswissenschaft der Universität Hildesheim am Cross Language Evaluation Forum (CLEF), einer europäischen Evaluierungsinitiative zur Erforschung mehrsprachiger Retrieval Systeme, berührt mehrere der Beiträge. Ebenso spielen Anwendungsszenarien und die Auseinandersetzung mit aktuellen und praktischen Fragestellungen eine große Rolle.
- Content
- Inhalt: Jan-Hendrik Scheufen: RECOIN: Modell offener Schnittstellen für Information-Retrieval-Systeme und -Komponenten Markus Nick, Klaus-Dieter Althoff: Designing Maintainable Experience-based Information Systems Gesine Quint, Steffen Weichert: Die benutzerzentrierte Entwicklung des Produkt- Retrieval-Systems EIKON der Blaupunkt GmbH Claus-Peter Klas, Sascha Kriewel, André Schaefer, Gudrun Fischer: Das DAFFODIL System - Strategische Literaturrecherche in Digitalen Bibliotheken Matthias Meiert: Entwicklung eines Modells zur Integration digitaler Dokumente in die Universitätsbibliothek Hildesheim Daniel Harbig, René Schneider: Ontology Learning im Rahmen von MyShelf Michael Kluck, Marco Winter: Topic-Entwicklung und Relevanzbewertung bei GIRT: ein Werkstattbericht Thomas Mandl: Neue Entwicklungen bei den Evaluierungsinitiativen im Information Retrieval Joachim Pfister: Clustering von Patent-Dokumenten am Beispiel der Datenbanken des Fachinformationszentrums Karlsruhe Ralph Kölle, Glenn Langemeier, Wolfgang Semar: Programmieren lernen in kollaborativen Lernumgebungen Olga Tartakovski, Margaryta Shramko: Implementierung eines Werkzeugs zur Sprachidentifikation in mono- und multilingualen Texten Nina Kummer: Indexierungstechniken für das japanische Retrieval Suriya Na Nhongkai, Hans-Joachim Bentz: Bilinguale Suche mittels Konzeptnetzen Robert Strötgen, Thomas Mandl, René Schneider: Entwicklung und Evaluierung eines Question Answering Systems im Rahmen des Cross Language Evaluation Forum (CLEF) Niels Jensen: Evaluierung von mehrsprachigem Web-Retrieval: Experimente mit dem EuroGOV-Korpus im Rahmen des Cross Language Evaluation Forum (CLEF)
- Footnote
- Rez. in: Information - Wissenschaft und Praxis 57(2006) H.5, S.290-291 (C. Schindler): "Weniger als ein Jahr nach dem "Vierten Hildesheimer Evaluierungs- und Retrievalworkshop" (HIER 2005) im Juli 2005 ist der dazugehörige Tagungsband erschienen. Eingeladen hatte die Hildesheimer Informationswissenschaft um ihre Forschungsergebnisse und die einiger externer Experten zum Thema Information Retrieval einem Fachpublikum zu präsentieren und zur Diskussion zu stellen. Unter dem Titel "Effektive Information Retrieval Verfahren in Theorie und Praxis" sind nahezu sämtliche Beiträge des Workshops in dem nun erschienenen, 15 Beiträge umfassenden Band gesammelt. Mit dem Schwerpunkt Information Retrieval (IR) wird ein Teilgebiet der Informationswissenschaft vorgestellt, das schon immer im Zentrum informationswissenschaftlicher Forschung steht. Ob durch den Leistungsanstieg von Prozessoren und Speichermedien, durch die Verbreitung des Internet über nationale Grenzen hinweg oder durch den stetigen Anstieg der Wissensproduktion, festzuhalten ist, dass in einer zunehmend wechselseitig vernetzten Welt die Orientierung und das Auffinden von Dokumenten in großen Wissensbeständen zu einer zentralen Herausforderung geworden sind. Aktuelle Verfahrensweisen zu diesem Thema, dem Information Retrieval, präsentiert der neue Band anhand von praxisbezogenen Projekten und theoretischen Diskussionen. Das Kernthema Information Retrieval wird in dem Sammelband in die Bereiche Retrieval-Systeme, Digitale Bibliothek, Evaluierung und Multilinguale Systeme untergliedert. Die Artikel der einzelnen Sektionen sind insgesamt recht heterogen und bieten daher keine Überschneidungen inhaltlicher Art. Jedoch ist eine vollkommene thematische Abdeckung der unterschiedlichen Bereiche ebenfalls nicht gegeben, was bei der Präsentation von Forschungsergebnissen eines Institutes und seiner Kooperationspartner auch nur bedingt erwartet werden kann. So lässt sich sowohl in der Gliederung als auch in den einzelnen Beiträgen eine thematische Verdichtung erkennen, die das spezielle Profil und die Besonderheit der Hildesheimer Informationswissenschaft im Feld des Information Retrieval wiedergibt. Teil davon ist die mehrsprachige und interdisziplinäre Ausrichtung, die die Schnittstellen zwischen Informationswissenschaft, Sprachwissenschaft und Informatik in ihrer praxisbezogenen und internationalen Forschung fokussiert.
Im ersten Kapitel "Retrieval-Systeme" werden verschiedene Information RetrievalSysteme präsentiert und Verfahren zu deren Gestaltung diskutiert. Jan-Hendrik Scheufen stellt das Meta-Framework RECOIN zur Information Retrieval Forschung vor, das sich durch eine flexible Handhabung unterschiedlichster Applikationen auszeichnet und dadurch eine zentrierte Protokollierung und Steuerung von Retrieval-Prozessen ermöglicht. Dieses Konzept eines offenen, komponentenbasierten Systems wurde in Form eines Plug-Ins für die javabasierte Open-Source-Plattform Eclipse realisiert. Markus Nick und Klaus-Dieter Althoff erläutern in ihrem Beitrag, der übrigens der einzige englischsprachige Text im Buch ist, das Verfahren DILLEBIS zur Erhaltung und Pflege (Maintenance) von erfahrungsbasierten Informationssystemen. Sie bezeichnen dieses Verfahren als Maintainable Experience-based Information System und plädieren für eine Ausrichtung von erfahrungsbasierten Systemen entsprechend diesem Modell. Gesine Quint und Steffen Weichert stellen dagegen in ihrem Beitrag die benutzerzentrierte Entwicklung des Produkt-Retrieval-Systems EIKON vor, das in Kooperation mit der Blaupunkt GmbH realisiert wurde. In einem iterativen Designzyklus erfolgte die Gestaltung von gruppenspezifischen Interaktionsmöglichkeiten für ein Car-Multimedia-Zubehör-System. Im zweiten Kapitel setzen sich mehrere Autoren dezidierter mit dem Anwendungsgebiet "Digitale Bibliothek" auseinander. Claus-Peter Klas, Sascha Kriewel, Andre Schaefer und Gudrun Fischer von der Universität Duisburg-Essen stellen das System DAFFODIL vor, das durch eine Vielzahl an Werkzeugen zur strategischen Unterstützung bei Literaturrecherchen in digitalen Bibliotheken dient. Zusätzlich ermöglicht die Protokollierung sämtlicher Ereignisse den Einsatz des Systems als Evaluationsplattform. Der Aufsatz von Matthias Meiert erläutert die Implementierung von elektronischen Publikationsprozessen an Hochschulen am Beispiel von Abschlussarbeiten des Studienganges Internationales Informationsmanagement der Universität Hildesheim. Neben Rahmenbedingungen werden sowohl der Ist-Zustand als auch der Soll-Zustand des wissenschaftlichen elektronischen Publizierens in Form von gruppenspezifischen Empfehlungen dargestellt. Daniel Harbig und Rene Schneider beschreiben in ihrem Aufsatz zwei Verfahrensweisen zum maschinellen Erlernen von Ontologien, angewandt am virtuellen Bibliotheksregal MyShelf. Nach der Evaluation dieser beiden Ansätze plädieren die Autoren für ein semi-automatisiertes Verfahren zur Erstellung von Ontologien.
"Evaluierung", das Thema des dritten Kapitels, ist in seiner Breite nicht auf das Information Retrieval beschränkt sondern beinhaltet ebenso einzelne Aspekte der Bereiche Mensch-Maschine-Interaktion sowie des E-Learning. Michael Muck und Marco Winter von der Stiftung Wissenschaft und Politik sowie dem Informationszentrum Sozialwissenschaften thematisieren in ihrem Beitrag den Einfluss der Fragestellung (Topic) auf die Bewertung von Relevanz und zeigen Verfahrensweisen für die Topic-Erstellung auf, die beim Cross Language Evaluation Forum (CLEF) Anwendung finden. Im darauf folgenden Aufsatz stellt Thomas Mandl verschiedene Evaluierungsinitiativen im Information Retrieval und aktuelle Entwicklungen dar. Joachim Pfister erläutert in seinem Beitrag das automatisierte Gruppieren, das sogenannte Clustering, von Patent-Dokumenten in den Datenbanken des Fachinformationszentrums Karlsruhe und evaluiert unterschiedliche Clusterverfahren auf Basis von Nutzerbewertungen. Ralph Kölle, Glenn Langemeier und Wolfgang Semar widmen sich dem kollaborativen Lernen unter den speziellen Bedingungen des Programmierens. Dabei werden das System VitaminL zur synchronen Bearbeitung von Programmieraufgaben und das Kennzahlensystem K-3 für die Bewertung kollaborativer Zusammenarbeit in einer Lehrveranstaltung angewendet. Der aktuelle Forschungsschwerpunkt der Hildesheimer Informationswissenschaft zeichnet sich im vierten Kapitel unter dem Thema "Multilinguale Systeme" ab. Hier finden sich die meisten Beiträge des Tagungsbandes wieder. Olga Tartakovski und Margaryta Shramko beschreiben und prüfen das System Langldent, das die Sprache von mono- und multilingualen Texten identifiziert. Die Eigenheiten der japanischen Schriftzeichen stellt Nina Kummer dar und vergleicht experimentell die unterschiedlichen Techniken der Indexierung. Suriya Na Nhongkai und Hans-Joachim Bentz präsentieren und prüfen eine bilinguale Suche auf Basis von Konzeptnetzen, wobei die Konzeptstruktur das verbindende Elemente der beiden Textsammlungen darstellt. Das Entwickeln und Evaluieren eines mehrsprachigen Question-Answering-Systems im Rahmen des Cross Language Evaluation Forum (CLEF), das die alltagssprachliche Formulierung von konkreten Fragestellungen ermöglicht, wird im Beitrag von Robert Strötgen, Thomas Mandl und Rene Schneider thematisiert. Den Schluss bildet der Aufsatz von Niels Jensen, der ein mehrsprachiges Web-Retrieval-System ebenfalls im Zusammenhang mit dem CLEF anhand des multilingualen EuroGOVKorpus evaluiert.
Abschließend lässt sich sagen, dass der Tagungsband einen gelungenen Überblick über die Information Retrieval Projekte der Hildesheimer Informationswissenschaft und ihrer Kooperationspartner gibt. Die einzelnen Beiträge sind sehr anregend und auf einem hohen Niveau angesiedelt. Ein kleines Hindernis für den Leser stellt die inhaltliche und strukturelle Orientierung innerhalb des Bandes dar. Der Bezug der einzelnen Artikel zum Thema des Kapitels wird zwar im Vorwort kurz erläutert. Erschwert wird die Orientierung im Buch jedoch durch fehlende Kapitelüberschriften am Anfang der einzelnen Sektionen. Außerdem ist zu erwähnen, dass einer der Artikel einen anderen Titel als im Inhaltsverzeichnis angekündigt trägt. Sieht der Leser von diesen formalen Mängeln ab, wird er reichlich mit praxisbezogenen und theoretisch fundierten Projektdarstellungen und Forschungsergebnissen belohnt. Dies insbesondere, da nicht nur aktuelle Themen der Informationswissenschaft aufgegriffen, sondern ebenso weiterentwickelt und durch die speziellen interdisziplinären und internationalen Bedingungen in Hildesheim geformt werden. Dabei zeigt sich anhand der verschiedenen Projekte, wie gut die Hildesheimer Informationswissenschaft in die Community überregionaler Informationseinrichtungen und anderer deutscher informationswissenschaftlicher Forschungsgruppen eingebunden ist. Damit hat der Workshop bei einer weiteren Öffnung der Expertengruppe das Potential zu einer eigenständigen Institution im Bereich des Information Retrieval zu werden. In diesem Sinne lässt sich auf weitere fruchtbare Workshops und deren Veröffentlichungen hoffen. Ein nächster Workshop der Universität Hildesheim zum Thema Information Retrieval, organisiert mit der Fachgruppe Information Retrieval der Gesellschaft für Informatik, kündigt sich bereits für den 9. bis 13- Oktober 2006 an."
-
Austin, D.: PRECIS in a multilingual context : Pt.1: PRECIS: an overview (1976)
0.05
0.046581417 = product of:
0.18632567 = sum of:
0.18632567 = weight(_text_:having in 1983) [ClassicSimilarity], result of:
0.18632567 = score(doc=1983,freq=2.0), product of:
0.40279543 = queryWeight, product of:
5.981156 = idf(docFreq=304, maxDocs=44421)
0.06734408 = queryNorm
0.4625814 = fieldWeight in 1983, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.981156 = idf(docFreq=304, maxDocs=44421)
0.0546875 = fieldNorm(doc=1983)
0.25 = coord(1/4)
- Abstract
- The present paper is offered as the first of a series of articles in which PRECIS will be reviewed as a potential multi-lingual system, having in mind the obvious need, notably in a European context, for standard and language independent methods of subject analysis and document description. This first paper outlines the origins of PRECIS, and considers its use in English language indexing. A second paper will deal in general terms with the syntactical model which is used for producing PRECIS input strings and index entries. Later papers will then review the application of this model to indexing in, firstly, the Germanic languages (e.g. German and Danish), and, secondly, the Romance languages, illustrated by French.
-
Francu, V.: ¬The impact of specificity on the retrieval power of a UDC-based multilingual thesaurus (2003)
0.04
0.03992693 = product of:
0.15970773 = sum of:
0.15970773 = weight(_text_:having in 518) [ClassicSimilarity], result of:
0.15970773 = score(doc=518,freq=2.0), product of:
0.40279543 = queryWeight, product of:
5.981156 = idf(docFreq=304, maxDocs=44421)
0.06734408 = queryNorm
0.39649835 = fieldWeight in 518, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.981156 = idf(docFreq=304, maxDocs=44421)
0.046875 = fieldNorm(doc=518)
0.25 = coord(1/4)
- Abstract
- The article describes the research done over a bibliographic database in order to show the impact the specificity of the knowledge organising tools may have on information retrieval (IR). For this purpose two multilingual Universal Decimal Classification (UDC) based thesauri having different degrees of specificity are considered. Issues of harmonising a classificatory structure with a thesaurus structure are introduced, and significant aspects of information retrieval in a multilingual environment are examined in an extensive manner. Aspects of complementarity are discussed with particular emphasis on the real impact produced on IR by alternative search facilities. Finally, a number of conclusions are formulated as they arise from the study.
-
Levergood, B.; Farrenkopf, S.; Frasnelli, E.: ¬The specification of the language of the field and interoperability : cross-language access to catalogues and online libraries (CACAO) (2008)
0.04
0.03992693 = product of:
0.15970773 = sum of:
0.15970773 = weight(_text_:having in 3646) [ClassicSimilarity], result of:
0.15970773 = score(doc=3646,freq=2.0), product of:
0.40279543 = queryWeight, product of:
5.981156 = idf(docFreq=304, maxDocs=44421)
0.06734408 = queryNorm
0.39649835 = fieldWeight in 3646, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.981156 = idf(docFreq=304, maxDocs=44421)
0.046875 = fieldNorm(doc=3646)
0.25 = coord(1/4)
- Abstract
- The CACAO Project (Cross-language Access to Catalogues and Online Libraries) has been designed to implement natural language processing and cross-language information retrieval techniques to provide cross-language access to information in libraries, a critical issue in the linguistically diverse European Union. This project report addresses two metadata-related challenges for the library community in this context: "false friends" (identical words having different meanings in different languages) and term ambiguity. The possible solutions involve enriching the metadata with attributes specifying language or the source authority file, or associating potential search terms to classes in a classification system. The European Library will evaluate an early implementation of this work in late 2008.
-
Kishida, K.: Term disambiguation techniques based on target document collection for cross-language information retrieval : an empirical comparison of performance between techniques (2007)
0.03
0.033272445 = product of:
0.13308978 = sum of:
0.13308978 = weight(_text_:having in 1897) [ClassicSimilarity], result of:
0.13308978 = score(doc=1897,freq=2.0), product of:
0.40279543 = queryWeight, product of:
5.981156 = idf(docFreq=304, maxDocs=44421)
0.06734408 = queryNorm
0.3304153 = fieldWeight in 1897, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.981156 = idf(docFreq=304, maxDocs=44421)
0.0390625 = fieldNorm(doc=1897)
0.25 = coord(1/4)
- Abstract
- Dictionary-based query translation for cross-language information retrieval often yields various translation candidates having different meanings for a source term in the query. This paper examines methods for solving the ambiguity of translations based on only the target document collections. First, we discuss two kinds of disambiguation technique: (1) one is a method using term co-occurrence statistics in the collection, and (2) a technique based on pseudo-relevance feedback. Next, these techniques are empirically compared using the CLEF 2003 test collection for German to Italian bilingual searches, which are executed by using English language as a pivot. The experiments showed that a variation of term co-occurrence based techniques, in which the best sequence algorithm for selecting translations is used with the Cosine coefficient, is dominant, and that the PRF method shows comparable high search performance, although statistical tests did not sufficiently support these conclusions. Furthermore, we repeat the same experiments for the case of French to Italian (pivot) and English to Italian (non-pivot) searches on the same CLEF 2003 test collection in order to verity our findings. Again, similar results were observed except that the Dice coefficient outperforms slightly the Cosine coefficient in the case of disambiguation based on term co-occurrence for English to Italian searches.
-
Francu, V.: Multilingual access to information using an intermediate language (2003)
0.03
0.026617954 = product of:
0.106471814 = sum of:
0.106471814 = weight(_text_:having in 2742) [ClassicSimilarity], result of:
0.106471814 = score(doc=2742,freq=2.0), product of:
0.40279543 = queryWeight, product of:
5.981156 = idf(docFreq=304, maxDocs=44421)
0.06734408 = queryNorm
0.26433223 = fieldWeight in 2742, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.981156 = idf(docFreq=304, maxDocs=44421)
0.03125 = fieldNorm(doc=2742)
0.25 = coord(1/4)
- Abstract
- While being theoretically so widely available, information can be restricted from a more general use by linguistic barriers. The linguistic aspects of the information languages and particularly the chances of an enhanced access to information by means of multilingual access facilities will make the substance of this thesis. The main problem of this research is thus to demonstrate that information retrieval can be improved by using multilingual thesaurus terms based on an intermediate or switching language to search with. Universal classification systems in general can play the role of switching languages for reasons dealt with in the forthcoming pages. The Universal Decimal Classification (UDC) in particular is the classification system used as example of a switching language for our objectives. The question may arise: why a universal classification system and not another thesaurus? Because the UDC like most of the classification systems uses symbols. Therefore, it is language independent and the problems of compatibility between such a thesaurus and different other thesauri in different languages are avoided. Another question may still arise? Why not then, assign running numbers to the descriptors in a thesaurus and make a switching language out of the resulting enumerative system? Because of some other characteristics of the UDC: hierarchical structure and terminological richness, consistency and control. One big problem to find an answer to is: can a thesaurus be made having as a basis a classification system in any and all its parts? To what extent this question can be given an affirmative answer? This depends much on the attributes of the universal classification system which can be favourably used to this purpose. Examples of different situations will be given and discussed upon beginning with those classes of UDC which are best fitted for building a thesaurus structure out of them (classes which are both hierarchical and faceted)...
-
Scheufen, J.-H.: RECOIN: Modell offener Schnittstellen für Information-Retrieval-Systeme und -Komponenten (2006)
0.02
0.019215306 = product of:
0.076861225 = sum of:
0.076861225 = weight(_text_:und in 5901) [ClassicSimilarity], result of:
0.076861225 = score(doc=5901,freq=18.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.5145956 = fieldWeight in 5901, product of:
4.2426405 = tf(freq=18.0), with freq of:
18.0 = termFreq=18.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0546875 = fieldNorm(doc=5901)
0.25 = coord(1/4)
- Abstract
- Erfahrungen im Cross Language Evaluation Forum (CLEF) und die Beschäftigung mit Fragestellungen zum MIMOR-Modell haben den Bedarf für ein Framework zur Integration heterogener Retrieval-Komponenten aufgezeigt, mit dein sich einzelne Schritte des Retrieval-Prozesses individuell konfigurieren, untersuchen und optimieren lassen. RECOIN stellt ein Meta-Framework zur Verfügung, das den Programmieraufwand für die Integration neuer oder bereits existierender Retrieval-Bausteine minimiert und außerdem die Steuerung und Protokollierung verwendeter Objekte, Methoden und Parameter des Retrieval-Prozesses ermöglicht.
- Source
- Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker
-
Rahmstorf, G.: Methoden und Formate für mehrsprachige Begriffssysteme (1996)
0.02
0.019018222 = product of:
0.07607289 = sum of:
0.07607289 = weight(_text_:und in 7109) [ClassicSimilarity], result of:
0.07607289 = score(doc=7109,freq=6.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.50931764 = fieldWeight in 7109, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.09375 = fieldNorm(doc=7109)
0.25 = coord(1/4)
- Footnote
- Ausgehändigtes Papier während der Sitzung 'Methoden und Formate für sprachbezogene Begriffssysteme' anläßlich der 20. Jahrestagung der Gesellschaft für Klassifikation am 5.3.1995 in Freiburg
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus
-
Widdra, M.: Besonderheiten eines multilingualen Thesaurus : Am Beispiel des "Europäischen Thesaurus Internationale Beziehungen und Länderkunde" (2004)
0.02
0.019018222 = product of:
0.07607289 = sum of:
0.07607289 = weight(_text_:und in 5628) [ClassicSimilarity], result of:
0.07607289 = score(doc=5628,freq=6.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.50931764 = fieldWeight in 5628, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.09375 = fieldNorm(doc=5628)
0.25 = coord(1/4)
- Imprint
- Potsdam : Fachhochschule, Institut für Information und Dokumentation
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus
-
Lehtinen, R.; Clavel-Merrin, G.: Mehrsprachige und verschiedenartige Daten in Bibliothekssystemen und -netzen : Erfahrungen und Perspektiven aus der Schweiz und Finnland (1998)
0.02
0.018300291 = product of:
0.073201165 = sum of:
0.073201165 = weight(_text_:und in 5186) [ClassicSimilarity], result of:
0.073201165 = score(doc=5186,freq=8.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.4900911 = fieldWeight in 5186, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.078125 = fieldNorm(doc=5186)
0.25 = coord(1/4)
-
DIN 1463: Erstellung und Weiterentwicklung von Thesauri : Teil 1: Einsprachige Thesauri (1987); Teil 2: Mehrsprachige Thesauri (1993) (1987-93)
0.02
0.018116364 = product of:
0.07246546 = sum of:
0.07246546 = weight(_text_:und in 283) [ClassicSimilarity], result of:
0.07246546 = score(doc=283,freq=4.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.48516542 = fieldWeight in 283, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.109375 = fieldNorm(doc=283)
0.25 = coord(1/4)
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus
-
Schlenkrich, C.: Aspekte neuer Regelwerksarbeit : Multimediales Datenmodell für ARD und ZDF (2003)
0.02
0.01793055 = product of:
0.0717222 = sum of:
0.0717222 = weight(_text_:und in 2515) [ClassicSimilarity], result of:
0.0717222 = score(doc=2515,freq=48.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.48018923 = fieldWeight in 2515, product of:
6.928203 = tf(freq=48.0), with freq of:
48.0 = termFreq=48.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.03125 = fieldNorm(doc=2515)
0.25 = coord(1/4)
- Abstract
- Wir sind mitten in der Arbeit, deshalb kann ich Ihnen nur Arbeitsstände weitergeben. Es ist im Fluss, und wir bemühen uns in der Tat, die "alten Regelwerke" fit zu machen und sie für den Multimediabereich aufzuarbeiten. Ganz kurz zur Arbeitsgruppe: Sie entstammt der AG Orgatec, der Schall- und Hörfunkarchivleiter- und der Fernseharchivleiterkonferenz zur Erstellung eines verbindlichen multimedialen Regelwerks. Durch die Digitalisierung haben sich die Aufgaben in den Archivbereichen eindeutig geändert. Wir versuchen, diese Prozesse abzufangen, und zwar vom Produktionsprozess bis hin zur Archivierung neu zu regeln und neu zu definieren. Wir haben mit unserer Arbeit begonnen im April letzten Jahres, sind also jetzt nahezu exakt ein Jahr zugange, und ich werde Ihnen im Laufe des kurzen Vortrages berichten können, wie wir unsere Arbeit gestaltet haben. Etwas zu den Mitgliedern der Arbeitsgruppe - ich denke, es ist ganz interessant, einfach mal zu sehen, aus welchen Bereichen und Spektren unsere Arbeitsgruppe sich zusammensetzt. Wir haben also Vertreter des Bayrischen Rundfunks, des Norddeutschen -, des Westdeutschen Rundfunks, des Mitteldeutschen von Ost nach West, von Süd nach Nord und aus den verschiedensten Arbeitsbereichen von Audio über Video bis hin zu Online- und Printbereichen. Es ist eine sehr bunt gemischte Truppe, aber auch eine hochspannenden Diskussion exakt eben aufgrund der Vielfalt, die wir abbilden wollen und abbilden müssen. Die Ziele: Wir wollen verbindlich ein multimediales Datenmodell entwickeln und verabschieden, was insbesondere den digitalen Produktionscenter und Archiv-Workflow von ARD und - da haben wir uns besonders gefreut - auch in guter alter Tradition in gemeinsamer Zusammenarbeit mit dem ZDF bildet. Wir wollen Erfassungs- und Erschließungsregeln definieren. Wir wollen Mittlerdaten generieren und bereitstellen, um den Produktions-Workflow abzubilden und zu gewährleisten, und das Datenmodell, das wir uns sozusagen als Zielstellung definiert haben, soll für den Programmaustausch Grundlagen schaffen, damit von System zu System intern und extern kommuniziert werden kann. Nun könnte man meinen, dass ein neues multimediales Datenmodell aus einem Mix der alten Regelwerke Fernsehen, Wort und Musik recht einfach zusammenzuführen sei. Man stellt einfach die Datenlisten der einzelnen Regelwerke synoptisch gegenüber, klärt Gemeinsames und Spezifisches ab, ergänzt Fehlendes, eliminiert eventuell nicht Benötigtes und stellt es einfach neu zusammen, fertig ist das neue Regelwerk. Leider ist es nicht ganz so einfach, denn es gibt dabei doch eine ganze Reihe von Aspekten zu berücksichtigen, die eine vorgelagerte Abstraktionsebene auch zwingend erforderlich machen.
- Source
- Medien-Informationsmanagement: Archivarische, dokumentarische, betriebswirtschaftliche, rechtliche und Berufsbild-Aspekte. Hrsg.: Marianne Englert u.a
-
Strötgen, R.; Mandl, T.; Schneider, R.: Entwicklung und Evaluierung eines Question Answering Systems im Rahmen des Cross Language Evaluation Forum (CLEF) (2006)
0.02
0.01736118 = product of:
0.06944472 = sum of:
0.06944472 = weight(_text_:und in 981) [ClassicSimilarity], result of:
0.06944472 = score(doc=981,freq=20.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.4649412 = fieldWeight in 981, product of:
4.472136 = tf(freq=20.0), with freq of:
20.0 = termFreq=20.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.046875 = fieldNorm(doc=981)
0.25 = coord(1/4)
- Abstract
- Question Answering Systeme versuchen, zu konkreten Fragen eine korrekte Antwort zu liefern. Dazu durchsuchen sie einen Dokumentenbestand und extrahieren einen Bruchteil eines Dokuments. Dieser Beitrag beschreibt die Entwicklung eines modularen Systems zum multilingualen Question Answering. Die Strategie bei der Entwicklung zielte auf eine schnellstmögliche Verwendbarkeit eines modularen Systems, das auf viele frei verfügbare Ressourcen zugreift. Das System integriert Module zur Erkennung von Eigennamen, zu Indexierung und Retrieval, elektronische Wörterbücher, Online-Übersetzungswerkzeuge sowie Textkorpora zu Trainings- und Testzwecken und implementiert eigene Ansätze zu den Bereichen der Frage- und AntwortTaxonomien, zum Passagenretrieval und zum Ranking alternativer Antworten.
- Source
- Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker
-
Huckstorf, A.; Petras, V.: Mind the lexical gap : EuroVoc Building Block of the Semantic Web (2011)
0.02
0.01736118 = product of:
0.06944472 = sum of:
0.06944472 = weight(_text_:und in 3782) [ClassicSimilarity], result of:
0.06944472 = score(doc=3782,freq=20.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.4649412 = fieldWeight in 3782, product of:
4.472136 = tf(freq=20.0), with freq of:
20.0 = termFreq=20.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.046875 = fieldNorm(doc=3782)
0.25 = coord(1/4)
- Abstract
- Ein Konferenzereignis der besonderen Art fand am 18. und 19. November 2010 in Luxemburg statt. Initiiert durch das Amt für Veröffentlichungen der Europäischen Union (http://publications.europa.eu) waren Bibliothekare und Information Professionals eingeladen, um über die Zukunft mehrsprachiger kontrollierter Vokabulare in Informationssystemen und insbesondere deren Beitrag zum Semantic Web zu diskutieren. Organisiert wurde die Konferenz durch das EuroVoc-Team, das den Thesaurus der Europäischen Union bearbeitet. Die letzte EuroVoc-Konferenz fand im Jahr 2006 statt. In der Zwischenzeit ist EuroVoc zu einem ontologie-basierten Thesaurusmanagementsystem übergegangen und hat systematisch begonnen, Semantic-Web-Technologien für die Bearbeitung und Repräsentation einzusetzen und sich mit anderen Vokabularen zu vernetzen. Ein produktiver Austausch fand mit den Produzenten anderer europäischer und internationaler Vokabulare (z.B. United Nations oder FAO) sowie Vertretern aus Projekten, die an Themen über automatische Indexierung (hier insbesondere parlamentarische und rechtliche Dokumente) sowie Interoperabilitiät zwischen Vokabularen arbeiten, statt.
- Source
- Information - Wissenschaft und Praxis. 62(2011) H.2/3, S.125-126
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus
-
Carter-Sigglow, J.: ¬Die Rolle der Sprache bei der Informationsvermittlung (2001)
0.02
0.01647026 = product of:
0.06588104 = sum of:
0.06588104 = weight(_text_:und in 6882) [ClassicSimilarity], result of:
0.06588104 = score(doc=6882,freq=18.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.44108194 = fieldWeight in 6882, product of:
4.2426405 = tf(freq=18.0), with freq of:
18.0 = termFreq=18.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.046875 = fieldNorm(doc=6882)
0.25 = coord(1/4)
- Abstract
- In der Zeit des Internets und E-Commerce müssen auch deutsche Informationsfachleute ihre Dienste auf Englisch anbieten und sogar auf Englisch gestalten, um die internationale Community zu erreichen. Auf der anderen Seite spielt gerade auf dem Wissensmarkt Europa die sprachliche Identität der einzelnen Nationen eine große Rolle. In diesem Spannungsfeld zwischen Globalisierung und Lokalisierung arbeiten Informationsvermittler und werden dabei von Sprachspezialisten unterstützt. Man muss sich darüber im Klaren sein, dass jede Sprache - auch die für international gehaltene Sprache Englisch - eine Sprachgemeinschaft darstellt. In diesem Beitrag wird anhand aktueller Beispiele gezeigt, dass Sprache nicht nur grammatikalisch und terminologisch korrekt sein muss, sie soll auch den sprachlichen Erwartungen der Rezipienten gerecht werden, um die Grenzen der Sprachwelt nicht zu verletzen. Die Rolle der Sprachspezialisten besteht daher darin, die Informationsvermittlung zwischen diesen Welten reibungslos zu gestalten
- Series
- Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis; 4
- Source
- Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt
-
Yetim, F.: Multilinguale Aspekte von Text und Hypertext (1996)
0.02
0.01636828 = product of:
0.06547312 = sum of:
0.06547312 = weight(_text_:und in 6186) [ClassicSimilarity], result of:
0.06547312 = score(doc=6186,freq=10.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.4383508 = fieldWeight in 6186, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=6186)
0.25 = coord(1/4)
- Abstract
- In diesem Beitrag werden Aspekte der Multilingualität für die Hypertextforschung behandelt. Dabei werden einige Ergebnisse empirischer Arbeit zu interlingualen Textvergleichen vorgestellt und davon ausgehend ihre Anwendbarkeit auf Hypertext diskutiert. Darüberhinaus wird auf ein für Text und Hypertexte gleichermaßen wichtiges Diskursphänomen, die Konnektivität kontrastiv im Türkischen und Deutschen eingegangen. In diesem Zusammenhang wird auch der Nutzen wissensbasierter Verfahren in der Hypertextforschung angesprochen
- Source
- Herausforderungen an die Informationswirtschaft: Informationsverdichtung, Informationsbewertung und Datenvisualisierung. Proceedings des 5. Internationalen Symposiums für Informationswissenschaft (ISI'96), Humboldt-Universität zu Berlin, 17.-19. Oktober 1996. Hrsg.: J. Krause u.a
-
Schruff, R.; Dickhaus, C.: ¬Der multilinguale Thesaurus Ethik in den Biowissenschaften (2004)
0.02
0.01636828 = product of:
0.06547312 = sum of:
0.06547312 = weight(_text_:und in 4045) [ClassicSimilarity], result of:
0.06547312 = score(doc=4045,freq=10.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.4383508 = fieldWeight in 4045, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=4045)
0.25 = coord(1/4)
- Abstract
- Das Deutsche Referenzzentrum für Ethik in den Biowissenschaften (DRZE) in Bonn veröffentlicht zusammen mit nationalen und internationalen Partnern den neuen, mehrsprachigen Thesaurus Ethik in den Biowissenschaften. Das Werkzeug zur Recherche und Verschlagwortung liegt derzeit in deutscher und englischer Sprache vor. Eine französische Version folgt 2005. Insbesondere die Online-Version des Thesaurus bietet komfortable Navigations- und Suchmöglichkeiten.
- Source
- Information - Wissenschaft und Praxis. 55(2004) H.7, S.411-413
-
Loth, K.: Thematische Abfrage einer dreisprachigen Datenbank mit computerlinguistischen Komponenten (2004)
0.02
0.015848517 = product of:
0.06339407 = sum of:
0.06339407 = weight(_text_:und in 1887) [ClassicSimilarity], result of:
0.06339407 = score(doc=1887,freq=6.0), product of:
0.14936237 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.06734408 = queryNorm
0.42443132 = fieldWeight in 1887, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.078125 = fieldNorm(doc=1887)
0.25 = coord(1/4)
- Abstract
- Der Beitrag befasst sich mit dem Einsatz der Computerlinguistik bei der thematischen Abfrage einer mehrsprachigen bibliographischen Datenbank. Das Verbundsystem NEBIS (Netzwerk von Bibliotheken und Informationsstellen in der Schweiz) wurde durch computerlinguistische Komponenten ergänzt, um die thematische Abfrage in den drei Sprachen Deutsch, Englisch und Französisch effektiver und benutzerfreundlicher zu machen.