-
Palowitch, C.; Horowitz, L.: Meta-information structures for networked information resources (1996)
0.19
0.1938815 = product of:
0.775526 = sum of:
0.775526 = weight(_text_:header in 576) [ClassicSimilarity], result of:
0.775526 = score(doc=576,freq=10.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
1.5800426 = fieldWeight in 576, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0546875 = fieldNorm(doc=576)
0.25 = coord(1/4)
- Abstract
- Describes a model of meta information architectures (header, local index, and directory) and presents 3 current or proposed meta information structures for networked information resources, such as Internet resources, with applicability to organization and access in libraries and networked information environments. Special emphasis is given to the Text Encoding Initiative's TEI Header and Independent Header as a model for meta information for academic and library needs. Recommendation is made for the specification of a generalized SGML meta information header based on the principles of the TEI Independent Header, to address the needs of cataloguing, automatic processing, and serving of networkd information resources
-
Brugger, J.M.: Cataloging for digital libraries (1996)
0.17
0.17163426 = product of:
0.686537 = sum of:
0.686537 = weight(_text_:header in 3757) [ClassicSimilarity], result of:
0.686537 = score(doc=3757,freq=6.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
1.398738 = fieldWeight in 3757, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0625 = fieldNorm(doc=3757)
0.25 = coord(1/4)
- Abstract
- Using grant funding, some prominent creators of digital libraries have promised users of networked resources certain kinds of access. Some of this access finds a ready-made vehicle in USMARC, some of it in the TEI header, some of it has yet to find the most appropriate vehicle. In its quest to provide access to what users need, the cataloging community can show leadership by exploring the strength inherent in a metadata-providing system like the TEI header.
- Object
- TEI header
-
Desai, B.C.: Supporting discovery in virtual libraries (1997)
0.17
0.17163426 = product of:
0.686537 = sum of:
0.686537 = weight(_text_:header in 543) [ClassicSimilarity], result of:
0.686537 = score(doc=543,freq=6.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
1.398738 = fieldWeight in 543, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0625 = fieldNorm(doc=543)
0.25 = coord(1/4)
- Abstract
- Discusses the development and implementation of models for indexing and searching information resources on the Internet. Examines briefly the results of a simple query on a number of existing search systems and discusses 2 proposed index metadata structures for indexing and supporting search and discovery: The Dublin Core Elements List and the Semantic Header. Presents an indexing and discovery system based on the Semantic Header
- Object
- Semantic Header
-
Harmsen, B.; Leiter, A.: Fraunhofer-Publica : Kompetenzdatenbank der angewandten Forschung (2009)
0.14
0.14451161 = product of:
0.28902322 = sum of:
0.041290525 = weight(_text_:und in 3823) [ClassicSimilarity], result of:
0.041290525 = score(doc=3823,freq=16.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.34654674 = fieldWeight in 3823, product of:
4.0 = tf(freq=16.0), with freq of:
16.0 = termFreq=16.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0390625 = fieldNorm(doc=3823)
0.2477327 = weight(_text_:header in 3823) [ClassicSimilarity], result of:
0.2477327 = score(doc=3823,freq=2.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
0.5047261 = fieldWeight in 3823, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0390625 = fieldNorm(doc=3823)
0.5 = coord(2/4)
- Abstract
- Fraunhofer-Publica ist die multidisziplinäre, bibliographische Referenzdatenbank für die Veröffentlichungen der Fraunhofer-Gesellschaft, der größten Europäischen Trägerorganisation für angewandte Forschung, und ihre Mitarbeiter. Die Datenbank wurde 1988 ins Leben gerufen und 1991 um Patente ergänzt. Erstmals 1995 übers World Wide Web frei verfügbar, enthält sie seit 1999 auch Volltext-Dokumente. Seit 2005 ist sie "Open Archive Data Provider". Vor kurzem wurde die Web-Oberfläche überarbeitet, wodurch die Zugriffsmöglichkeiten für Suchmachinen-Robots erheblich verbessert werden konnten und Publica-Zitate nun in Google, MSN und in anderen Web-Datenbanken leichter auffindbar sind. 80 Prozent der heutigen Publica-Nutzung wird über Suchmaschinen vermittelt. Das Fraunhofer-Publica Team orientiert sich an vier Qualitätsmerkmalen für die Datenbankproduktion: Beschaffbarkeit der Originaldokumente, Vollständigkeit / Aktualität, Konsistenz der Metadaten und die Verbreitung der Publica-Inhalte. Dies verlangt akkurate Quellangaben, möglichst den Nachweis von IDs wie DOI oder URN sowie möglichst direkte Volltextlinks. Das Optimum im Bezug auf Beschaffbarkeit stellen freie Downloads dar. Was das Kriterium "Verbreitung" anbelangt, werden sowohl das "Harvesten" der Datenbank als auch die direkte Indexierung durch Robots unterstützt. Das Google-Ranking der Listen und Einzeldokumente ist jedoch schlecht, weil sie keine individuellen Titel haben. Deshalb wird als wichtigste Verbesserung angestrebt, individuelle Titel im HTML-Header für Listen und Einzelanzeigen zu generieren. Obwohl das "Harvesting" der Fraunhofer-Publica seit 2005 möglich ist, gibt es nach wie vor keine "Daten-Sets", d.h. fachspezifische Selektionsmöglichkeiten, die wichtig wären, um wissenschaftlichen Fachportalen zuzuarbeiten. Um dies zu ermöglichen, müssen nachträglich ca. 112.000 Publica-Dokumenten grobe DDC-Klassen bis zur dritten Ebene zugeordnet werden.
- Source
- Information - Wissenschaft und Praxis. 60(2009) H.3, S.151-154
-
Giordano, R.: ¬The documentation of electronic texts : using Text Encoding Initiative headers: an introduction (1994)
0.13
0.1287257 = product of:
0.5149028 = sum of:
0.5149028 = weight(_text_:header in 934) [ClassicSimilarity], result of:
0.5149028 = score(doc=934,freq=6.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
1.0490535 = fieldWeight in 934, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.046875 = fieldNorm(doc=934)
0.25 = coord(1/4)
- Abstract
- Presents a general introduction to the form and functions of the Text Encoding Initiative (TEI) headers and explains their relationship to the MARC record. The TEI header's main strength is that it documents electronic texts in a standard exchange format that should be understandable to both librarian cataloguers and text encoders outside of librarianship. TEI gives encoders the ability to document the the electronic text itself, its source, its encoding principles, and revisions, as well as non bibliographic characteristics of the text that can support both scholarly analysis and retrieval. Its bibliographic descriptions can be loaded into standard remote bibliographic databases, which should make electronic texts as easy to find for researchers as texts in other media. Presents a brief overview of the TEI header, the file description and ways in which the TEI headers have counterparts in MARC, the Encoding Description, the Profile Description, the Revision Description, the size and complexity of the TEI header, and the use of the TEI header to support document retrieval and analysis, with notes on some of the prospects and problems
-
Seaman, D.: Selection, access, and control in library of electronic texts (1996)
0.12
0.122621424 = product of:
0.4904857 = sum of:
0.4904857 = weight(_text_:header in 724) [ClassicSimilarity], result of:
0.4904857 = score(doc=724,freq=4.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
0.9993067 = fieldWeight in 724, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0546875 = fieldNorm(doc=724)
0.25 = coord(1/4)
- Abstract
- The Electronic Text Center at the University of Virginia has been mounting SGML full-text databases on-line since 1992, and actively building a user community around this Internet resource. Conceiving of what we do as firmly a library operation, we have sought to integrate the electronic text databases into the training, cataloging, preservation, and collection development areas of our library. Central to our selection criteria is the desire for softwareand platform-independent textsif it's not SGML, it's ephermeraland central to our cataloging endeavors is on SGML bibliographic record such as the Text Encoding Initiative header.
- Object
- TEI header
-
Chen, H.; Chung, Y.-M.; Ramsey, M.; Yang, C.C.: ¬A smart itsy bitsy spider for the Web (1998)
0.09
0.08990918 = product of:
0.35963672 = sum of:
0.35963672 = weight(_text_:jav in 1871) [ClassicSimilarity], result of:
0.35963672 = score(doc=1871,freq=2.0), product of:
0.5913817 = queryWeight, product of:
11.008321 = idf(docFreq=1, maxDocs=44421)
0.05372134 = queryNorm
0.60812956 = fieldWeight in 1871, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
11.008321 = idf(docFreq=1, maxDocs=44421)
0.0390625 = fieldNorm(doc=1871)
0.25 = coord(1/4)
- Abstract
- As part of the ongoing Illinois Digital Library Initiative project, this research proposes an intelligent agent approach to Web searching. In this experiment, we developed 2 Web personal spiders based on best first search and genetic algorithm techniques, respectively. These personal spiders can dynamically take a user's selected starting homepages and search for the most closely related homepages in the Web, based on the links and keyword indexing. A graphical, dynamic, Jav-based interface was developed and is available for Web access. A system architecture for implementing such an agent-spider is presented, followed by deteiled discussions of benchmark testing and user evaluation results. In benchmark testing, although the genetic algorithm spider did not outperform the best first search spider, we found both results to be comparable and complementary. In user evaluation, the genetic algorithm spider obtained significantly higher recall value than that of the best first search spider. However, their precision values were not statistically different. The mutation process introduced in genetic algorithms allows users to find other potential relevant homepages that cannot be explored via a conventional local search process. In addition, we found the Java-based interface to be a necessary component for design of a truly interactive and dynamic Web agent
-
Hillmann, D.I.: 'Parallel universes' or meaningful relationships : envisioning a future for the OPAC and the net (1996)
0.09
0.086706445 = product of:
0.34682578 = sum of:
0.34682578 = weight(_text_:header in 3655) [ClassicSimilarity], result of:
0.34682578 = score(doc=3655,freq=2.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
0.7066165 = fieldWeight in 3655, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0546875 = fieldNorm(doc=3655)
0.25 = coord(1/4)
- Abstract
- Briefly follows the debate concerning: the relationship between traditional library OPACs and the WWW; possible replacement of USMARC format with SGML; and the possible demise of OPACs that do not migrate to the WWW. Discusses the approach taken by the Text encoding Initative (TEI) in their use of a mandatory TEI header in their standard SGML application as the first since CIP to explore attaching bibliographic information to the item itself to assist cataloguing
-
Vizine-Goetz, D.: Office of research project develops tools for describing and accessing Internet resources (1995)
0.09
0.086706445 = product of:
0.34682578 = sum of:
0.34682578 = weight(_text_:header in 5602) [ClassicSimilarity], result of:
0.34682578 = score(doc=5602,freq=2.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
0.7066165 = fieldWeight in 5602, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0546875 = fieldNorm(doc=5602)
0.25 = coord(1/4)
- Abstract
- Over the past 5 years, librarians, humanities computing researchers and computer scientists have been working to establish standards for encoding and accessing local and networked electronic information resources, and these are now being put into practice by their corresponding user communities. The OCLC Cataloging Internet Resources project is investigating the relationship between 2 of these: the MARC bibliographic format and the Text Encoding Initiative (TEI) header, developed by humanities computing researchers. Specifically, the project has designed a WWW based prototype, called Spectrum, that enables those without specialized knowledge of library cataloguing or markup to create records for describing and accessing Internet resources of various types. The system enables the generation of MARC records from TEI headers
-
Fu, T.; Abbasi, A.; Chen, H.: ¬A hybrid approach to Web forum interactional coherence analysis (2008)
0.07
0.0743198 = product of:
0.2972792 = sum of:
0.2972792 = weight(_text_:header in 2872) [ClassicSimilarity], result of:
0.2972792 = score(doc=2872,freq=2.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
0.6056713 = fieldWeight in 2872, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.046875 = fieldNorm(doc=2872)
0.25 = coord(1/4)
- Abstract
- Despite the rapid growth of text-based computer-mediated communication (CMC), its limitations have rendered the media highly incoherent. This poses problems for content analysis of online discourse archives. Interactional coherence analysis (ICA) attempts to accurately identify and construct CMC interaction networks. In this study, we propose the Hybrid Interactional Coherence (HIC) algorithm for identification of web forum interaction. HIC utilizes a bevy of system and linguistic features, including message header information, quotations, direct address, and lexical relations. Furthermore, several similarity-based methods including a Lexical Match Algorithm (LMA) and a sliding window method are utilized to account for interactional idiosyncrasies. Experiments results on two web forums revealed that the proposed HIC algorithm significantly outperformed comparison techniques in terms of precision, recall, and F-measure at both the forum and thread levels. Additionally, an example was used to illustrate how the improved ICA results can facilitate enhanced social network and role analysis capabilities.
-
Deussen, N.: Sogar der Mars könnte bald eine virutelle Heimat bekommen : Gut 4,2 Milliarden sind nicht genug: Die sechste Version des Internet-Protokolls schafft viele zusätzliche Online-Adressen (2001)
0.07
0.07403754 = product of:
0.14807507 = sum of:
0.024208719 = weight(_text_:und in 6729) [ClassicSimilarity], result of:
0.024208719 = score(doc=6729,freq=22.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.20318104 = fieldWeight in 6729, product of:
4.690416 = tf(freq=22.0), with freq of:
22.0 = termFreq=22.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.01953125 = fieldNorm(doc=6729)
0.12386635 = weight(_text_:header in 6729) [ClassicSimilarity], result of:
0.12386635 = score(doc=6729,freq=2.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
0.25236306 = fieldWeight in 6729, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.01953125 = fieldNorm(doc=6729)
0.5 = coord(2/4)
- Abstract
- In der Virtualität wird's eng. Die Möglichkeiten des Scheinbaren sind anscheinend ausgereizt. Es mangelt bald an InternetAdressen. Wenn WhirIpools und Wasclunaschinen ihren eigenen Zugang zum Internet brauchen, wird der Vorrat an Kennzahlen knapp. Um dem drohenden Mangel zu begegnen, wird seit Jahren an einer überarbeiteten Fassung des Internet-Protokolls (IP) gebastelt. Doch die Neuauflage hat bis auf ein paar Testläufe - bisher ihren Weg ins Netz noch nicht gefunden. Für Aufregung sorgte sie dennoch bereits: wegen Datenschutzproblemen. Für die Kommunikation zwischen Computern im Internet gibt es eine Art Knigge. Die protokollarische Vorschrift legt fest; wie die Rechner Daten untereinander austauschen. Doch zuvor brauchen die Maschinen Namen (wie www.fr-aktuell.de) und Anschriften (hier: 194.175.173.20), damit sie sich einander vorstellen (Shake Hands) und später Daten schicken können. Vergeben werden die Bezeichnungen von der Internet Corporation for Assigned Names and Numbers Icann). Den ersten Vorschlag für eine einheitliche Übergaberegelung machten Bob Kahn und Vint Cerf im Jahr 1974. Damals versuchten im inzwischen legendären, militärisch genutzten Arpanet kaum tausend Großrechner an etwa 250 Standorten miteinander zu kommunizieren. Um Ordnung in das Sprachengewirr der verschiedenen Bautypen zu bringen, mussten Regeln her. Die Idee entwickelte sich zum Protokoll, das nach Informatik-Manier mit dem Kürzel TCP/IP belegt wurde. Mit etwa 100000 angeschlossenen Computern wurde das Netz 1983 zivil - und TCP/IP zum offiziellen Standard. Derzeit regelt die vierte Version des Internet-Protokolls (IPv4) den Bit-Transport. Die Adresse wird jedem Datenpaket vorangestellt. Sie besteht aus Ziffern und ist exakt 32 Bit lang. Daraus ergeben sich mehr als 4,2 Milliarden Zahlenkombinationen. Genug für einen Globus, auf dem erst kürzlich der sechsmilliardste Erdenbürger das Licht der realen Welt erblickte - dachten die Computer-Operateure damals. Dann kam das World Wide Web.
Der Geniestreich aus dem Europäischen Labor für Teilchenphysik (Cern) in Genf machte aus dem Wissenschaftsnetz ein Massenmedium. Zudem erfuhr die elektronische Post einen Aufschwung. Das Wachstum der Netze sprengt alle Erwartungen", resümiert Klaus Birkenbihl vom InformatikForschungszentrum GMI). Jede Web-Site, jede E-Mail-Box, jeder Computer, der per Standleitung online ist, braucht eine eindeutige Identifizierung. Die Schätzungen, wie viele IPv4-Adressen noch frei sind, schwanken zwischen 40 und zehn Prozent. Der Verbrauch jedenfalls steigt rasant: Die Anzahl der WebSites steuert derzeit auf eine Milliarde zu, weit mehr Netznummern gehen bereits für E-Mail-Anschriften drauf. Den Adressraum weiter ausschöpfen werden demnächst die intelligenten Haushaltsgeräte. Der Laden an der Ecke will wissen, welcher Kühlschrank die Milch bestellt hat, die Videozentrale braucht für das Überspielen des Films die Kennung des PC-Recorders, der Computer des Installateurs benötigt die IP-Anschrift der Heizungsanlage für die Fernwartung. Handys, die später Nachrichten übers Internet schicken, und Internet-Telefonie gehen möglicherweise leer aus. Doch bevor Internet-Adressen zur heiß begehrten Schieberware werden, soll ein neues Adresssystern mit mehr Möglichkeiten her. Schon 1990 hatte sich die Internet Engineering Task Force (IETF) Gedanken über einen neues Internet-Protokoll mit einem größeren Adressangebot gemacht. Im IETF kümmern sich Forscher, Soft- und HardwareIngenieure um die fortlaufende Verbesserung von Architektur und Arbeit des Netz werks. Eine ihrer Arbeitsgruppen prognostizierte, der IPv4-Vorrat gehe 2005 zu Ende. Fünf Jahre dauerte es, dann waren sich alle Internet-Gremien einig: Eine neue Protokollversion, IPv6, muss her. Dann passierte weiter nichts. Endlich verkündete 1999 Josh Elliot von der Icann, ab sofort würden neue Anschriften verteilt. Ein historischer Moment", freute er sich.
Der neue 128-Bit-Header treibt die Möglichkeiten ins Astronomische: 3,4 mal zehn hoch 38 Adressen, eine 3,4 mit 38 Nullen. -Das IPv6-Forum zerhackte den Zahlentrumm in anschauliche Stücke: Pro Quadratmillimeter Erdoberfläche stehen nun zirka 667 Billiarden, pro Mensch 6,5 mal zehn hoch 28 Adressen, bereit." Eine Billiarde bringt es immerhin auf respektable 15 Nullen. Schon kurz darauf ging ein Aufschrei durch die Netzgemeinde. Das neue Protokoll schrieb die weltweit eindeutigen Seriennummern bestimmter Netzwerkkarten auf den virtuellen Adressaufkleber. Die Ethernet-Adapter bewerkstelligen den Datentransport bei Computern, die über eine Standleitung, ein Koaxialkabel, dauernd online sind. Die Spur von Ethernet-Usern wäre damit leicht zu verfolgen gewesen, ihre Nutzerprofile, ihre Surfgewohnheiten einsehbar wie offene Bücher. Das Problem, ließ Icann nun wissen, sei behoben: Es gebe keine festen Kennzahlen mehr in den Adressköpfen. Bei jedem Hochfahren eines Rechners oder sogar noch öfter werden die Nummern neu durchgemischt", erläutert Hans Petter Dittler, stellvertretender Vorsitzender der deutschen Sektion der Internet Society. Das Betriebssystem Linux kann bereits mit dem IPv6 arbeiten. Microsoft will den Standard in das nächste Windows-Betriebssystem einbauen: "Wir denken, der vorgeschlagene Standard ist wichtig zum Schutz der Privatsphäre der Internet-Nutzer", sagt Jawad Khaki, Vizepräsident für Netzwerke. Seit einigen Tagen steht auf der Microsoft-Homepage eine Vorab-Version von lPv6 für Windows 2000 zum Herunterladen bereit. Geradezu euphorisch gibt sich Protokoll-Chef Vint Cerf. Mit IPv6 haben wir die Grundlage dafür", philosophierte der Internet-Daddy auf dem ersten lPv6-Kongress 1999 in Berlin, "das Internet von unserem Planeten über den Mars und die Asteroiden bis in den Weltraum hinaus auszudehnen." Doch im Internet-Alltag wird das alte Protokoll noch lange Vorrang haben. Grund sind handfeste Programmier-Probleme. Denn Software, die sich explizit auf die vierte IP-Version bezieht, muss umgeschrieben werden - etwa um mit den längeren Adressfeldern umgehen zu können. Hubert Martens vom Münchner Multinet Services befürchtet gar einen InternetCrash: "Das Jahr-2000-Problem war harmlos gegen das, was uns mit lPv6 droht."
-
Assem, M. van; Rijgersberg, H.; Wigham, M.; Top, J.: Converting and annotating quantitative data tables (2010)
0.06
0.061933175 = product of:
0.2477327 = sum of:
0.2477327 = weight(_text_:header in 705) [ClassicSimilarity], result of:
0.2477327 = score(doc=705,freq=2.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
0.5047261 = fieldWeight in 705, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0390625 = fieldNorm(doc=705)
0.25 = coord(1/4)
- Abstract
- Companies, governmental agencies and scientists produce a large amount of quantitative (research) data, consisting of measurements ranging from e.g. the surface temperatures of an ocean to the viscosity of a sample of mayonnaise. Such measurements are stored in tables in e.g. spreadsheet files and research reports. To integrate and reuse such data, it is necessary to have a semantic description of the data. However, the notation used is often ambiguous, making automatic interpretation and conversion to RDF or other suitable format diffiult. For example, the table header cell "f(Hz)" refers to frequency measured in Hertz, but the symbol "f" can also refer to the unit farad or the quantities force or luminous flux. Current annotation tools for this task either work on less ambiguous data or perform a more limited task. We introduce new disambiguation strategies based on an ontology, which allows to improve performance on "sloppy" datasets not yet targeted by existing systems.
-
Huang, S.; Qian, J.; Huang, Y.; Lu, W.; Bu, Y.; Yang, J.; Cheng, Q.: Disclosing the relationship between citation structure and future impact of a publication (2022)
0.06
0.061933175 = product of:
0.2477327 = sum of:
0.2477327 = weight(_text_:header in 1622) [ClassicSimilarity], result of:
0.2477327 = score(doc=1622,freq=2.0), product of:
0.490826 = queryWeight, product of:
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.05372134 = queryNorm
0.5047261 = fieldWeight in 1622, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
9.1365185 = idf(docFreq=12, maxDocs=44421)
0.0390625 = fieldNorm(doc=1622)
0.25 = coord(1/4)
- Abstract
- Each section header of an article has its distinct communicative function. Citations from distinct sections may be different regarding citing motivation. In this paper, we grouped section headers with similar functions as a structural function and defined the distribution of citations from structural functions for a paper as its citation structure. We aim to explore the relationship between citation structure and the future impact of a publication and disclose the relative importance among citations from different structural functions. Specifically, we proposed two citation counting methods and a citation life cycle identification method, by which the regression data were built. Subsequently, we employed a ridge regression model to predict the future impact of the paper and analyzed the relative weights of regressors. Based on documents collected from the Association for Computational Linguistics Anthology website, our empirical experiments disclosed that functional structure features improve the prediction accuracy of citation count prediction and that there exist differences among citations from different structural functions. Specifically, at the early stage of citation lifetime, citations from Introduction and Method are particularly important for perceiving future impact of papers, and citations from Result and Conclusion are also vital. However, early accumulation of citations from the Background seems less important.
-
#11723
0.03
0.025285179 = product of:
0.101140715 = sum of:
0.101140715 = weight(_text_:und in 2722) [ClassicSimilarity], result of:
0.101140715 = score(doc=2722,freq=6.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.84886265 = fieldWeight in 2722, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.15625 = fieldNorm(doc=2722)
0.25 = coord(1/4)
- Source
- Information - Wissenschaft und Praxis. 52(2001) und früher => nfd Information - Wissenschaft und Praxis,
-
#484
0.02
0.023357447 = product of:
0.09342979 = sum of:
0.09342979 = weight(_text_:und in 483) [ClassicSimilarity], result of:
0.09342979 = score(doc=483,freq=2.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.7841457 = fieldWeight in 483, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.25 = fieldNorm(doc=483)
0.25 = coord(1/4)
- Object
- Thesaurus Technik und Management ==> TEMA-Thesaurus
-
#6200
0.02
0.023357447 = product of:
0.09342979 = sum of:
0.09342979 = weight(_text_:und in 6199) [ClassicSimilarity], result of:
0.09342979 = score(doc=6199,freq=2.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.7841457 = fieldWeight in 6199, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.25 = fieldNorm(doc=6199)
0.25 = coord(1/4)
- Object
- Gesamtthesaurus Thesaurus Technik und Management ==> TEMA-Thesaurus
-
Bühler, A.: Antirealismus und Verifikationismus (1992)
0.02
0.02285012 = product of:
0.09140048 = sum of:
0.09140048 = weight(_text_:und in 615) [ClassicSimilarity], result of:
0.09140048 = score(doc=615,freq=10.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.7671139 = fieldWeight in 615, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.109375 = fieldNorm(doc=615)
0.25 = coord(1/4)
- Series
- Philosophie und Geschichte der Wissenschaften; Bd.18
- Source
- Wirklichkeit und Wissen: Realismus, Antirealismus und Wirklichkeits-Konzeptionen in Philosophie und Wissenschaften. Hrsg.: H.J. Sandkühler
-
Semantik, Lexikographie und Computeranwendungen : Workshop ... (Bonn) : 1995.01.27-28 (1996)
0.02
0.022497656 = product of:
0.08999062 = sum of:
0.08999062 = weight(_text_:und in 1190) [ClassicSimilarity], result of:
0.08999062 = score(doc=1190,freq=76.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.75528115 = fieldWeight in 1190, product of:
8.717798 = tf(freq=76.0), with freq of:
76.0 = termFreq=76.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0390625 = fieldNorm(doc=1190)
0.25 = coord(1/4)
- BK
- 18.00 Einzelne Sprachen und Literaturen allgemein
- Classification
- ES 940 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Maschinelle Sprachanalyse
ET 400 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Einzelgebiete der Sprachwissenschaft, Sprachbeschreibung / Semantik und Lexikologie / Allgemeines
ES 945 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Spracherkennung
ET 580 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Einzelgebiete der Sprachwissenschaft, Sprachbeschreibung / Semantik und Lexikologie / Lexikologie (diachrone und synchrone) / Lexikographie
18.00 Einzelne Sprachen und Literaturen allgemein
- RVK
- ES 940 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Maschinelle Sprachanalyse
ET 400 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Einzelgebiete der Sprachwissenschaft, Sprachbeschreibung / Semantik und Lexikologie / Allgemeines
ES 945 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Spracherkennung
ET 580 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Einzelgebiete der Sprachwissenschaft, Sprachbeschreibung / Semantik und Lexikologie / Lexikologie (diachrone und synchrone) / Lexikographie
- Series
- Sprache und Information ; 33
-
Schnelle, H.: ¬Die Natur der Sprache : die Dynamik der Prozesse des Sprechens und Verstehens (1991)
0.02
0.021054119 = product of:
0.084216475 = sum of:
0.084216475 = weight(_text_:und in 2578) [ClassicSimilarity], result of:
0.084216475 = score(doc=2578,freq=104.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.7068194 = fieldWeight in 2578, product of:
10.198039 = tf(freq=104.0), with freq of:
104.0 = termFreq=104.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.03125 = fieldNorm(doc=2578)
0.25 = coord(1/4)
- BK
- 17.03 / Theorie und Methoden der Sprach- und Literaturwissenschaft
18.00 / Einzelne Sprachen und Literaturen allgemein
- Classification
- ER 720 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachtheorie. Theorien und Methoden der Sprachwissenschaft / Einzelne Richtungen der Sprachtheorie
ER 610 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachphilosophie (Primärliteratur der Sprachphilosophie; Sekundärliteratur s.o. bei Geschichte der Sprachwissenschaft) / Wesen und Bedeutung der Sprache
ES 160 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Sprachphänomenologie / Allgemeines
ER 710 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachtheorie. Theorien und Methoden der Sprachwissenschaft / Funktion der Sprache
ER 765 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachtheorie. Theorien und Methoden der Sprachwissenschaft / Methodologie der Spachwissenschaft / Einzelmethoden, z.B. Informationsbefragung, Feldarbeit
ER 900 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachpsychologie. Psycholinguistik / Allgemeines
17.03 / Theorie und Methoden der Sprach- und Literaturwissenschaft
18.00 / Einzelne Sprachen und Literaturen allgemein
- RVK
- ER 720 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachtheorie. Theorien und Methoden der Sprachwissenschaft / Einzelne Richtungen der Sprachtheorie
ER 610 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachphilosophie (Primärliteratur der Sprachphilosophie; Sekundärliteratur s.o. bei Geschichte der Sprachwissenschaft) / Wesen und Bedeutung der Sprache
ES 160 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Sprachphänomenologie / Allgemeines
ER 710 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachtheorie. Theorien und Methoden der Sprachwissenschaft / Funktion der Sprache
ER 765 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachtheorie. Theorien und Methoden der Sprachwissenschaft / Methodologie der Spachwissenschaft / Einzelmethoden, z.B. Informationsbefragung, Feldarbeit
ER 900 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft / Sprachpsychologie. Psycholinguistik / Allgemeines
- Series
- Grundlagen der Kommunikation und Kognition
-
Stauf, B.: Schlagwortkataloge, Deskriptorenverzeichnisse und Thesauri : Unterschiede und Gemeinsamkeiten im Vergleich (1978)
0.02
0.020645263 = product of:
0.08258105 = sum of:
0.08258105 = weight(_text_:und in 1374) [ClassicSimilarity], result of:
0.08258105 = score(doc=1374,freq=4.0), product of:
0.11914851 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.05372134 = queryNorm
0.6930935 = fieldWeight in 1374, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.15625 = fieldNorm(doc=1374)
0.25 = coord(1/4)