Search (199 results, page 2 of 10)

Mongin, L.; Fu, Y.Y.; Mostafa, J.: Open Archives data Service prototype and automated subject indexing using D-Lib archive content as a testbed (2003) 0.06
```
0.05720272 = product of:
  0.22881088 = sum of:
    0.22881088 = weight(_text_:java in 2167) [ClassicSimilarity], result of:
      0.22881088 = score(doc=2167,freq=2.0), product of:
        0.48976174 = queryWeight, product of:
          7.0475073 = idf(docFreq=104, maxDocs=44421)
          0.06949432 = queryNorm
        0.46718815 = fieldWeight in 2167, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          7.0475073 = idf(docFreq=104, maxDocs=44421)
          0.046875 = fieldNorm(doc=2167)
  0.25 = coord(1/4)
```
Abstract

The Indiana University School of Library and Information Science opened a new research laboratory in January 2003; The Indiana University School of Library and Information Science Information Processing Laboratory [IU IP Lab]. The purpose of the new laboratory is to facilitate collaboration between scientists in the department in the areas of information retrieval (IR) and information visualization (IV) research. The lab has several areas of focus. These include grid and cluster computing, and a standard Java-based software platform to support plug and play research datasets, a selection of standard IR modules and standard IV algorithms. Future development includes software to enable researchers to contribute datasets, IR algorithms, and visualization algorithms into the standard environment. We decided early on to use OAI-PMH as a resource discovery tool because it is consistent with our mission.

Siebenkäs, A.; Markscheffel, B.: Conception of a workflow for the semi-automatic construction of a thesaurus for the German printing industry (2015) 0.06

0.055011842 = product of:
  0.110023685 = sum of:
    0.026438447 = weight(_text_:und in 3091) [ClassicSimilarity], result of:
      0.026438447 = score(doc=3091,freq=2.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.17153187 = fieldWeight in 3091, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.0546875 = fieldNorm(doc=3091)
    0.08358524 = weight(_text_:https in 3091) [ClassicSimilarity], result of:
      0.08358524 = score(doc=3091,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.30499426 = fieldWeight in 3091, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0546875 = fieldNorm(doc=3091)
  0.5 = coord(2/4)

Content: Vgl.: https://zenodo.org/record/17945/files/s3_217-229.pdf.
Theme: Konzeption und Anwendung des Prinzips Thesaurus

Donath, A.: Flickr sorgt mit Automatik-Tags für Aufregung (2015) 0.05
```
0.050965503 = product of:
  0.101931006 = sum of:
    0.04222726 = weight(_text_:und in 2876) [ClassicSimilarity], result of:
      0.04222726 = score(doc=2876,freq=10.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.27396923 = fieldWeight in 2876, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.0390625 = fieldNorm(doc=2876)
    0.05970374 = weight(_text_:https in 2876) [ClassicSimilarity], result of:
      0.05970374 = score(doc=2876,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.21785304 = fieldWeight in 2876, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0390625 = fieldNorm(doc=2876)
  0.5 = coord(2/4)
```
Content

"Flickr hat ein Tagging der heraufgeladenen Fotos eingeführt, das zusätzlich zu den Bildbeschreibungen der Nutzer versucht, die Fotos mit Schlagwörtern zu versehen, die den Bildinhalt beschreiben. Nach einem Bericht des britischen Guardian werden dabei Fehler gemacht, die unangebrachte Beschreibungen bis hin zu rassistischen oder politisch inkorrekten Bemerkungen beinhalten. So wurden dunkelhäutiger Menschen als "monochrom", "Tier" und "Affe" beschrieben. Auch das Gesicht einer hellhäutigen Frau wurde mit "Tier" klassifiziert. Bilder eines Konzentrationslagers wurden gar mit "Sport" und "Klettergerüst" verschlagwortet. Die automatischen Tags lassen sich nicht abschalten - und befinden sich nach Angaben von Yahoo noch in der Betaphase. Viel bringen sie nach Einschätzung von Golem.de nicht, da sie recht allgemein gehalten und wenig aussagekräftig sind. Oftmals kann der Algorithmus nur "Indoor" oder "Outdoor" hinzufügen, was zwar fast immer korrekt zugeordnet wird, dennoch wenig nutzt. Hinter den Kulissen scheint Flickr bereits an einer Verbesserung zu arbeiten - und hat dem Guardian auf Nachfrage versichert, dass die Probleme mit falschen Tags bekannt seien. Einige fehlerhafte Schlagwörter wurden mittlerweile auch wieder entfernt." Vgl. auch: https://news.ycombinator.com/item?id=8621658.
Tavakolizadeh-Ravari, M.: Analysis of the long term dynamics in thesaurus developments and its consequences (2017) 0.05
```
0.047768846 = product of:
  0.09553769 = sum of:
    0.047774695 = weight(_text_:und in 4081) [ClassicSimilarity], result of:
      0.047774695 = score(doc=4081,freq=20.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.3099608 = fieldWeight in 4081, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.03125 = fieldNorm(doc=4081)
    0.047762994 = weight(_text_:https in 4081) [ClassicSimilarity], result of:
      0.047762994 = score(doc=4081,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.17428243 = fieldWeight in 4081, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.03125 = fieldNorm(doc=4081)
  0.5 = coord(2/4)
```
Abstract

Die Arbeit analysiert die dynamische Entwicklung und den Gebrauch von Thesaurusbegriffen. Zusätzlich konzentriert sie sich auf die Faktoren, die die Zahl von Indexbegriffen pro Dokument oder Zeitschrift beeinflussen. Als Untersuchungsobjekt dienten der MeSH und die entsprechende Datenbank "MEDLINE". Die wichtigsten Konsequenzen sind: 1. Der MeSH-Thesaurus hat sich durch drei unterschiedliche Phasen jeweils logarithmisch entwickelt. Solch einen Thesaurus sollte folgenden Gleichung folgen: "T = 3.076,6 Ln (d) - 22.695 + 0,0039d" (T = Begriffe, Ln = natürlicher Logarithmus und d = Dokumente). Um solch einen Thesaurus zu konstruieren, muss man demnach etwa 1.600 Dokumente von unterschiedlichen Themen des Bereiches des Thesaurus haben. Die dynamische Entwicklung von Thesauri wie MeSH erfordert die Einführung eines neuen Begriffs pro Indexierung von 256 neuen Dokumenten. 2. Die Verteilung der Thesaurusbegriffe erbrachte drei Kategorien: starke, normale und selten verwendete Headings. Die letzte Gruppe ist in einer Testphase, während in der ersten und zweiten Kategorie die neu hinzukommenden Deskriptoren zu einem Thesauruswachstum führen. 3. Es gibt ein logarithmisches Verhältnis zwischen der Zahl von Index-Begriffen pro Aufsatz und dessen Seitenzahl für die Artikeln zwischen einer und einundzwanzig Seiten. 4. Zeitschriftenaufsätze, die in MEDLINE mit Abstracts erscheinen erhalten fast zwei Deskriptoren mehr. 5. Die Findablity der nicht-englisch sprachigen Dokumente in MEDLINE ist geringer als die englische Dokumente. 6. Aufsätze der Zeitschriften mit einem Impact Factor 0 bis fünfzehn erhalten nicht mehr Indexbegriffe als die der anderen von MEDINE erfassten Zeitschriften. 7. In einem Indexierungssystem haben unterschiedliche Zeitschriften mehr oder weniger Gewicht in ihrem Findability. Die Verteilung der Indexbegriffe pro Seite hat gezeigt, dass es bei MEDLINE drei Kategorien der Publikationen gibt. Außerdem gibt es wenige stark bevorzugten Zeitschriften."

Content

Vgl.: https://www.ibi.hu-berlin.de/de/archiv/forschung/prom_habil/dissertationen/Tavakolizadeh-Ravari2007. Vgl. auch: http://mravari.blogfa.com/post-20.aspxgl.

Footnote

Dissertation, Humboldt-Universität zu Berlin - Institut für Bibliotheks- und Informationswissenschaft.

Imprint

Berlin : Humboldt-Universität zu Berlin / Institut für Bibliotheks- und Informationswissenschaft

Theme

Konzeption und Anwendung des Prinzips Thesaurus

Karpathy, A.; Fei-Fei, L.: Deep visual-semantic alignments for generating image descriptions (2015) 0.05

0.04715301 = product of:
  0.09430602 = sum of:
    0.022661526 = weight(_text_:und in 2868) [ClassicSimilarity], result of:
      0.022661526 = score(doc=2868,freq=2.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.14702731 = fieldWeight in 2868, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.046875 = fieldNorm(doc=2868)
    0.07164449 = weight(_text_:https in 2868) [ClassicSimilarity], result of:
      0.07164449 = score(doc=2868,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.26142365 = fieldWeight in 2868, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.046875 = fieldNorm(doc=2868)
  0.5 = coord(2/4)

Content: Vgl. auch: http://cs.stanford.edu/people/karpathy/cvpr2015.pdf und http://cs.stanford.edu/people/karpathy/deepimagesent/. Vgl. auch: https://news.ycombinator.com/item?id=8621658.

Strobel, S.: Englischsprachige Erweiterung des TIB / AV-Portals : Ein GND/DBpedia-Mapping zur Gewinnung eines englischen Begriffssystems (2014) 0.04
```
0.039294176 = product of:
  0.07858835 = sum of:
    0.018884607 = weight(_text_:und in 3876) [ClassicSimilarity], result of:
      0.018884607 = score(doc=3876,freq=2.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.12252277 = fieldWeight in 3876, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.0390625 = fieldNorm(doc=3876)
    0.05970374 = weight(_text_:https in 3876) [ClassicSimilarity], result of:
      0.05970374 = score(doc=3876,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.21785304 = fieldWeight in 3876, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0390625 = fieldNorm(doc=3876)
  0.5 = coord(2/4)
```
Abstract

Die Videos des TIB / AV-Portals werden mit insgesamt 63.356 GND-Sachbegriffen aus Naturwissenschaft und Technik automatisch verschlagwortet. Neben den deutschsprachigen Videos verfügt das TIB / AV-Portal auch über zahlreiche englischsprachige Videos. Die GND enthält zu den in der TIB / AV-Portal-Wissensbasis verwendeten Sachbegriffen nur sehr wenige englische Bezeichner. Es fehlt demnach ein englisches Indexierungsvokabular, mit dem die englischsprachigen Videos automatisch verschlagwortet werden können. Die Lösung dieses Problems sieht wie folgt aus: Die englischen Bezeichner sollen über ein Mapping der GND-Sachbegriffe auf andere Datensätze gewonnen werden, die eine englische Übersetzung der Begriffe enthalten. Die verwendeten Mappingstrategien nutzen die DBpedia, LCSH, MACS-Ergebnisse sowie den WTI-Thesaurus. Am Ende haben 35.025 GND-Sachbegriffe (mindestens) einen englischen Bezeichner ermittelt bekommen. Diese englischen Bezeichner können für die automatische Verschlagwortung der englischsprachigen Videos unmittelbar herangezogen werden. 11.694 GND-Sachbegriffe konnten zwar nicht ins Englische "übersetzt", aber immerhin mit einem Oberbegriff assoziiert werden, der eine englische Übersetzung hat. Diese Assoziation dient der Erweiterung der Suchergebnisse.

Content

Beitrag als ausgearbeitete Form eines Vortrages während des 103. Deutschen Bibliothekartages in Bremen. Vgl.: https://www.o-bib.de/article/view/2014H1S197-204.

Hauer, M.: Tiefenindexierung im Bibliothekskatalog : 17 Jahre intelligentCAPTURE (2019) 0.04

0.035822246 = product of:
  0.14328898 = sum of:
    0.14328898 = weight(_text_:https in 629) [ClassicSimilarity], result of:
      0.14328898 = score(doc=629,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.5228473 = fieldWeight in 629, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.09375 = fieldNorm(doc=629)
  0.25 = coord(1/4)

Content: Vgl.: https://www.b-i-t-online.de/heft/2019-02-index.php.

Oliver, C.: Leveraging KOS to extend our reach with automated processes (2021) 0.02

0.023881497 = product of:
  0.09552599 = sum of:
    0.09552599 = weight(_text_:https in 1723) [ClassicSimilarity], result of:
      0.09552599 = score(doc=1723,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.34856486 = fieldWeight in 1723, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0625 = fieldNorm(doc=1723)
  0.25 = coord(1/4)

Content: Vgl.: https://doi.org/10.1080/01639374.2021.2023717.

Thönssen, B.: Automatische Indexierung und Schnittstellen zu Thesauri (1988) 0.02

0.023128824 = product of:
  0.0925153 = sum of:
    0.0925153 = weight(_text_:und in 29) [ClassicSimilarity], result of:
      0.0925153 = score(doc=29,freq=12.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.60023654 = fieldWeight in 29, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.078125 = fieldNorm(doc=29)
  0.25 = coord(1/4)

Abstract: Über eine Schnittstelle zwischen Programmen zur automatischen Indexierung (PRIMUS-IDX) und zur maschinellen Thesaurusverwaltung (INDEX) sollen große Textmengen schnell, kostengünstig und konsistent erschlossen und verbesserte Recherchemöglichkeiten geschaffen werden. Zielvorstellung ist ein Verfahren, das auf PCs ablauffähig ist und speziell deutschsprachige Texte bearbeiten kann
Theme: Konzeption und Anwendung des Prinzips Thesaurus

Hauer, M.: Neue Qualitäten in Bibliotheken : Durch Content-Ergänzung, maschinelle Indexierung und modernes Information Retrieval können Recherchen in Bibliothekskatalogen deutlich verbessert werden (2004) 0.02
```
0.022661526 = product of:
  0.0906461 = sum of:
    0.0906461 = weight(_text_:und in 1886) [ClassicSimilarity], result of:
      0.0906461 = score(doc=1886,freq=18.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.58810925 = fieldWeight in 1886, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.0625 = fieldNorm(doc=1886)
  0.25 = coord(1/4)
```
Abstract

Seit Frühjahr 2004 ist Dandelon.com als neues, offenes, internationales Wissenschaftsportal in Betrieb. Erste Retrieval-Tests bescheinigen deutlich bessere Suchergebnisse als in herkömmlichen OPACs oder Verbundsystemen. Seine Daten stammen aus intelligentCAPTURE und Bibliothekskatalogen. intelligentCAPTURE erfasst Content über Scanning oder File-Import oder Web-Spidering und indexiert nach morphosyntaktischen und semantischen Verfahren. Aufbereiteter Content und Indexate gehen an Bibliothekssysteme und an dandelon.com. Dandelon.com ist kostenlos zugänglich für Endbenutzer und ist zugleich Austauschzentrale und Katalogerweiterung für angeschlossene Bibliotheken. Neue Inhalte können so kostengünstig und performant erschlossen werden.

Weidenbach, N.: Werkzeuge zur Evaluierung und Optimierung von Regeln zur Automatischen Indexierung : Anwendungssystementwicklung (1994) 0.02

0.021365494 = product of:
  0.085461974 = sum of:
    0.085461974 = weight(_text_:und in 2836) [ClassicSimilarity], result of:
      0.085461974 = score(doc=2836,freq=4.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.5544748 = fieldWeight in 2836, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.125 = fieldNorm(doc=2836)
  0.25 = coord(1/4)

Imprint: Darmstadt : Fachhochschule, Fachbereich Information und Dokumentation

Experimentelles und praktisches Information Retrieval : Festschrift für Gerhard Lustig (1992) 0.02
```
0.021197917 = product of:
  0.08479167 = sum of:
    0.08479167 = weight(_text_:und in 72) [ClassicSimilarity], result of:
      0.08479167 = score(doc=72,freq=28.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.55012584 = fieldWeight in 72, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.046875 = fieldNorm(doc=72)
  0.25 = coord(1/4)
```
Content

Enthält die Beiträge: SALTON, G.: Effective text understanding in information retrieval; KRAUSE, J.: Intelligentes Information retrieval; FUHR, N.: Konzepte zur Gestaltung zukünftiger Information-Retrieval-Systeme; HÜTHER, H.: Überlegungen zu einem mathematischen Modell für die Type-Token-, die Grundform-Token und die Grundform-Type-Relation; KNORZ, G.: Automatische Generierung inferentieller Links in und zwischen Hyperdokumenten; KONRAD, E.: Zur Effektivitätsbewertung von Information-Retrieval-Systemen; HENRICHS, N.: Retrievalunterstützung durch automatisch generierte Wortfelder; LÜCK, W., W. RITTBERGER u. M. SCHWANTNER: Der Einsatz des Automatischen Indexierungs- und Retrieval-System (AIR) im Fachinformationszentrum Karlsruhe; REIMER, U.: Verfahren der Automatischen Indexierung. Benötigtes Vorwissen und Ansätze zu seiner automatischen Akquisition: Ein Überblick; ENDRES-NIGGEMEYER, B.: Dokumentrepräsentation: Ein individuelles prozedurales Modell des Abstracting, des Indexierens und Klassifizierens; SEELBACH, D.: Zur Entwicklung von zwei- und mehrsprachigen lexikalischen Datenbanken und Terminologiedatenbanken; ZIMMERMANN, H.: Der Einfluß der Sprachbarrieren in Europa und Möglichkeiten zu ihrer Minderung; LENDERS, W.: Wörter zwischen Welt und Wissen; PANYR, J.: Frames, Thesauri und automatische Klassifikation (Clusteranalyse): HAHN, U.: Forschungsstrategien und Erkenntnisinteressen in der anwendungsorientierten automatischen Sprachverarbeitung. Überlegungen zu einer ingenieurorientierten Computerlinguistik; KUHLEN, R.: Hypertext und Information Retrieval - mehr als Browsing und Suche.
Stock, M.: Textwortmethode und Übersetzungsrelation : Eine Methode zum Aufbau von kombinierten Literaturnachweis- und Terminologiedatenbanken (1989) 0.02
```
0.02111363 = product of:
  0.08445452 = sum of:
    0.08445452 = weight(_text_:und in 399) [ClassicSimilarity], result of:
      0.08445452 = score(doc=399,freq=10.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.54793847 = fieldWeight in 399, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.078125 = fieldNorm(doc=399)
  0.25 = coord(1/4)
```
Abstract

Geisteswissenschaftliche Fachinformation erfordert eine enge Kooperation zwischen Literaturnachweis- und Terminologieinformationssystemen. Eine geeignete Dokumentationsmethode für die Auswertung geisteswissen- schaftlicher Literatur ist die Textwortwethode. Dem originalsprachig aufgenommenen Begriffsrepertoire ist ein einheitssprachiger Zugriff beizuordnen, der einerseits ein vollständiges und genaues Retrieval garantiert und andererseits den Aufbau fachspezifischer Wörterbücher vorantreibt

Ma, N.; Zheng, H.T.; Xiao, X.: ¬An ontology-based latent semantic indexing approach using long short-term memory networks (2017) 0.02

0.02110846 = product of:
  0.08443384 = sum of:
    0.08443384 = weight(_text_:https in 4810) [ClassicSimilarity], result of:
      0.08443384 = score(doc=4810,freq=4.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.30809072 = fieldWeight in 4810, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0390625 = fieldNorm(doc=4810)
  0.25 = coord(1/4)

Content: Vgl.: https://link.springer.com/chapter/10.1007/978-3-319-63579-8_15. DOI: https://doi.org/10.1007/978-3-319-63579-8_15.

Toepfer, M.; Seifert, C.: Content-based quality estimation for automatic subject indexing of short texts under precision and recall constraints 0.02

0.02110846 = product of:
  0.08443384 = sum of:
    0.08443384 = weight(_text_:https in 309) [ClassicSimilarity], result of:
      0.08443384 = score(doc=309,freq=4.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.30809072 = fieldWeight in 309, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0390625 = fieldNorm(doc=309)
  0.25 = coord(1/4)

Content: This is an authors' manuscript version of a paper accepted for proceedings of TPDL-2018, Porto, Portugal, Sept 10-13. The nal authenticated publication is available online at https://doi.org/will be added as soon as available.
Source: https://arxiv.org/abs/1806.02743

Ahmed, M.: Automatic indexing for agriculture : designing a framework by deploying Agrovoc, Agris and Annif (2023) 0.02
```
0.02110846 = product of:
  0.08443384 = sum of:
    0.08443384 = weight(_text_:https in 2026) [ClassicSimilarity], result of:
      0.08443384 = score(doc=2026,freq=4.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.30809072 = fieldWeight in 2026, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0390625 = fieldNorm(doc=2026)
  0.25 = coord(1/4)
```
Abstract

There are several ways to employ machine learning for automating subject indexing. One popular strategy is to utilize a supervised learning algorithm to train a model on a set of documents that have been manually indexed by subject matter using a standard vocabulary. The resulting model can then predict the subject of new and previously unseen documents by identifying patterns learned from the training data. To do this, the first step is to gather a large dataset of documents and manually assign each document a set of subject keywords/descriptors from a controlled vocabulary (e.g., from Agrovoc). Next, the dataset (obtained from Agris) can be divided into - i) a training dataset, and ii) a test dataset. The training dataset is used to train the model, while the test dataset is used to evaluate the model's performance. Machine learning can be a powerful tool for automating the process of subject indexing. This research is an attempt to apply Annif (http://annif. org/), an open-source AI/ML framework, to autogenerate subject keywords/descriptors for documentary resources in the domain of agriculture. The training dataset is obtained from Agris, which applies the Agrovoc thesaurus as a vocabulary tool (https://www.fao.org/agris/download).

Content

Vgl.: https://www.researchgate.net/publication/370750951_Automatic_Indexing_for_Agriculture_Designing_a_Framework_by_Deploying_Agrovoc_Agris_and_Annif.
Kumpe, D.: Methoden zur automatischen Indexierung von Dokumenten (2006) 0.02
```
0.020901429 = product of:
  0.083605714 = sum of:
    0.083605714 = weight(_text_:und in 1782) [ClassicSimilarity], result of:
      0.083605714 = score(doc=1782,freq=20.0), product of:
        0.1541314 = queryWeight, product of:
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.06949432 = queryNorm
        0.5424314 = fieldWeight in 1782, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.217899 = idf(docFreq=13141, maxDocs=44421)
          0.0546875 = fieldNorm(doc=1782)
  0.25 = coord(1/4)
```
Abstract

Diese Diplomarbeit handelt von der Indexierung von unstrukturierten und natürlichsprachigen Dokumenten. Die zunehmende Informationsflut und die Zahl an veröffentlichten wissenschaftlichen Berichten und Büchern machen eine maschinelle inhaltliche Erschließung notwendig. Um die Anforderungen hierfür besser zu verstehen, werden Probleme der natürlichsprachigen schriftlichen Kommunikation untersucht. Die manuellen Techniken der Indexierung und die Dokumentationssprachen werden vorgestellt. Die Indexierung wird thematisch in den Bereich der inhaltlichen Erschließung und des Information Retrieval eingeordnet. Weiterhin werden Vor- und Nachteile von ausgesuchten Algorithmen untersucht und Softwareprodukte im Bereich des Information Retrieval auf ihre Arbeitsweise hin evaluiert. Anhand von Beispiel-Dokumenten werden die Ergebnisse einzelner Verfahren vorgestellt. Mithilfe des Projekts European Migration Network werden Probleme und grundlegende Anforderungen an die Durchführung einer inhaltlichen Erschließung identifiziert und Lösungsmöglichkeiten vorgeschlagen.

Imprint

Berlin : Technische Universität Berlin / Institut für Softwaretechnik und Theoretische Informatik, Computergestützte Informationssysteme

Wolfe, EW.: a case study in automated metadata enhancement : Natural Language Processing in the humanities (2019) 0.02

0.02089631 = product of:
  0.08358524 = sum of:
    0.08358524 = weight(_text_:https in 236) [ClassicSimilarity], result of:
      0.08358524 = score(doc=236,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.30499426 = fieldWeight in 236, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0546875 = fieldNorm(doc=236)
  0.25 = coord(1/4)

Content: Vgl.: https://journal.code4lib.org/articles/14834.

Short, M.: Text mining and subject analysis for fiction; or, using machine learning and information extraction to assign subject headings to dime novels (2019) 0.02

0.02089631 = product of:
  0.08358524 = sum of:
    0.08358524 = weight(_text_:https in 481) [ClassicSimilarity], result of:
      0.08358524 = score(doc=481,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.30499426 = fieldWeight in 481, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0546875 = fieldNorm(doc=481)
  0.25 = coord(1/4)

Content: Vgl.: https://doi.org/10.1080/01639374.2019.1653413.

Moulaison-Sandy, H.; Adkins, D.; Bossaller, J.; Cho, H.: ¬An automated approach to describing fiction : a methodology to use book reviews to identify affect (2021) 0.02

0.02089631 = product of:
  0.08358524 = sum of:
    0.08358524 = weight(_text_:https in 1711) [ClassicSimilarity], result of:
      0.08358524 = score(doc=1711,freq=2.0), product of:
        0.27405512 = queryWeight, product of:
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.06949432 = queryNorm
        0.30499426 = fieldWeight in 1711, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9435613 = idf(docFreq=2339, maxDocs=44421)
          0.0546875 = fieldNorm(doc=1711)
  0.25 = coord(1/4)

Content: Vgl.: https://doi.org/10.1080/01639374.2021.1992694.

Search (199 results, page 2 of 10)

Authors

Years

Languages

Types

Themes

Subjects

Classifications