Semantic Scholar
| Semantic Scholar | |
| Suchmaschine für wissenschaftliche Literatur | |
| Gründer | Allen Institute for Artificial Intelligence |
|---|---|
| Online | seit 2. Nov. 2015 |
| https://semanticscholar.org | |
Semantic Scholar ist ein Recherchetool für wissenschaftliche Literatur. Es wurde am Allen Institute for AI entwickelt und im 2. November 2015 veröffentlicht.[1][2] Semantic Scholar nutzt moderne Techniken der Verarbeitung natürlicher Sprache, um zum Beispiel den Forschungsprozess durch die Bereitstellung automatisch generierter Zusammenfassungen wissenschaftlicher Arbeiten, zu unterstützen.[3] Das Semantic Scholar‑Team erforscht aktiv den Einsatz von künstlicher Intelligenz in den Bereichen natürliche Sprachverarbeitung, maschinelles Lernen, Mensch-Computer-Interaktion und Information Retrieval.[4]
Semantic Scholar begann als Datenbank für die Fachgebiete Informatik, Geowissenschaften und Neurowissenschaften.[5] Im Jahr 2017 begann das System, auch biomedizinische Literatur in seinen Bestand aufzunehmen.[5] Stand September 2022 umfasst es über 200 Millionen Veröffentlichungen aus allen Bereichen der Wissenschaft.[6]
Technologie
[Bearbeiten | Quelltext bearbeiten]Semantic Scholar bietet eine Ein-Satz‑Zusammenfassung wissenschaftlicher Literatur. Eines seiner Ziele war es, die Herausforderung zu bewältigen, zahlreiche Titel und lange Abstracts auf mobilen Geräten zu lesen.[7] Es soll außerdem sicherstellen, dass die drei Millionen wissenschaftlichen Arbeiten, die jährlich veröffentlicht werden, die Leser erreichen, da geschätzt wird, dass nur etwa die Hälfte dieser Literatur jemals gelesen wird.[8]
Künstliche Intelligenz wird eingesetzt, um das Wesentliche eines Papers zu erfassen, indem es mithilfe einer sogenannten „abstraktiven“ Technik generiert wird.[3] Das Projekt nutzt eine Kombination aus maschinellem Lernen, natürlicher Sprachverarbeitung und Maschinelles Sehen, um den traditionellen Methoden der Zitatanalyse eine semantische Analyseebene hinzuzufügen und relevante Abbildungen (englisch figures), Tabellen, Entitäten und Publikationsorte (englisch venues from papers) aus Artikeln zu extrahieren.[9][10]
Eine weitere wichtige KI‑gestützte Funktion sind die Research Feeds (deutsch Forschungs-Feeds), ein adaptives Forschungsempfehlungssystem, das mithilfe von KI schnell lernt, welche Artikel Nutzer interessieren, und die neuesten Forschungsergebnisse empfiehlt, damit Wissenschaftler auf dem aktuellen Stand bleiben. Dabei wird ein Paper‑Embedding‑Modell (deutsch Dokumenten‑Einbettungsmodell) verwendet, das mit kontrastivem Lernen trainiert wurde, um Artikel zu finden, die denen in jedem Bibliotheksordner ähnlich sind.[11]
Semantic Scholar bietet außerdem den Semantic Reader, einen erweiterten Reader mit dem Potenzial, das wissenschaftliche Lesen zu revolutionieren, indem er zugänglicher und kontextreicher wird.[12] Der Semantic Reader bietet in-line Zitationskarten die mit von TLDR (kurz für: „Too Long, Didn’t Read“) automatisch generierte kurz Zusammenfasusungen und Hervorhebungen befüllt sind und die wichtigsten Punkte eines Artikels erfassen, sodass ein Leser die Inhalte schneller aufnehmen kann.
Im Gegensatz zu Google Scholar und PubMed ist Semantic Scholar darauf ausgelegt, die wichtigsten und einflussreichsten Elemente eines Artikels hervorzuheben.[13] Die KI‑Technologie ist darauf ausgelegt, verborgene Verbindungen und Zusammenhänge zwischen Forschungsthemen zu erkennen.[14] Wie die zuvor genannten Suchmaschinen nutzt auch Semantic Scholar Graphstrukturen, darunter den Microsoft Academic Knowledge Graph, Springer Nature's SciGraph und den Semantic Scholar Corpus (ursprünglich ein Korpus von 45 Millionen Artikeln aus Informatik, Neurowissenschaften und Biomedizin).[15][16]
Artikelidentifikator
[Bearbeiten | Quelltext bearbeiten]Jede von Semantic Scholar gehostete Veröffentlichung erhält eine eindeutige Kennung, die als Semantic Scholar Corpus ID (Kurz: S2CID) bezeichnet wird. Der folgende Eintrag ist ein Beispiel:
Ying Liu, Albert A Gayle, Annelies Wilder-Smith, Joacim Rocklöv: The reproductive number of COVID-19 is higher compared to SARS coronavirus. In: Journal of Travel Medicine. Band 27, Nr. 2, März 2020, S2CID: 211099356, doi:10.1093/jtm/taaa021, PMID 32052846 (englisch).
Indexierung
[Bearbeiten | Quelltext bearbeiten]Semantic Scholar ist frei zugänglich und Indexiert (durchsucht) im Gegensatz zu ähnlichen Suchmaschinen (z. B. Google Scholar) keine Inhalte, die hinter einer Paywall liegen.[5]
Eine Studie verglich den Umfang der Indexierung von Semantic Scholar mit dem von Google Scholar und stellte fest, dass für die von Sekundärstudien in der Informatik zitierten Arbeiten beide Indizes eine vergleichbare Abdeckung aufwiesen und jeweils nur eine Handvoll der Arbeiten fehlte.[17]
Anzahl der Nutzer und Publikationen
[Bearbeiten | Quelltext bearbeiten]Mit Stand Januar 2018, nach abschluss eines Projekt aus dem Jahr 2017, durch das biomedizinische Fachartikel und Themenzusammenfassungen hinzugefügt wurden, umfasste der Semantic-Scholar-Korpus mehr als 40 Millionen Fachartikel aus den Bereichen Informatik und Biomedizin.[18] Im März 2018 wurde Doug Raymond, der die Machine-Learning-Initiativen für die Amazon-Alexa-Plattform entwickelt hatte, eingestellt, um das Semantic-Scholar-Projekt zu leiten.[19] Bis August 2019 war die Anzahl der enthaltenen Metadaten zu wissenschaftlichen Arbeiten (nicht die eigentlichen PDFs) nach der Ergänzung der Datensätze des Microsoft Academic Graph auf mehr als 173 Millionen angewachsen.[20][21] Im Jahr 2020 machte eine Partnerschaft zwischen Semantic Scholar und dem University of Chicago Press Journals alle unter der University of Chicago Press veröffentlichten Artikel im Semantic-Scholar-Korpus verfügbar.[22] Ende 2020 hatte Semantic Scholar 190 Millionen Arbeiten indexiert.[23] Ebenfalls im Jahr 2020 erreichte Semantic Scholar sieben Millionen Nutzer pro Monat.[7]
Siehe auch
[Bearbeiten | Quelltext bearbeiten]Weblinks
[Bearbeiten | Quelltext bearbeiten]Einzelnachweise
[Bearbeiten | Quelltext bearbeiten]- ↑ Nicola Jones: Artificial-intelligence institute launches free science search engine. In: Springer Nature Limited (Hrsg.): Nature. 2. November 2015, ISSN 1476-4687, S2CID: 182440976, doi:10.1038/nature.2015.18703 (englisch).
- ↑ Ariana Eunjung Cha: Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try. In: The Washington Post. 3. November 2015 (englisch, archive.org [abgerufen am 5. Mai 2026]).
- 1 2 Karen Hao: An AI helps you summarize the latest in AI. In: MIT Technology Review. 18. November 2020, abgerufen am 7. Mai 2026 (englisch).
- ↑ Semantic Scholar Research. In: https://allenai.org/about. Allen Institute for Artificial Intelligence, 22. November 2021, abgerufen am 7. Mai 2026 (englisch).
- 1 2 3 Suzanne Fricke: Semantic Scholar. In: Journal of the Medical Library Association. Band 106, Nr. 1, 12. Januar 2018, ISSN 1558-9439, S2CID: 45802944, S. 145–147, doi:10.5195/jmla.2018.280, PMC 5764585 (freier Volltext) – (englisch).
- ↑ David Matthews: Drowning in the literature? These smart software tools can help. In: Springer Nature Limited (Hrsg.): Nature. Band 597, 1. September 2021, S. 141–142, doi:10.1038/d41586-021-02346-4 (englisch, nature.com [abgerufen am 7. Mai 2026]): “...the publicly available corpus compiled by Semantic Scholar – a tool set up in 2015 by the Allen Institute for Artificial Intelligence in Seattle, Washington – amounting to around 200 million articles, including preprints.”
- 1 2 Peter Grad: AI tool summarizes lengthy papers in a sentence. Tech Xplore, 24. November 2020, abgerufen am 13. Mai 2026 (englisch).
- ↑ Kyle Wiggers: Allen Institute's Semantic Scholar now searches across 175 million academic papers. VentureBeat, 23. Oktober 2019, abgerufen am 13. Mai 2026 (amerikanisches Englisch).
- ↑ John Bohannon: A computer program just ranked the most influential brain scientists of the modern era. In: American Association for the Advancement of Science (Hrsg.): Science. 11. November 2016, doi:10.1126/science.aal0371 (englisch, science.org [abgerufen am 13. Mai 2026]).
- ↑ Christopher Clark; Santosh Divvala: PDFFigures 2.0: Mining figures from research papers. In: IEEE/ACM (Hrsg.): IEEE Xplore. 2016 (englisch, ieee.org [abgerufen am 13. Mai 2026] Proceedings of the 16th ACM/IEEE-CS on Joint Conference on Digital Libraries – JCDL '16).
- ↑ Semantic Scholar | Frequently Asked Questions. In: semanticscholar.org. Ai2, abgerufen am 13. Mai 2026 (englisch).
- ↑ Semantic Scholar | Semantic Reader. In: Semantic Scholar. Ai2, abgerufen am 13. Mai 2026 (englisch).
- ↑ Semantic Scholar. In: International Journal of Language and Literary Studies. Tawasul International Centre for Publishing, Research and Dialogue, 5. Januar 2020, abgerufen am 13. Mai 2026.
- ↑ Svetla Baykoucheva: Driving Science Information Discovery in the Digital Age. Hrsg.: Chandos Publishing. 2021, ISBN 978-0-12-823724-3, S. 91 (englisch).
- ↑ Joemon M. Jose, Emine Yilmaz, João Magalhães, Pablo Castells, Nicola Ferro, Mário J. Silva, Flávio Martins: Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I. Hrsg.: Springer Nature. Cham, Switzerland 2020, ISBN 978-3-03045438-8, S. 254 (englisch).
- ↑ Waleed Ammar: Open Research Corpus. In: Semantic Scholar Lab Open Research Corpus. 2019, abgerufen am 13. Mai 2026 (englisch).
- ↑ Abdelhakim Hannousse: Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role. In: The Institution of Engineering and Technology (Hrsg.): IET Software. Band 15, Nr. 1, 2021, ISSN 1751-8814, S2CID: 234053002, S. 126–146, doi:10.1049/sfw2.12011 (englisch).
- ↑ Alan Boyle: AI2 scales up Semantic Scholar search engine to encompass biomedical research. GeekWire, 17. Oktober 2017, abgerufen am 13. Mai 2026 (amerikanisches Englisch).
- ↑ Clare McGrane: Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More. GeekWire, 1. Mai 2018, abgerufen am 13. Mai 2026 (amerikanisches Englisch).
- ↑ Semantic Scholar. In: Semantic Scholar. AI2, abgerufen am 13. Mai 2026 (englisch).
- ↑ Alan Boyle: AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies. GeekWire, 5. Dezember 2018, abgerufen am 13. Mai 2026 (amerikanisches Englisch).
- ↑ The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability. In: The University of Chicago press journals. Abgerufen am 13. Mai 2026 (englisch).
- ↑ Adriana Dunn: Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships. In: Semantic Scholar. 14. Dezember 2020, abgerufen am 13. Mai 2026 (englisch).

