Ein Forschungsteam der New York University hat einen Vorverarbeitungsschritt für große Sprachmodelle (LLMs) entwickelt. Ziel ist, die Eingabe für die KI kürzer, vielfältiger und repräsentativer zu machen.
Die Methode bereinigt zuerst Sätze, hält vor allem Nomen, Verben und Adjektive und verbindet mehrteilige Begriffe. Dann werden Sätze in Zahlenräume umgewandelt und nach Wichtigkeit bewertet. Anschließend ordnen sich ähnliche Sätze wie in einem Schwarm zu Gruppen, und aus jeder Gruppe werden die besten Sätze ausgewählt. Diese Sätze werden neu geordnet und an ein LLM gegeben, das daraus eine flüssige, quellengestützte Zusammenfassung erstellt. Der Ansatz wurde an über 9.000 Dokumenten getestet.
Schwierige Wörter
- vorverarbeitungsschritt — Ein Arbeitsschritt, der Daten vorbearbeitet.
- sprachmodell — Ein Computerprogramm, das Sprache verarbeitet.Sprachmodelle
- bereinigen — Fehler oder unnötige Teile entfernen.bereinigt
- mehrteilig — Aus mehreren Teilen zusammengesetzt oder bestehend.mehrteilige
- zahlenraum — Ein Raum für Zahlen im Computer.Zahlenräume
- schwarm — Viele ähnliche Dinge, die zusammen sind.
- quellengestützt — Mit Informationen aus bestimmten Quellen belegt.quellengestützte
Tipp: Fahre über markierte Wörter oder tippe darauf, um kurze Definitionen zu sehen – während du liest oder zuhörst.
Diskussionsfragen
- Findest du es wichtig, dass eine Zusammenfassung Quellen nennt? Warum?
- Glaubst du, dass kürzere Eingaben für eine KI nützlicher sind? Warum oder warum nicht?
- Welche Wortart (Nomen, Verb, Adjektiv) ist dir beim Schreiben am wichtigsten? Nenne eine.
Verwandte Artikel
Wintersturm gefährdet Stromnetze im Osten der USA
Ein massiver Wintersturm mit Eis und gefrierendem Regen hat in mehreren US-Bundesstaaten mehr als eine Million Kunden ohne Strom gelassen. Behörden, Energieversorger und Forschende prüfen jetzt Schäden und wie die Netze widerstandsfähiger werden können.
Wissenschaftsjournalismus in der Pandemie
Ein globaler Bericht untersucht, wie die COVID-19-Pandemie die Arbeit von Wissenschaftsjournalistinnen und -journalisten veränderte. Befragt wurden Journalistinnen und Journalisten aus vielen Ländern; die Arbeit wurde intensiver und Preprints wurden häufiger genutzt.
Metaboliten in Millionen Jahre alten Fossilien
Forschende extrahierten zum ersten Mal stoffwechselbezogene Moleküle aus fossilen Knochen im Alter von 1,3 bis 3 Millionen Jahren. Die Analysen zeigen Informationen zu Tieren, ihrer Nahrung und deuten auf damals wärmeres, feuchteres Klima hin.
Dopamin stärkt motorisches Lernen im Schlaf
Eine Studie zeigt, dass bestimmte Dopaminneuronen kurz nach dem Erlernen neuer Bewegungen im Non‑REM‑Schlaf aktiv werden. Die synchronisierte Aktivität mit Schlafspindeln stärkt motorische Erinnerungen und verbessert die Leistung nach dem Schlaf.