Die DAS-PODCAST-UFO Podcast-Wortanalyse

Aus Pufopedia
Version vom 7. Juni 2025, 13:13 Uhr von Schlümaas (Diskussion | Beiträge) (Seite erstellen)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Die DAS PODCAST UFO Podcast-Wortanalyse ist ein Tool zur Schlagwortsuche in Podcast-Folgen. Erreichbar ist das Tool unter https://pufo-words.streamlit.app.

Technologie

Die technische Umsetzung der Datenanalyse basiert auf einem mehrstufigen Verarbeitungsprozess:

Zunächst wurden alle verfügbaren Podcast-Folgen über den RSS-Feed im MP3-Format heruntergeladen. Anschließend kam das OpenAI-Tool Whisper zum Einsatz, um die Audiodateien in Textform zu transkribieren. Die so gewonnenen Transkripte wurden mit der NLP-Bibliothek spaCy weiterverarbeitet. Dabei wurden die Wörter lemmatisiert (auf ihre Grundform zurückgeführt) und statistisch analysiert, etwa durch Wortzählung. Dies ermöglicht eine effiziente und flexible Suchfunktion, unabhängig von Wortbeugungen. Schließlich wurden alle Daten in eine benutzerfreundliche Streamlit-App eingebunden.