Zum Inhalt

Startseite

Der Audiominer ist eine Anwendung zur Transkription von Audio-/Videodateien.

Bei der Lösung handelt es sich um eine verteilte und containerisierte Anwendung, die aktuell aus vier unabhängigen Diensten (Mikroservices) besteht, welche über eine Nachrichtenwarteschlange (Redis) miteinander kommunizieren.

Architektur (Dienste)

Transkriptionsdienst (ASR Service)

Dieser Dienst nimmt Anfragen entgegen, erkennt die verwendete Sprache, führt die Transkription mithilfe von Whisper sowie die Sprechertrennung durch und stellt das Ergebnis bereit. Aus Performancegründen ist zu empfehlen diesen Dienst auf einer Maschine mit GPU Unterstützung zu verwenden.

Verzeichnisüberwachungsdienst (FS Watcher)

Dieser Dienst erkennt neue Dateien im geteilten Ordner, leitet sie an den Transkriptionsdienst weiter und legt die fertigen Transkripte am ursprünglichen Speicherort ab.

Benachrichtigungsdienst (Notify Service)

Diese Dienst verschickt E-Mails mit den Transkriptionsergebnissen, sobald diese verfügbar sind und ein Versand vorgesehen ist. Das ist der Fall, wenn der Nutzer eine E-Mail-Adresse über die Oberfläche angegeben hat. Die Ergebnisse werden der E-Mail als Anhang beigefügt.

Weboberfläche (Web Service)

Über die Oberfläche können die zu transkribierenden Dateien hochgeladen werden; diese werden anschließend an der Transkriptionsdienst weitergeleitet. Der Fortschritt der Verarbeitung wird dem Benutzer visualisiert. Sobald der Transkriptionsdienst die Datei verarbeitet hat, stehen die Resultate zum Download bereit. Wenn eine E-Mail-Adresse angegeben wurde, erfolgt zusätzlich die Zustellung der E-Mail über den schon genannten Benachrichtigungsdienst.

Architekturbeispiel