Text in Sprache – Text2speech auf der Ubuntu 20.04 Kommandozeile
Unter Ubuntu kann man verschiedene gratis, teils open source tools verwenden um text in Sprache umzusetzen. Ich verwende dies zum Beispiel für einen Asterisk-basierten Alarmserver, der hochskalierend hunderte Personen über ein Schadensereignis informieren kann. Dies funktioniert dann über eine Me…
Unter Ubuntu kann man verschiedene gratis, teils open source tools verwenden um text in Sprache umzusetzen. Ich verwende dies zum Beispiel für einen Asterisk-basierten Alarmserver, der hochskalierend hunderte Personen über ein Schadensereignis informieren kann. Dies funktioniert dann über eine Menüführung (IVR) und dem Vorlesen des Schadensereignisses.
Mein aktuelles Tool der Wahl ist SVOX – Pico TTS.
eSpeak
eSpeak ist eine kostenlose und Open Source Software, die zur Umwandlung von Text in Sprache (Deutsch, Englisch, etc.) verwendet werden kann. Sie kann auf Windows- und Linux-basierten Betriebssystemen installiert werden. eSpeak nimmt Eingaben aus der Zeichenkette oder Dateien entgegen und erzeugt eine Datei im Audioformat.
Installation
sudo apt install -y espeak
Anwendung
espeak "Hallo und willkommen bei blog.wermescher.com." -w espeak.wav -g 10 -p 70 -s 150 -v de-DE
-g Pause zwischen den Wörtern in ms
-p Pitch adjustment
-s Geschwindigkeit in ungefähren Worten pro Minute. Der Standardwert ist 175
eSpeak NG
Der eSpeak NG ist ein kompakter Open-Source-Software Text-to-Speech-Synthesizer für Linux, Windows, Android und andere Betriebssysteme. Er unterstützt mehr als 100 Sprachen und Akzente und basiert auf der von Jonathan Duddington entwickelten eSpeak-Engine.
eSpeak NG verwendet eine „formant-Synthese“-Methode. Dadurch können viele Sprachen auf kleinem Raum zur Verfügung gestellt werden. Die Sprache ist klar und kann mit hoher Geschwindigkeit verwendet werden, ist aber nicht so natürlich und flüssig wie größere Synthesizer, die auf menschlichen Sprachaufnahmen basieren.
Installation
sudo apt install -y espeak-ng espeak-ng-espeak mbrola
Anwendung
Die Kommandozeile ist praktisch die gleiche wie bei espeak:
espeak-ng "Hallo und willkommen bei blog.wermescher.com." -w espeak-ng.wav -g 10 -p 70 -s 150 -v de-DE
espeak-ng -vde -f text2speech_input.txt -w espeak-ng.wav
Festival
Auch Festival ist ein text-to-speech system. Die Letzte Version ist schon etwas älter aus dem Jahre 2014
Installation
sudo apt install -y festival festival-doc festival-freebsoft-utils
Anwendung
text2wave text2speech_input.txt -o festival.wav
SVOX – Pico TTS
Mein Favorit (im Jahre 2021) ist nach wie vor das SVOX – Pico TTS system. SVOX wurde 2011 von Nuance gekauft.
Installation
sudo apt install -y libttspico-utils sox
Anwendung
pico2wave —lang de-DE —wave pico2wave.wav “Hallo und willkommen zu der Firma DevLabs mit der Ei-Pi Adresse 10 Punkt 7 Punkt 5 Punkt 34”
Mehr aus „Linux, DevOps & Systeme"
Bash Strict Mode - robustere Shell-Skripte mit drei Zeilen
set -euo pipefail erklaert - warum diese drei Optionen Shell-Skripte deutlich verlaesslicher machen.
WeiterlesenZip, Unzip, Tar unter Linux – Kurz und bündig
Ordner komprimieren mittels zip Wechsle zunächst in das Verzeichnis über dem zu komprimierenden Ordner. Folgender Befehl komprimiert alle in dem Verzeichnis data sowie Unterverzeichnis enthaltenen Dateien: Parameters: Unzip 7zip Unter Ubuntu installieren Unter Windows installieren: Herunterladen…
WeiterlesenGoogle Gson in a nutshell
JsonObject vs JsonArray Create a JsonObject Create a JsonArray Iterate / Loop through all JsonObjects inside a JsonObject Iterate / Loop through all JsonElements inside a JsonArray Parse String into JsonObject Add a list of strings Parse from json file Get info from object Print out json Compact…
WeiterlesenÜber diesen Blog
Ein Sammelsurium an Denkanstößen.
Hier sammle ich Wissen, Argumente und Links zu allem, was mich beschäftigt — von Technik über Küche bis Nachhaltigkeit. Beruflich berate ich zu Cybersecurity.