Text in Sprache – Text2speech auf der Ubuntu 20.04 Kommandozeile

Text-to-Speech auf der Ubuntu-Kommandozeile: eSpeak, eSpeak NG, Festival und SVOX Pico TTS installieren und Text in deutsche Sprachausgabe umwandeln.

Von DI Herwart Wermescher, MBA ↗ Veröffentlicht: 27. Februar 2021 Aktualisiert: 14. März 2024

Unter Ubuntu kann man verschiedene gratis, teils open source tools verwenden um text in Sprache umzusetzen. Ich verwende dies zum Beispiel für einen Asterisk-basierten Alarmserver, der hochskalierend hunderte Personen über ein Schadensereignis informieren kann. Dies funktioniert dann über eine Menüführung (IVR) und dem Vorlesen des Schadensereignisses. Wie sich das automatisierte Anrufen umsetzen lässt, zeige ich im Beitrag zu Asterisk Call Files.

Die erzeugten WAV-Dateien lassen sich übrigens gut gemeinsam mit anderer Automatisierung nutzen: Etwa um zusätzlich Telegram-Nachrichten über die Kommandozeile zu verschicken oder um Abläufe grafisch mit Node-RED unter Ubuntu zu verknüpfen.

Mein aktuelles Tool der Wahl ist SVOX – Pico TTS.

eSpeak

eSpeak ist eine kostenlose und Open Source Software, die zur Umwandlung von Text in Sprache (Deutsch, Englisch, etc.) verwendet werden kann. Sie kann auf Windows- und Linux-basierten Betriebssystemen installiert werden. eSpeak nimmt Eingaben aus der Zeichenkette oder Dateien entgegen und erzeugt eine Datei im Audioformat.

Installation

sudo apt install -y espeak

Anwendung

espeak "Hallo und willkommen bei blog.wermescher.com." -w espeak.wav -g 10 -p 70 -s 150 -v de-DE

-g Pause zwischen den Wörtern in ms

-p Pitch adjustment

-s Geschwindigkeit in ungefähren Worten pro Minute. Der Standardwert ist 175

eSpeak NG

Der eSpeak NG ist ein kompakter Open-Source-Software Text-to-Speech-Synthesizer für Linux, Windows, Android und andere Betriebssysteme. Er unterstützt mehr als 100 Sprachen und Akzente und basiert auf der von Jonathan Duddington entwickelten eSpeak-Engine.

eSpeak NG verwendet eine „formant-Synthese“-Methode. Dadurch können viele Sprachen auf kleinem Raum zur Verfügung gestellt werden. Die Sprache ist klar und kann mit hoher Geschwindigkeit verwendet werden, ist aber nicht so natürlich und flüssig wie größere Synthesizer, die auf menschlichen Sprachaufnahmen basieren.

Installation

sudo apt install -y espeak-ng espeak-ng-espeak mbrola

Anwendung

Die Kommandozeile ist praktisch die gleiche wie bei espeak:

espeak-ng "Hallo und willkommen bei blog.wermescher.com." -w espeak-ng.wav -g 10 -p 70 -s 150 -v de-DE
espeak-ng -vde -f text2speech_input.txt -w espeak-ng.wav

Festival

Auch Festival ist ein text-to-speech system. Die Letzte Version ist schon etwas älter aus dem Jahre 2014

Installation

sudo apt install -y festival festival-doc festival-freebsoft-utils

Anwendung

text2wave text2speech_input.txt -o festival.wav

SVOX – Pico TTS

Mein Favorit (im Jahre 2021) ist nach wie vor das SVOX – Pico TTS system. SVOX wurde 2011 von Nuance gekauft.

Installation

sudo apt install -y libttspico-utils sox

Anwendung

pico2wave —lang de-DE —wave pico2wave.wav “Hallo und willkommen zu der Firma DevLabs mit der Ei-Pi Adresse 10 Punkt 7 Punkt 5 Punkt 34”

Wer viele dieser WAV-Dateien erzeugt, möchte sie am Ende oft gemeinsam archivieren oder übertragen. Wie das mit Zip, Unzip und Tar unter Linux gelingt, habe ich in einem eigenen Beitrag beschrieben.

Mehr aus „Linux, DevOps & Systeme"

Linux, DevOps & Systeme 17. Juni 2026

Docker Speicherplatz freigeben

Docker Speicherplatz freigeben: mit docker system df die Belegung sehen und mit prune ungenutzte Images, Container, Volumes, Netzwerke und Build-Cache löschen.

Linux, DevOps & Systeme 4. September 2023

Windows Core Prozesse verstehen

Windows Core-Prozesse verstehen: was smss.exe, csrss.exe, lsass.exe und svchost.exe wirklich tun und woran Du getarnte Malware im Prozessbaum erkennst.

Linux, DevOps & Systeme 30. August 2023

Ubuntu LTS Release Update

Ubuntu LTS sicher aktualisieren: Snapshot bei Contabo oder Netcup anlegen, mit apt update und do-release-upgrade hochziehen und den SSH-Port bestätigen.

Über diesen Blog

Ein Sammelsurium an Denkanstößen.

Hier sammle ich Wissen, Argumente und Links zu allem, was mich beschäftigt — von Technik über Küche bis Nachhaltigkeit. Beruflich berate ich zu Cybersecurity.

Alle Beiträge Mehr über mich ↗