Přejít k navigační liště

Zdroják » Zprávičky » Qwen3-TTS: otevřený AI model pro převod textu na řeč

Qwen3-TTS: otevřený AI model pro převod textu na řeč

Zprávičky AI

Nálepky:

Tým Qwen z Alibaba Cloud představil Qwen3-TTS, novou generaci open-source modelů pro převod textu na přirozeně znějící řeč. Model je volně dostupný a může být použit pro různé projekty včetně hlasových asistentů, audioknih nebo multimediálních aplikací.

Qwen3-TTS podporuje 10 jazyků, včetně angličtiny, čínštiny, japonštiny, korejštiny, němčiny, francouzštiny či španělštiny. Model se zaměřuje na přirozenou intonaci a rytmus řeči, přičemž je vhodný i pro streamovaný hlas v reálném čase.

Součástí jsou také nástroje pro tvorbu a klonování hlasů. Vyzkoušet je lze prostřednictvím interaktivního dema na Hugging Face, kde je možné nahrát vlastní hlas pomocí mikrofonu a nechat model vygenerovat libovolný text ve vašem hlasu.

Qwen3-TTS představuje významný krok v otevřených TTS technologiích a nabízí alternativu k uzavřeným komerčním řešením.

Pro více informací: https://qwen.ai/blog?id=qwen3tts-0115

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted

TypeScript 7 v Go: rychlejší buildy, chybějící API

Betaverze TypeScriptu 7.0 ukazuje víc než rychlejší tsc. Microsoft převádí kompilátor a jazykovou službu z původní kódové základny psané v TypeScriptu a běžící jako JavaScript do Go, přidává paralelní typovou kontrolu a připravuje novou editorovou část postavenou na LSP. Pro část nástrojů ale nepůjde o prostou výměnu binárky: TypeScript 7 zatím nemá stabilní náhradu dnešního Compiler API.

Prolog nezmizel. Jen dnes žije v jiných nástrojích

Prolog nezmizel. Jeho hlavní myšlenku dnes potkáváme v nástrojích, které se Prologu na první pohled nepodobají: v CodeQL pro analýzu kódu, v Rego pro policy-as-code, v Z3 pro práci s omezeními a v Leanu pro formální důkazy. Každý řeší jiný problém, ale všechny připomínají totéž: někdy je lepší popsat vztahy, pravidla, omezení nebo tvrzení než vrstvit další if.