| TextToSpeech プロシージャー | |
プレーンテキストをオーディオストリームに変換します。
次の表に、この AI タスクを使用する際に設定する必要があるプロパティ (アクセスに必要な資格情報) を示します。
|
PropertyKey
ProviderType
プロバイダー |
Id |
Key |
SecretKey |
Alibaba |
智能语音交互 app-key |
用户AccessKey |
用户AccessKey |
Amazon |
- |
Transcribe |
Transcribe |
Baidu |
百度语音 |
百度语音 |
百度语音 |
Google |
- |
Cloud Speech API |
- |
IBM |
- |
TextToSpeech API |
- |
Microsoft |
- |
Speech API |
- |
SAP |
- |
- |
- |
Tencent |
音合成 |
音合成 |
- |
下記の表に、次のプレーンテキストを入力とした場合に行われる合成とその処理の所要時間をプロバイダー別に示します。
"The first question that comes up is: What is GeneXus? GeneXus is a tool that automatically generates software programs such as applications for the Web, and Smart Devices, always at the forefront of technological evolution."
プロバイダー |
出力 |
ベンチマーク |
Alibaba |
|
3325ms |
Amazon |
|
1486ms |
Baidu |
|
4634ms |
Google |
|
1887ms |
IBM |
|
3205ms |
Microsoft |
|
3412ms |
SAP |
N/A |
N/A |
Tencent |
|
4614ms |
&Text 入力パラメーターでは、SSML 内部ノード (<speak> ルートを除く) を使用して発音やイントネーションなどを書式設定することもできます。次に例を示します。
"<emphasis level='strong'>GeneXus<emphasis> is a tool that <prosody pinth='high'>automatically generates software programs</prosody> such as applications for the Web, and <sub alias='Smart Devices'>SD</sub>, with over <say-as interpret-as='cardinal'>30</say-as> years of experience."
結果は次のようになります。
- SSML 入力の場合、現時点で W3 SSML 仕様のすべてのエレメントとオプションがすべてのプロバイダーでサポートされているわけではありません。具体的には、GeneXusAI では <voice> タグを使用できないため、&voiceType 入力パラメーターを使用して設定する必要があります。
- Google Cloud AI で Speech Cloud API を有効にしてこのタスクを使用するときは、 [ Standard Voices ] オプションを選択する必要があります。
- Tencent AI プロバイダーと Baidu AI プロバイダーでは、中国語または英語 (あるいはその組み合わせ) のテキスト入力のみサポートされます。
- Microsoft の Bing Speech API は廃止が決まっているため、資格情報を 2019 年 10 月より前に Speech API に移行する必要があります。
対応しているプラットフォーム: |
Web (.NET、.NET Core、Java)、スマートデバイス (Android、iOS) |
接続 |
オンライン |
このプロシージャーは、GeneXus 16 以降で利用できます。
|
|
|
|
|