最近のアクセス:
TextToSpeech プロシージャー
プレーンテキストをオーディオストリームに変換します。

パラメーター

設定

次の表に、この AI タスクを使用する際に設定する必要があるプロパティ (アクセスに必要な資格情報) を示します。
PropertyKey
ProviderType


プロバイダー Id Key SecretKey
Alibaba 智能语音交互 app-key 用户AccessKey 用户AccessKey
Amazon - Transcribe Transcribe
Baidu 百度语音 百度语音 百度语音
Google - Cloud Speech API -
IBM - TextToSpeech API  -
Microsoft - Speech API -
SAP - - -
Tencent 音合成 音合成 -

下記の表に、次のプレーンテキストを入力とした場合に行われる合成とその処理の所要時間をプロバイダー別に示します。
"The first question that comes up is: What is GeneXus? GeneXus is a tool that automatically generates software programs such as applications for the Web, and Smart Devices, always at the forefront of technological evolution."
 
プロバイダー 出力 ベンチマーク
Alibaba
3325ms
Amazon
1486ms
Baidu 
4634ms
Google
1887ms
IBM
3205ms
Microsoft
3412ms
SAP N/A N/A
Tencent
4614ms

&Text 入力パラメーターでは、SSML 内部ノード (<speak> ルートを除く) を使用して発音やイントネーションなどを書式設定することもできます。次に例を示します。
"<emphasis level='strong'>GeneXus<emphasis> is a tool that <prosody pinth='high'>automatically generates software programs</prosody> such as applications for the Web, and <sub alias='Smart Devices'>SD</sub>, with over <say-as interpret-as='cardinal'>30</say-as> years of experience."

結果は次のようになります。

  • SSML 入力の場合、現時点で W3 SSML 仕様のすべてのエレメントとオプションがすべてのプロバイダーでサポートされているわけではありません。具体的には、GeneXusAI では <voice> タグを使用できないため、&voiceType 入力パラメーターを使用して設定する必要があります。
  • Google Cloud AI で Speech Cloud API を有効にしてこのタスクを使用するときは、 [ Standard Voices ] オプションを選択する必要があります。
  • Tencent AI プロバイダーと Baidu AI プロバイダーでは、中国語または英語 (あるいはその組み合わせ) のテキスト入力のみサポートされます。
  • Microsoft の Bing Speech API は廃止が決まっているため、資格情報を 2019 年 10 月より前に Speech API に移行する必要があります。

適用範囲

対応しているプラットフォーム:  Web (.NET、.NET Core、Java)、スマートデバイス (Android、iOS)
接続  オンライン

使用可能バージョン

このプロシージャーは、GeneXus 16 以降で利用できます。

参考情報




サブページ
Created: 19/03/25 18:00 by Admin Last update: 20/01/13 18:06 by Admin
カテゴリ
Powered by GXwiki 3.0