| DetectObjects プロシージャー | |
画像内のオブジェクトを検出します。
次の表に、この AI タスクを使用する際に設定する必要があるプロパティ (アクセスに必要な資格情報) を示します。
|
PropertyKey |
ProviderType |
Id |
Key |
SecretKey |
Alibaba |
- |
- |
- |
Amazon |
- |
Rekognition |
Rekognition |
Baidu |
- |
- |
- |
Google |
- |
Cloud Vision API |
- |
IBM |
- |
- |
- |
Microsoft |
- |
Computer Vision |
- |
MLKit |
ML Kit API |
ML Kit API |
|
SAP |
- |
- |
- |
Tencent |
物体识别 |
物体识别 |
- |
下記の表に、次の画像を入力とした場合に行われるオブジェクト認識 (JSON 構造として) とその処理の所要時間をプロバイダー別に示します。
|
プロバイダー |
出力 |
|
ベンチマーク |
Alibaba |
N/A |
|
N/A |
Amazon |
[ { "label": "Sunglasses 1",
"confidence": 0.996, "top": 463, "left": 435, "width": 110, "height": 35 }, { "label": "Person 1",
"confidence": 0.995, "top": 408, "left": 89, "width": 760, "height": 434 }, { "label": "Person 2",
"confidence": 0.886, "top": 586, "left": 19, "width": 53, "height": 126 } ]
|
|
11121ms |
Baidu |
N/A |
|
N/A |
Google |
[ { "label": "Person",
"confidence": 0.7952577, "top": 477, "left": 115, "width": 722, "height": 369 }, { "label": "Man",
"confidence": 0.64812267, "top": 409, "left": 146, "width": 600, "height": 372 } ]
|
|
8218ms |
IBM |
N/A |
|
N/A |
Microsoft |
[ { "label": "outdoor",
"confidence": 0.996472358703613, "top": 0, "left": 0, "width": 0, "height": 0 }, { "label": "sky",
"confidence": 0.980476856231689, "top": 0, "left": 0, "width": 0, "height": 0 }, { "label": "person",
"confidence": 0.974854707717896, "top": 0, "left": 0, "width": 0, "height": 0 }, { "label": "man",
"confidence": 0.922227799892426, "top": 0, "left": 0, "width": 0, "height": 0 }, { "label": "building",
"confidence": 0.8099485039711, "top": 0, "left": 0, "width": 0, "height": 0 } ]
|
|
4896ms |
MLKit |
[ { "label": "FASHION_GOOD",
"confidence": 0.937, "top": 674, "left": 446, "width": 355, "height": 369 }, { "label": "FASHION_GOOD",
"confidence": 0.71, "top": 724, "left": 369, "width": 55, "height": 90 }, { "label": "FASHION_GOOD",
"confidence": 0.582, "top": 515, "left": 199, "width": 822, "height": 534 }, { "label": "UNKNOWN",
"confidence": 0, "top": 716, "left": 186, "width": 48, "height": 122 }, { "label": "UNKNOWN",
"confidence": 0, "top": 729, "left": 13, "width": 64, "height": 145 } ]
|
|
999ms |
SAP |
N/A |
|
N/A |
Tencent |
[ { "label": "GXAI_TCN_OBJECT_668",
"confidence": 0.623, "top": 0, "left": 0, "width": 0, "height": 0 }, { "label": "GXAI_TCN_OBJECT_873",
"confidence": 0.204, "top": 0, "left": 0, "width": 0, "height": 0 }, { "label": "GXAI_TCN_OBJECT_682",
"confidence": 0.101, "top": 0, "left": 0, "width": 0, "height": 0 }, { "label": "GXAI_TCN_OBJECT_442",
"confidence": 0.017, "top": 0, "left": 0, "width": 0, "height": 0 }, { "label": "GXAI_TCN_OBJECT_698",
"confidence": 0.01, "top": 0, "left": 0, "width": 0, "height": 0 } ]
|
|
5587ms |
- オブジェクトに割り当てられるラベルは、使用するプロバイダーによって異なります。プロバイダーが OutputRegion.Info フィールドに追加情報を指定している場合は、その情報を参照できます。
- 画像ファイルサイズの上限は 10 MB です。
- Tencent AI はラベルを GXAI_TCN_OBJECT_{id} タグとして返します。{id} は Tencent が提供する数値クラスです。Language オブジェクトを使用して、ほかのプロバイダーと同じように、各タグを文字列ラベルとマッピングできます。簡体字中国語の Language オブジェクトが正式なマッピングとともに含まれている xpz をダウンロードできます。この xpz には、機械翻訳を使用した英語のマッピング (不正確な可能性もあります) も含まれています。たとえば、使用する環境の [ Translation Type ] プロパティを実行時の値に設定した場合、この xpz をインポートすると、サンプルセクションの GXAI_TCN_OBJECT_668 ラベルが「清真寺」 (英語では mosque) に翻訳されます。
- 長方形領域の値は、プロバイダーが領域を識別できない場合は 0 になります。
- GeneXusAI では、画像への長方形の描画はサポートされていません。このアクションは開発者自身の責任で実行する必要があります。
ヒント: Web アプリケーションの場合は、代わりに JavaScript を使用した HTML5 Canvas コントロールとユーザー コントロール オブジェクトの組み合わせを使用することをお勧めします。一方、スマートデバイスの場合は、Image Map コントロールを使用することで、処理後の画像を背景として設定し、四角の領域を描画できます (つまり、グリッドのテーブルアイテムに境界線の色を設定できます)。
プラットフォーム |
Web (.NET、.NET Core、Java)、スマートデバイス (Android、iOS) |
接続 |
オンライン |
このプロシージャーは、GeneXus 16 以降で利用できます。
|
|
|
|
|