最近のアクセス:
Evaluate プロシージャー

カスタムモデルの動作 (新しい予測がどの程度的確か) を評価します。

パラメーター

設定

次の表に、この AI タスクを使用する際に設定する必要があるプロパティ (アクセスに必要な資格情報) を示します。
  PropertyKey
ProviderType キー
Alibaba -
Amazon -
Baidu -
Google  Service Account JSON
IBM Visual Recognition キー
Microsoft Custom Vision Training キー
SAP -
Tencent -

Mamaev の Flowers Recognition データセットでモデルのトレーニングを行った後、プロバイダーごとに行われた評価と、その処理にかかった時間を次の表に示します。
プロバイダー 出力 ベンチマーク
Alibaba GXAI6001 - タスク 'GeneXusAI.Custom.Evaluate' は使用できません (...)  N/A
Amazon GXAI6001 - タスク 'GeneXusAI.Custom.Evaluate' は使用できません (...) N/A
Baidu GXAI6001 - タスク 'GeneXusAI.Custom.Evaluate' は使用できません (...) N/A
Google
{
    "Score": 1,
    "Additional":  [ 
        {
            "Key": "auPrc",
            "Value": 1
        },
        {
            "Key": "auRoc",
            "Value": 0
        },
        {
            "Key": "F1Score@000",
            "Value": 0.922
        },
        {
            "Key": "Precision@000",
            "Value": 0.915
        },
        {
            "Key": "Recall@000",
            "Value": 0.918
        },
        ...
        {
            "Key": "ConfusionMatrix [ DAISY,DAISY ] ",
            "Value": 1
        },
        ...
        {
            "Key": "ConfusionMatrix [ ROSE,ROSE ] ",
            "Value": 1
        }
     ] ,
    "Local": false
}
1299ms
IBM
{
    "Score": 0.823,
    "Additional":  [ 
        {
            "Key": "ConfusionMatrix [ TULIP,TULIP ] ",
            "Value": 10
        },
        ...
        {
            "Key": "ConfusionMatrix [ ROSE,TULIP ] ",
            "Value": 2
        },
        ...
        {
            "Key": "Precision@000",
            "Value": 0.922
        },
        {
            "Key": "Recall@000",
            "Value": 0.915
        },
        {
            "Key": "FScore@000",
            "Value": 0.918
        },
        ...
        {
             "Key": "Precision@100",
             "Value": 0.4
        },
        {
            "Key": "Recall@100",
            "Value": 0.4
        },
        {
            "Key": "Precision@100",
            "Value": 0.4
        }
     ] ,
    "Local": True
}
156ms
Microsoft 
{
    "Score": 0.999,
    "Additional":  [ 
        {
            "Key": "Precision",
            "Value": 1.000
        },
        {
            "Key": "PrecisionSdtDeviation",
            "Value": 0.000
        },
        {
            "Key": "Recall",
            "Value": 0.998
        },
        {
            "Key": "RecallSdtDeviation",
            "Value": 0.000
        },
        {
            "Key": "AveragePrecision",
            "Value": 1.000
        },
        {
            "Key": "AverageRecall",
            "Value": 0,998
        }
     ] ,
    "Local": False
}
215ms
SAP GXAI6001 - タスク 'GeneXusAI.Custom.Evaluate' は使用できません (...) N/A
Tencent GXAI6001 - タスク 'GeneXusAI.Custom.Evaluate' は使用できません (...) N/A

  • 値が高い場合、過剰適合 (Overfitting) の問題に陥る可能性があります。
     
  • Additional フィールドに Precision (適合率)Recall (再現率) の指標がある場合、主な値 (Score フィールド) は F1-measure (F1 値) になります。
     
  • クラウドプロバイダーが、評価に関する情報を提供していない場合 (IBM など)、このタスクは、モデルのデプロイ後に、何らかの標準指標をローカルで計算します。この場合、Measure.Local フィールドが True に設定されます。計算を行うために資格情報は必要ありませんが、デプロイのステータスを確認する場合や (Check プロシージャー)、データセットのすべてのテストデータを予測して、実際の値を予測値と比較する場合 (Predict プロシージャー) に、アクセスに必要な資格情報を指定する必要があります。また、Evaluation タスクは、使用する必要があるモデル (Id フィールドと Version フィールド)、評価するモデルのタイプ (Type フィールド) を知っている必要があります。指標はこれらに依存します。また、テストデータを判別するために、データセット情報がある場所 (csv ファイルのパスを示す Dataset フィールド) も必要です。このため、Model データタイプの入力はすべて設定されている必要があります。
     
  • 評価がローカルで実行され、ログレベルが Debug モードで有効になっている場合、GeneXusAI では、混同行列、結果、指標、マクロがログに出力されます。次に例を示します。
    Matrix    | TULIP | SUNFLOWER | DANDELION | ROSE | DAISY
    ----------+-------+-----------+-----------+------+-------
    TULIP     |    10 |         0 |         0 |    0 |     0
    SUNFLOWER |     0 |         8 |         1 |    0 |     0
    DANDELION |     0 |         1 |         8 |    0 |     0
    ROSE      |     2 |         0 |         0 |    8 |     0
    DAISY     |     0 |         0 |         0 |    0 |     9
    
    Outcomes | TULIP | SUNFLOWER | DANDELION | ROSE | DAISY
    ---------+-------+-----------+-----------+------+-------
    TP       |    10 |         8 |         8 |    8 |     9
    TN       |    35 |        37 |        37 |   37 |    38
    FP       |     2 |         1 |         1 |    0 |     0
    FN       |     0 |         1 |         1 |    2 |     0
    POP      |    47 |        47 |        47 |   47 |    47
    P        |    10 |         9 |         9 |   10 |     9
    N        |    37 |        38 |        38 |   37 |    38
    TOP      |    12 |         9 |         9 |    8 |     9
    TON      |    35 |        38 |        38 |   39 |    38
    
    Metrics | TULIP | SUNFLOWER | DANDELION |  ROSE | DAISY
    --------+-------+-----------+-----------+-------+-------
    ACC     | 0.957 |     0.957 |     0.957 | 0.957 |     1
    ERR     | 0.043 |     0.043 |     0.043 | 0.043 |     0
    PPV (P) | 0.833 |     0.889 |     0.889 |     1 |     1
    TPR (R) |     1 |     0.889 |     0.889 |   0.8 |     1
    F0.5    | 0.862 |     0.889 |     0.889 | 0.952 |     1
    F1      | 0.909 |     0.889 |     0.889 | 0.889 |     1
    F2      | 0.962 |     0.889 |     0.889 | 0.833 |     1
    J       | 0.833 |       0.8 |       0.8 |   0.8 |     1
    TNR     | 0.946 |     0.974 |     0.974 |     1 |     1
    NPV     |     1 |     0.974 |     0.974 | 0.949 |     1
    AUC     | 0.973 |     0.932 |     0.932 |   0.9 |     1
    MCC     | 0.888 |     0.863 |     0.863 | 0.871 |     1
    
    Macros  |  MEAN | VARIANCE | STD DEV | STD ERR
    --------+-------+----------+---------+---------
    ACC     | 0.966 |  0.00037 | 0.01924 | 0.00837
    ERR     | 0.034 |  0.00037 | 0.01924 | 0.00837
    PPV (P) | 0.922 |  0.00557 | 0.07463 | 0.03332
    TPR (R) | 0.916 |  0.00726 | 0.08521 | 0.03808
    F0.5    | 0.918 |  0.00317 |  0.0563 |  0.0251
    F1      | 0.915 |  0.00232 | 0.04817 | 0.02145
    F2      | 0.915 |  0.00438 | 0.06618 | 0.02966
    J       | 0.847 |  0.00756 | 0.08695 | 0.03886
    TNR     | 0.979 |  0.00051 | 0.02258 |    0.01
    NPV     | 0.979 |  0.00046 | 0.02145 | 0.00949
    AUC     | 0.947 |  0.00154 | 0.03924 | 0.01761
    MCC     | 0.897 |  0.00342 | 0.05848 | 0.02608
    

適用範囲

プラットフォーム  Web (.NET、.NET Core、Java)、スマートデバイス (Android、iOS)
接続  オンライン

使用可能バージョン

このプロシージャーは、GeneXus 16 Upgrade 6 以降で利用できます。
  • GeneXus 16 Upgrade 7 以降
    - プロバイダーが評価情報を提供していない場合、評価はローカルで行われます。
  • GeneXus 16 Upgrade 8 以降
    -  Google AutoML が利用できます。

参考情報





サブページ
Created: 20/04/27 03:34 by Admin Last update: 21/05/20 18:58 by Admin
カテゴリ
Powered by GXwiki 3.0