Per #2058, write utility functions for computing the bias ratio and t…

…est to make sure that Stat-Analysis can now aggregate ORANK -> ECNT correctly.
dtcenter · Oct 27, 2022 · 2d9f53f · 2d9f53f
1 parent 847f80c
commit 2d9f53f
Show file tree

Hide file tree

Showing 4 changed files with 87 additions and 25 deletions.
diff --git a/src/libcode/vx_statistics/ens_stats.cc b/src/libcode/vx_statistics/ens_stats.cc
@@ -346,20 +346,14 @@ void ECNTInfo::set(const PairDataEnsemble &pd) {
    // Compute the square root of the average variance plus oerr
    spread_plus_oerr = square_root(pd.var_plus_oerr_na.wmean(pd.wgt_na));
 
-   // Compute bias ratio components
+   // Compute bias ratio terms 
    n_ge_obs  = nint(pd.n_ge_obs_na.sum());
    me_ge_obs = pd.me_ge_obs_na.wmean(pd.n_ge_obs_na);
    n_lt_obs  = nint(pd.n_lt_obs_na.sum());
    me_lt_obs = pd.me_lt_obs_na.wmean(pd.n_lt_obs_na);
 
    // Compute bias ratio
-   if(is_bad_data(me_ge_obs) ||
-      is_bad_data(me_lt_obs) || is_eq(me_lt_obs, 0.0)) {
-      bias_ratio = bad_data_double;
-   }
-   else {
-      bias_ratio = me_ge_obs / abs(me_lt_obs);
-   }
+   bias_ratio = compute_bias_ratio(me_ge_obs, me_lt_obs);
 
    return;
 }

diff --git a/src/libcode/vx_statistics/pair_data_ensemble.cc b/src/libcode/vx_statistics/pair_data_ensemble.cc
@@ -355,8 +355,7 @@ void PairDataEnsemble::add_obs_error_entry(ObsErrorEntry *e) {
 ////////////////////////////////////////////////////////////////////////
 
 void PairDataEnsemble::compute_pair_vals(const gsl_rng *rng_ptr) {
-   int i, j, k, n_vld, n_bel, n_tie, n_abv;
-   double err, sum_err_lt_obs, sum_err_ge_obs;
+   int i, j, k, n_vld, n_bel, n_tie;
    int n_skip_const, n_skip_vld;
    NumArray src_na, dest_na, cur_ens, cur_clm;
    double mean, stdev, var_unperturbed, var_perturbed;
@@ -387,13 +386,11 @@ void PairDataEnsemble::compute_pair_vals(const gsl_rng *rng_ptr) {
    // Compute the rank for each observation
    for(i=0, n_pair=0, n_skip_const=0, n_skip_vld=0; i<o_na.n(); i++) {
 
-      // Initialize counts and sums
+      // Initialize
       cur_ens.erase();
-      n_vld = n_bel = n_tie = n_abv = 0;
-      sum_err_lt_obs = sum_err_ge_obs = 0.0;
 
       // Compute the number of ensemble values above and below the observation
-      for(j=0; j<n_ens; j++) {
+      for(j=0, n_vld = n_bel = n_tie = 0; j<n_ens; j++) {
 
          // Skip bad data
          if(e_na[j].n() > i && !is_bad_data(e_na[j][i])) {
@@ -404,13 +401,9 @@ void PairDataEnsemble::compute_pair_vals(const gsl_rng *rng_ptr) {
             // Store the current ensemble value
             cur_ens.add(e_na[j][i]);
 
-            // Ensemble value minus observation value
-            err = e_na[j][i] - o_na[i];
-
             // Track running counts and sums
-            if(is_eq(e_na[j][i], o_na[i])) { n_tie++; sum_err_ge_obs += err; }
-            else if(e_na[j][i] < o_na[i])  { n_bel++; sum_err_lt_obs += err; }
-            else                           { n_abv++; sum_err_ge_obs += err; }
+            if(is_eq(e_na[j][i], o_na[i])) n_tie++;
+            else if(e_na[j][i] < o_na[i])  n_bel++;
          }
 
       } // end for j
@@ -523,11 +516,18 @@ void PairDataEnsemble::compute_pair_vals(const gsl_rng *rng_ptr) {
          ign_na.add(compute_ens_ign(o_na[i], mean, stdev));
          pit_na.add(compute_ens_pit(o_na[i], mean, stdev));
 
-         // Store Bias Ratio components
-         n_ge_obs_na.add(n_tie + n_abv);
-         me_ge_obs_na.add(sum_err_ge_obs/(n_tie + n_abv));
-         n_lt_obs_na.add(n_bel);
-         me_lt_obs_na.add(sum_err_lt_obs/n_bel);
+         // Compute the Bias Ratio terms 
+         int n_ge_obs, n_lt_obs;
+         double me_ge_obs, me_lt_obs;
+         compute_bias_ratio_terms(o_na[i], cur_ens,
+                                  n_ge_obs, me_ge_obs,
+                                  n_lt_obs, me_lt_obs);
+
+         // Store the Bias Ratio terms 
+         n_ge_obs_na.add(n_ge_obs);
+         me_ge_obs_na.add(me_ge_obs);
+         n_lt_obs_na.add(n_lt_obs);
+         me_lt_obs_na.add(me_lt_obs);
       }
    } // end for i
 
@@ -2047,5 +2047,59 @@ double compute_ens_pit(double obs, double m, double s) {
 
    return(v);
 }
+
+////////////////////////////////////////////////////////////////////////
+//
+// Compute the bias ratio terms
+//
+////////////////////////////////////////////////////////////////////////
+
+void compute_bias_ratio_terms(double obs, const NumArray &e_na,
+                              int &n_ge_obs, double &me_ge_obs,
+                              int &n_lt_obs, double &me_lt_obs) {
+
+   // Initialize
+   n_ge_obs  = n_lt_obs  = 0;
+   me_ge_obs = me_lt_obs = 0.0;
+
+   // Loop over ensemble member values
+   for(int i=0; i<e_na.n(); i++) {
+
+      // Track counts and sums
+      if(e_na[i] >= obs) {
+         n_ge_obs  += 1;
+         me_ge_obs += (e_na[i] - obs);
+      }
+      else {
+         n_lt_obs  += 1;
+         me_lt_obs += (e_na[i] - obs);
+      }
+   }
+
+   // Convert sums to means
+   if(n_ge_obs > 0) me_ge_obs /= n_ge_obs;
+   else             me_ge_obs  = bad_data_double;
+   if(n_lt_obs > 0) me_lt_obs /= n_lt_obs;
+   else             me_lt_obs  = bad_data_double;
+
+   return;
+}
+
+////////////////////////////////////////////////////////////////////////
+
+double compute_bias_ratio(double me_ge_obs, double me_lt_obs) {
+   double v;
+
+   // Compute bias ratio
+   if(is_bad_data(me_ge_obs) ||
+      is_bad_data(me_lt_obs) || is_eq(me_lt_obs, 0.0)) {
+      v = bad_data_double;
+   }
+   else {
+      v = me_ge_obs / abs(me_lt_obs);
+   }
+
+   return(v);
+}
 
 ////////////////////////////////////////////////////////////////////////
diff --git a/src/libcode/vx_statistics/pair_data_ensemble.h b/src/libcode/vx_statistics/pair_data_ensemble.h
@@ -317,6 +317,9 @@ extern double compute_crps_emp(double, const NumArray &);
 extern double compute_crps_gaus(double, double, double);
 extern double compute_ens_ign(double, double, double);
 extern double compute_ens_pit(double, double, double);
+extern void   compute_bias_ratio_terms(double, const NumArray &,
+                                       int &, double &, int &, double &);
+extern double compute_bias_ratio(double, double);
 
 ////////////////////////////////////////////////////////////////////////
 

diff --git a/src/tools/core/stat_analysis/aggr_stat_line.cc b/src/tools/core/stat_analysis/aggr_stat_line.cc
@@ -3199,6 +3199,17 @@ void aggr_orank_lines(LineDataFile &f, STATAnalysisJob &job,
          m[key].ens_pd.ign_na.add(compute_ens_ign(cur.obs, cur.ens_mean, cur.spread));
          m[key].ens_pd.pit_na.add(compute_ens_pit(cur.obs, cur.ens_mean, cur.spread));
 
+         // Store BIAS_RATIO terms
+         int n_ge_obs, n_lt_obs;
+         double me_ge_obs, me_lt_obs;
+         compute_bias_ratio_terms(cur.obs, cur.ens_na,
+                                  n_ge_obs, me_ge_obs,
+                                  n_lt_obs, me_lt_obs);
+         m[key].ens_pd.n_ge_obs_na.add(n_ge_obs);
+         m[key].ens_pd.me_ge_obs_na.add(me_ge_obs);
+         m[key].ens_pd.n_lt_obs_na.add(n_lt_obs);
+         m[key].ens_pd.me_lt_obs_na.add(me_lt_obs);
+
          //
          // Increment the RHIST counts
          //