kubeflow · k8s-ci-robot · May 9, 2019 · May 8, 2019 · May 8, 2019 · May 8, 2019
diff --git a/pkg/api/operators/apis/trial/v1alpha2/trial_types.go b/pkg/api/operators/apis/trial/v1alpha2/trial_types.go
@@ -29,6 +29,9 @@ type TrialSpec struct {
  // and let the corresponding resource controller (e.g. tf-operator) handle
  // the rest.
  RunSpec string `json:"runSpec,omitempty"`
+
+ // Raw text for the metrics collector spec. This must be a CronJob object.
+ MetricsCollectorSpec string `json:"metricsCollectorSpec,omitempty"`
 }
 
 type TrialStatus struct {

diff --git a/pkg/api/v1alpha2/api.pb.go b/pkg/api/v1alpha2/api.pb.go
diff --git a/pkg/api/v1alpha2/api.proto b/pkg/api/v1alpha2/api.proto
@@ -357,6 +357,7 @@ message TrialSpec {
  string experiment_name = 1;
  ParameterAssignments parameter_assignments = 2;
  string run_spec = 3;
+ string metrics_collector_spec = 4;
 }
 
 message TrialStatus {

diff --git a/pkg/api/v1alpha2/api.swagger.json b/pkg/api/v1alpha2/api.swagger.json
@@ -939,6 +939,9 @@
  },
  "run_spec": {
  "type": "string"
+ },
+ "metrics_collector_spec": {
+ "type": "string"
  }
  }
  },

diff --git a/pkg/api/v1alpha2/gen-doc/api.md b/pkg/api/v1alpha2/gen-doc/api.md
@@ -792,6 +792,7 @@ Katib will create each Hyper parameter from this config.
 | experiment_name | [string](#string) | | |
 | parameter_assignments | [TrialSpec.ParameterAssignments](#api.v1.alpha2.TrialSpec.ParameterAssignments) | | |
 | run_spec | [string](#string) | | |
+| metrics_collector_spec | [string](#string) | | |
 
 
 

diff --git a/pkg/api/v1alpha2/gen-doc/index.html b/pkg/api/v1alpha2/gen-doc/index.html
@@ -1727,6 +1727,13 @@ <h3 id="api.v1.alpha2.TrialSpec">TrialSpec</h3>
  <td><p> </p></td>
  </tr>
 
+ <tr>
+ <td>metrics_collector_spec</td>
+ <td><a href="#string">string</a></td>
+ <td></td>
+ <td><p> </p></td>
+ </tr>
+
  </tbody>
  </table>
 

diff --git a/pkg/api/v1alpha2/python/api_pb2.py b/pkg/api/v1alpha2/python/api_pb2.py
diff --git a/pkg/db/v1alpha2/db_init.go b/pkg/db/v1alpha2/db_init.go
@@ -18,7 +18,6 @@ func (d *dbConn) DBInit() {
  parallel_trial_count INT,
  max_trial_count INT,
  status TINYINT,
- metrics_collector_type TEXT,
  start_time DATETIME(6),
  completion_time DATETIME(6),
  nas_config TEXT)`)
@@ -33,6 +32,7 @@ func (d *dbConn) DBInit() {
  experiment_name VARCHAR(255) NOT NULL,
  parameter_assignments TEXT,
  run_spec TEXT,
+ metrics_collector_spec TEXT,
  observation TEXT,
  status TINYINT,
  start_time DATETIME(6),

diff --git a/pkg/db/v1alpha2/interface.go b/pkg/db/v1alpha2/interface.go
@@ -456,14 +456,16 @@ func (d *dbConn) RegisterTrial(trial *v1alpha2.Trial) error {
  experiment_name,
  parameter_assignments,
  run_spec,
+ metrics_collector_spec,
  observation,
  status,
  start_time,
- completion_time) VALUES (?, ?, ?, ?, ?, ?, ?, ?)`,
+ completion_time) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)`,
  trial.Name,
  trial.Spec.ExperimentName,
  paramAssignment,
  trial.Spec.RunSpec,
+ trial.Spec.MetricsCollectorSpec,
  observation,
  trial.Status.Condition,
  start_time,
@@ -507,6 +509,7 @@ func (d *dbConn) GetTrialList(experimentName string, filter string) ([]*v1alpha2
  &trial.Spec.ExperimentName,
  &paramAssignment,
  &trial.Spec.RunSpec,
+ &trial.Spec.MetricsCollectorSpec,
  &observation,
  &trial.Status.Condition,
  &start_time,
@@ -565,6 +568,7 @@ func (d *dbConn) GetTrial(trialName string) (*v1alpha2.Trial, error) {
  &trial.Spec.ExperimentName,
  &paramAssignment,
  &trial.Spec.RunSpec,
+ &trial.Spec.MetricsCollectorSpec,
  &observation,
  &trial.Status.Condition,
  &start_time,

diff --git a/pkg/db/v1alpha2/interface_test.go b/pkg/db/v1alpha2/interface_test.go
@@ -39,6 +39,7 @@ var trialColumns = []string{
  "experiment_name",
  "parameter_assignments",
  "run_spec",
+ "metrics_collector_spec",
  "observation",
  "status",
  "start_time",
@@ -299,6 +300,7 @@ func TestRegisterTrial(t *testing.T) {
  experiment_name,
  parameter_assignments,
  run_spec,
+ metrics_collector_spec,
  observation,
  status,
  start_time,
@@ -308,6 +310,7 @@ func TestRegisterTrial(t *testing.T) {
  "test1",
  "{\"assignments\":[{\"name\":\"param1\",\"value\":\"0.9\"},{\"name\":\"param2\",\"value\":\"10\"}]}",
  "",
+ "",
  "{\"metrics\":[{\"name\":\"f1_score\",\"value\":\"88.95\"},{\"name\":\"loss\",\"value\":\"0.5\"},{\"name\":\"precision\",\"value\":\"88.7\"},{\"name\":\"recall\",\"value\":\"89.2\"}]}",
  trial.Status.Condition,
  "2016-12-31 20:02:05.123456",
@@ -328,6 +331,7 @@ func TestGetTrialList(t *testing.T) {
  "test1",
  "{\"assignments\":[{\"name\":\"param1\",\"value\":\"0.9\"},{\"name\":\"param2\",\"value\":\"10\"}]}",
  "",
+ "",
  "{\"metrics\":[{\"name\":\"f1_score\",\"value\":\"88.95\"},{\"name\":\"loss\",\"value\":\"0.5\"},{\"name\":\"precision\",\"value\":\"88.7\"},{\"name\":\"recall\",\"value\":\"89.2\"}]}",
  api_pb.TrialStatus_RUNNING,
  "2016-12-31 20:02:05.123456",
@@ -338,6 +342,7 @@ func TestGetTrialList(t *testing.T) {
  "test1",
  "{\"assignments\":[{\"name\":\"param1\",\"value\":\"0.8\"},{\"name\":\"param2\",\"value\":\"20\"}]}",
  "",
+ "",
  "{\"metrics\":[{\"name\":\"f1_score\",\"value\":\"88.5\"},{\"name\":\"loss\",\"value\":\"0.8\"},{\"name\":\"precision\",\"value\":\"88.2\"},{\"name\":\"recall\",\"value\":\"89.0\"}]}",
  api_pb.TrialStatus_COMPLETED,
  "2016-12-31 20:02:05.123456",
@@ -362,6 +367,7 @@ func TestGetTrial(t *testing.T) {
  "test1",
  "{\"assignments\":[{\"name\":\"param1\",\"value\":\"0.9\"},{\"name\":\"param2\",\"value\":\"10\"}]}",
  "",
+ "",
  "{\"metrics\":[{\"name\":\"f1_score\",\"value\":\"88.95\"},{\"name\":\"loss\",\"value\":\"0.5\"},{\"name\":\"precision\",\"value\":\"88.7\"},{\"name\":\"recall\",\"value\":\"89.2\"}]}",
  api_pb.TrialStatus_RUNNING,
  "2016-12-31 20:02:05.123456",

diff --git a/test/e2e/v1alpha2/test-katib-manager.py b/test/e2e/v1alpha2/test-katib-manager.py
@@ -16,8 +16,7 @@ def register_experiment(stub):
  algorithm=algo,
  trial_template="run-mnist",
  parallel_trial_count=2,
- max_trial_count=9,
- metrics_collector_type='2')
+ max_trial_count=9)
  exp_status = api_pb2.ExperimentStatus(condition=1,
  start_time="2019-04-28T14:09:15Z",
  completion_time="2019-04-28T16:09:15Z")
@@ -64,6 +63,7 @@ def register_trial(stub):
  parameters = api_pb2.TrialSpec.ParameterAssignments(assignments=[api_pb2.ParameterAssignment(name="rl", value="0.01")])
  spec = api_pb2.TrialSpec(experiment_name=TEST_EXPERIMENT,
  run_spec="a batch/job resource",
+ metrics_collector_spec="metrics/collector",
  parameter_assignments=parameters)
  observation = api_pb2.Observation(metrics=[api_pb2.Metric(name="loss", value="0.54")])
  status = api_pb2.TrialStatus(condition=2,