tensorplex-labs · jarvis8x7b · Oct 24, 2024 · Oct 23, 2024 · Oct 23, 2024 · Oct 23, 2024
diff --git a/commons/orm.py b/commons/orm.py
@@ -521,3 +521,65 @@ async def get_validator_score() -> torch.Tensor | None:
             return None
 
         return torch.tensor(json.loads(score_record.score))
+
+    @staticmethod
+    async def get_scores_and_ground_truth_by_dojo_task_id(
+        dojo_task_id: str,
+    ) -> dict[str, dict[str, float | int | None]]:
+        """
+        Fetch the scores, model IDs from Completion_Response_Model for a given Dojo task ID.
+        Also fetches rank IDs from Ground_Truth_Model for the given Dojo task ID.
+
+        Args:
+            dojo_task_id (str): The Dojo task ID to search for.
+
+        Returns:
+            dict[str, dict[str, float | int | None]]: A dictionary mapping model ID to a dict containing score and rank_id.
+        """
+        try:
+            # First, find the Feedback_Request_Model with the given dojo_task_id
+            feedback_request = await Feedback_Request_Model.prisma().find_first(
+                where=Feedback_Request_ModelWhereInput(dojo_task_id=dojo_task_id),
+                include={
+                    "completions": True,
+                    "parent_request": {"include": {"ground_truths": True}},
+                },
+            )
+
+            if not feedback_request:
+                logger.warning(
+                    f"No Feedback_Request_Model found for dojo_task_id: {dojo_task_id}"
+                )
+                return {}
+
+            parent_request = feedback_request.parent_request
+            if not parent_request:
+                logger.warning(
+                    f"No parent request found for dojo_task_id: {dojo_task_id}"
+                )
+                return {}
+
+            rank_id_map = {
+                gt.obfuscated_model_id: gt.rank_id
+                for gt in parent_request.ground_truths
+            }
+
+            # Extract scores from the completions
+            scores_and_gts = {
+                completion.model: {
+                    "score": completion.score,
+                    "ground_truth_rank_id": rank_id_map.get(completion.completion_id),
+                }
+                for completion in feedback_request.completions
+            }
+
+            logger.debug(
+                f"Found {len(scores_and_gts)} scores and ground truths for dojo_task_id: {dojo_task_id}"
+            )
+            return scores_and_gts
+
+        except Exception as e:
+            logger.error(
+                f"Error fetching completion scores and ground truths for dojo_task_id {dojo_task_id}: {e}"
+            )
+            return {}
diff --git a/neurons/validator.py b/neurons/validator.py
@@ -242,8 +242,25 @@ async def log_wandb():
                                 "ground_truth": mean_weighted_gt_scores,
                             }
 
+                            dojo_task_to_scores_and_gt = []
+                            for miner_response in task.miner_responses:
+                                if miner_response.dojo_task_id is not None:
+                                    model_to_score_and_gt_map = await ORM.get_scores_and_ground_truth_by_dojo_task_id(
+                                        miner_response.dojo_task_id
+                                    )
+                                    dojo_task_to_scores_and_gt.append(
+                                        {
+                                            miner_response.dojo_task_id: model_to_score_and_gt_map
+                                        }
+                                    )
+
+                            score_data["dojo_task_to_scores_and_gt"] = (
+                                dojo_task_to_scores_and_gt
+                            )
+
                             wandb_data = jsonable_encoder(
                                 {
+                                    "request_id": task.request.request_id,
                                     "task": task.request.task_type,
                                     "criteria": task.request.criteria_types,
                                     "prompt": task.request.prompt,