[WizInt, K2R] Additional knowledge-related eval metrics on WizInt #4193

mojtaba-komeili · 2021-11-17T20:43:33Z

Patch description
Added a couple of extra metrics to WizInt to evaluate the generated response's F1 with the best possible match in the documents and sentences:

knowledge_f1_max_retrieved_sentences: max F1 between response and any of the retrieved sentences.
knowledge_f1_max_retrieved_docs: max F1 between response and any of the retrieved docs.

Right now we only compare to selected docs and sentences.

Testing steps
Checking if they appear during eval.

added the metrics

7a91a5e

mojtaba-komeili requested a review from klshuster November 17, 2021 20:43

facebook-github-bot added the CLA Signed label Nov 17, 2021

klshuster approved these changes Nov 17, 2021

View reviewed changes

updated tests

9f101b8

mojtaba-komeili merged commit 4779018 into main Nov 17, 2021

mojtaba-komeili deleted the max-f1 branch November 17, 2021 22:05

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[WizInt, K2R] Additional knowledge-related eval metrics on WizInt #4193

[WizInt, K2R] Additional knowledge-related eval metrics on WizInt #4193

mojtaba-komeili commented Nov 17, 2021

[WizInt, K2R] Additional knowledge-related eval metrics on WizInt #4193

[WizInt, K2R] Additional knowledge-related eval metrics on WizInt #4193

Conversation

mojtaba-komeili commented Nov 17, 2021