QuoteSum

QuoteSum is a textual QA dataset containing Semi-Extractive Multi-source Question Answering (SEMQA) examples written by humans, based on Wikipedia passages.

The dataset is described in detail in the paper: SEMQA: Semi-Extractive Multi-Source Question Answering (NAACL 2024).

Repository description

The Quotesum dataset is provided in jsonl format in v1 dir.

The string-based metrics for comparing generated outputs with human-writtern references are provided in the evals dir with an example notebook.

Semi-Extractive Multi-source Question Answering (SEMQA)

In SEMQA, the answer combines information from multiple sources while explicitly extracting factual spans, and connecting them into a coherent well-grounded passage. See the paper for more details.

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
evals		evals
v1		v1
LICENSE		LICENSE
README.md		README.md
intro.png		intro.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

QuoteSum

Repository description

Semi-Extractive Multi-source Question Answering (SEMQA)

About

Releases

Packages

Languages

License

google-research-datasets/QuoteSum

Folders and files

Latest commit

History

Repository files navigation

QuoteSum

Repository description

Semi-Extractive Multi-source Question Answering (SEMQA)

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages