New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

RFC-3734: Buffered reader #3734

Merged

Xuanwo merged 5 commits into apache:main from WenyXu:docs/buffer-reader-rfc

Dec 18, 2023

Member

WenyXu commented Dec 10, 2023 •

edited

Loading

This RFC proposes a buffered reader to amortize the overhead of IO. The concurrent fetching feature will be introduced in another RFC soon.

Related

WenyXu requested a review from Xuanwo as a code owner

December 10, 2023 08:32

WenyXu commented

View reviewed changes

core/src/docs/rfcs/buffered_reader.md Outdated Show resolved Hide resolved

Member Author

WenyXu commented Dec 10, 2023

I'm going to invite my workmate to review this RFC, too. cc @evenyag @zhongzc

WenyXu commented

View reviewed changes

core/src/docs/rfcs/buffered_reader.md Outdated Show resolved Hide resolved

WenyXu force-pushed the docs/buffer-reader-rfc branch from bb87a31 to 268b142 Compare

December 10, 2023 08:44

WenyXu mentioned this pull request

Tracking issues of RFC-3734: Buffered reader #3735

Closed

11 tasks


          docs: add buffered reader rfc

83f10e8

WenyXu force-pushed the docs/buffer-reader-rfc branch from 268b142 to 83f10e8 Compare

December 10, 2023 08:57

WenyXu commented

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

Member Author

WenyXu commented Dec 11, 2023 •

edited

Loading

Another idea came to my mind: we can support multiple buffering policies for different purposes. i.e., only buffer the partial read and prefetched segments for future use(the segment prefetching will be introduced with the concurrent fetching feature). Maybe we should leave it as future work.

evenyag reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

Xuanwo reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

zhongzc reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

WenyXu marked this pull request as draft

December 11, 2023 10:13

Xuanwo added the releases-note/feat label


          docs: reorganize content and remove redundant concept

6be6540

WenyXu marked this pull request as ready for review

December 12, 2023 09:05

WenyXu mentioned this pull request

idea: tailing buffering #3745

Closed

Xuanwo reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Show resolved Hide resolved

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

WenyXu force-pushed the docs/buffer-reader-rfc branch from 1e4015f to 2dbced7 Compare

December 12, 2023 14:07

WenyXu commented

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Show resolved Hide resolved


          docs: add more info in reference-level explanation

13d7cdf

WenyXu force-pushed the docs/buffer-reader-rfc branch from 2dbced7 to 13d7cdf Compare

December 12, 2023 16:31

zhongzc reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

zhongzc reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

xyjixyjixyji reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

WenyXu marked this pull request as draft

December 13, 2023 13:10

oowl reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Outdated Show resolved Hide resolved

WenyXu force-pushed the docs/buffer-reader-rfc branch from bf07ef1 to 6400337 Compare

December 18, 2023 11:10


          chore: apply suggestions from CR

fa960e5

WenyXu force-pushed the docs/buffer-reader-rfc branch from 6400337 to fa960e5 Compare

December 18, 2023 11:15

WenyXu marked this pull request as ready for review

December 18, 2023 11:15

Member Author

WenyXu commented Dec 18, 2023

Sorry for the delay. Please take a look when you have time. Thanks🥹

Xuanwo approved these changes

View reviewed changes

Member

Xuanwo left a comment

Thanks! Mostly LGTM.

Xuanwo reviewed

View reviewed changes

core/src/docs/rfcs/3734_buffered_reader.md Show resolved Hide resolved

Xuanwo changed the title ~~RFC: Buffered reader~~ RFC-3734: Buffered reader


          feat: add rfc to rfcs/mod.rs

51be3a4

oowl approved these changes

View reviewed changes

Member

Zheaoli commented Dec 18, 2023

For me, mostly LGTM. BTW, I have a suggestion here, maybe we need to add a Capability to let each service's developer decide support the buffer read or not and check the maximum size their own.

Because some of the service like PGSQL,MySQL etc.. are dedicated to the small file.

This is probably an implementation issue, I'm not sure we need add extra description in RFC docs

Member

Xuanwo commented Dec 18, 2023

BTW, I have a suggestion here, maybe we need to add a Capability to let each service's developer decide support the buffer read or not and check the maximum size their own.

Users don't care about buffer can just don't use this API.

And besides, buffer is useful even when file is small. For example, read(1), seek(1), read(2).

Member

Zheaoli commented Dec 18, 2023

Users don't care about buffer can just don't use this API.

And besides, buffer is useful even when file is small. For example, read(1), seek(1), read(2).

Make sense.

Zheaoli approved these changes

View reviewed changes

Member

Zheaoli left a comment

LGTM

Member

Xuanwo commented Dec 18, 2023

We got three approvals now, merging!

Xuanwo merged commit b0f759d into apache:main

165 checks passed

hoosin commented Dec 19, 2023

cool

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Reviewers

Xuanwo Xuanwo approved these changes

evenyag evenyag left review comments

zhongzc zhongzc left review comments

xyjixyjixyji xyjixyjixyji left review comments

Zheaoli Zheaoli approved these changes

oowl oowl approved these changes

Labels

releases-note/feat