Add WildFire Dataset object and split strategies #47

x0s · 2019-12-15T12:43:49Z

Hello,

This PR aims at:

Add WildFireDataset pytorch compatible class
Add Strategy to split the dataset in train/val/test without mixing the fire_ids

Example:

from torch.utils.data import DataLoader
from torchvision.transforms import transforms
from pyronear.datasets.wildfire import (WildFireDataset,
                                        WildFireSplitter)

wildfire = WildFireDataset(metadata='wildfire.csv',
                           target_names=['fire', 'clf_confidence'],
                           path_to_frames=path_to_frames)

ratios = {'train': 0.7, 'val': 0.15, 'test':0.15}
transforms = {'train': transforms.RandomCrop(10), 'val': None, 'test': None}

splitter = WildFireSplitter(ratios, transforms)
splitter.fit(wildfire)

wildfire_loader_train = DataLoader(splitter.train, batch_size=64, shuffle=True)
wildfire_loader_val = DataLoader(splitter.val, batch_size=64, shuffle=True)
wildfire_loader_test = DataLoader(splitter.test, batch_size=64, shuffle=True)

Each dataloader will yield the image(transformed if requested) and the two targets (fire and clf_confidence)

For more example, please browse the tests

Any feedback is welcome

…ing strategy

codecov · 2020-03-12T09:28:36Z

Codecov Report

Merging #47 into master will increase coverage by 2.41%.
The diff coverage is 98.03%.

@@            Coverage Diff             @@
##           master      #47      +/-   ##
==========================================
+ Coverage   81.39%   83.80%   +2.41%     
==========================================
  Files          16       18       +2     
  Lines         602      704     +102     
==========================================
+ Hits          490      590     +100     
- Misses        112      114       +2

Impacted Files	Coverage Δ
pyronear/datasets/wildfire/split_strategy.py	`96.77% <96.77%> (ø)`
pyronear/datasets/wildfire/wildfire.py	`98.36% <98.36%> (ø)`
pyronear/datasets/utils.py	`91.66% <100.00%> (+1.04%)`	⬆️
pyronear/datasets/wildfire/__init__.py	`100.00% <100.00%> (ø)`

MateoLostanlen

You made a mistake in your example, it is ->
from torch.utils.data import DataLoader
from pyronear.datasets.wildfire import (WildFireDataset,
WildFireSplitter)

wildfire = WildFireDataset(metadata='wildfire.csv',
path_to_frames=path_to_frames)

ratios = {'train': 0.7, 'val': 0.15, 'test':0.15}

splitter = WildFireSplitter(ratios)
splitter.fit(wildfire)

wildfire_loader_train = DataLoader(splitter.train, batch_size=64, shuffle=True)
wildfire_loader_val = DataLoader(splitter.val, batch_size=64, shuffle=True)
wildfire_loader_test = DataLoader(splitter.test, batch_size=64, shuffle=True)

MateoLostanlen

Maybe my question is dumb, but I don't understand why you use "from skimage import io" and not pil to load the images. I have a problem to apply the torch vision transform afterwards (https://pytorch.org/docs/stable/torchvision/transforms.html). What do you use as a transform then ?

x0s · 2020-03-24T09:34:47Z

You made a mistake in your example, it is ->
from torch.utils.data import DataLoader
from pyronear.datasets.wildfire import (WildFireDataset,
WildFireSplitter)

wildfire = WildFireDataset(metadata='wildfire.csv',
path_to_frames=path_to_frames)

ratios = {'train': 0.7, 'val': 0.15, 'test':0.15}

splitter = WildFireSplitter(ratios)
splitter.fit(wildfire)

wildfire_loader_train = DataLoader(splitter.train, batch_size=64, shuffle=True)
wildfire_loader_val = DataLoader(splitter.val, batch_size=64, shuffle=True)
wildfire_loader_test = DataLoader(splitter.test, batch_size=64, shuffle=True)

Thanks for your feedback!
Indeed, I forget to update the description.
So, If I understand it right, only these two lines needs to be updated:

splitter = WildFireSplitter(ratios)
splitter.fit(wildfire)

…pdate Tests

…uires a PIL

…th torchvision

x0s added 4 commits December 15, 2019 13:39

Add WildFire Dataset object and split strategies

ed91e90

delete obsolete code in wildfire dataset

ffebaba

Add basic init tests for WildFireDataset

64de9d6

Comply with CI

6092470

x0s added type: enhancement New feature or request module: datasets Related to datasets ext: tests Related to tests labels Dec 16, 2019

x0s added 5 commits March 11, 2020 18:21

Add WildFire Dataset fixture

3720155

Raise Exception when WildFire dataset not found

270f0d1

Add test to cover WildFire init and splits

a65544f

Raise exception when samples remained unassigned using Exhaust Splitt…

d1cec20

…ing strategy

Comply with standards/flake8

ec42968

MateoLostanlen reviewed Mar 22, 2020

View reviewed changes

MateoLostanlen reviewed Mar 23, 2020

View reviewed changes

x0s added 9 commits March 27, 2020 18:42

Provide (PIL) Image Loader for Vision classes

706c549

Clean Wildfire Test docstrings

2502f19

Add ability to choose which targets WildFireDataset should return & U…

208751c

…pdate Tests

Fix non deterministic tests for wildfiresplitting

f17da5a

Add test to cover transforms when splitting wildfire

8ae0a4c

Load Image default to PIL instead of Tensor since some transforms req…

47487ca

…uires a PIL

Propagate target names in splits & add some tests

7813a20

flake8 compliance

607b239

Remove skimage dependency in favor of PIL to increase compatibilty wi…

17655f8

…th torchvision

MateoLostanlen approved these changes Mar 28, 2020

View reviewed changes

MateoLostanlen merged commit 1fab241 into pyronear:master Mar 28, 2020

x0s deleted the add-wildfire-dataset branch April 1, 2020 14:58

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add WildFire Dataset object and split strategies #47

Add WildFire Dataset object and split strategies #47

x0s commented Dec 15, 2019 •

edited

Loading

codecov bot commented Mar 12, 2020 •

edited

Loading

MateoLostanlen left a comment •

edited

Loading

MateoLostanlen left a comment

x0s commented Mar 24, 2020

Add WildFire Dataset object and split strategies #47

Add WildFire Dataset object and split strategies #47

Conversation

x0s commented Dec 15, 2019 • edited Loading

codecov bot commented Mar 12, 2020 • edited Loading

Codecov Report

MateoLostanlen left a comment • edited Loading

Choose a reason for hiding this comment

MateoLostanlen left a comment

Choose a reason for hiding this comment

x0s commented Mar 24, 2020

x0s commented Dec 15, 2019 •

edited

Loading

codecov bot commented Mar 12, 2020 •

edited

Loading

MateoLostanlen left a comment •

edited

Loading