Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

json数据含义解答 #18

Open
ant00469 opened this issue Aug 11, 2024 · 9 comments
Open

json数据含义解答 #18

ant00469 opened this issue Aug 11, 2024 · 9 comments

Comments

@ant00469
Copy link

老师您好,认真拜托老师您和团队所写的论文,并对代码进行了一下复现,但这个过程对数据集的含义还是不太清楚,还希望得到老师您的指导,老师可以解释下这三个问题吗?谢谢.(以BikeNYC_short数据集为例)
第一:"X_train": [[[[[48.99999999999999, 42.000000000000014, 35.0, 6.999999999999999, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]前四个数字是分别指的:N×T×H×W,这个理解对吗?另外后面这些数字为“0”位置 分别代表什么含义呢?
第二:X_val": [[[[ [3.0, 8.0, 6.999999999999999, 14.000000000000004, 14.000000000000004, 15.0, 3.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],这些非0的数字分别代表什么含义呢?为什么会有7个位置都有非0 的数字?
第三:如果上面的理解是对的,那么老师请问:X_test": [[[[[6.0, 6.0, 6.999999999999999, 15.0, 12.999999999999998, 15.0, 0.0, 6.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0], ;这些非0的数字分别代表什么含义呢?
第三四:在这个组数据里timestamps": {"train": [[[6, 36], [6, 37], [6, 38], [6, 39], [6, 40], [6, 41], [6, 42], [6, 43], [6, 44], [6, 45], [6, 46], [6, 47]], 这些数字代表的是什么含义呢?
谢谢老师答疑解惑!!

@ant00469
Copy link
Author

老师您好!刚刚开始涉足交叉学科研究,原为建筑学方向,属于机器学习的小白,还望老师多多指导为盼!!
感谢感谢!

@YuanYuan98
Copy link
Collaborator

数据值含义:0值代表的是使用量为0。你可以检查一下X_train的shape,是一个N×T×H×W的矩阵。

timestamps:每一个位置有两个值,第一个值代表的是星期几有0-6七个数值,第二个值代表的一天的第几个时段,由于时间间隔是半小时,所以一共有48个时段,因此值为0-47中的一个。

@ant00469
Copy link
Author

ant00469 commented Aug 11, 2024 via email

@ant00469
Copy link
Author

ant00469 commented Aug 14, 2024 via email

@ant00469
Copy link
Author

ant00469 commented Aug 14, 2024 via email

@ant00469
Copy link
Author

YuanYuan 老师您好!
十分高兴收到您的来信,而且还那么及时。认真阅读了老师您的来信后,我把论文和数据集又进行了一次全面的学习,存在如下两个问题,还望老师您指导一下,具体如下:

第一个问题:老师我把BikeNYC_short.json数据集的3组数据的前2个数据做了一个梳理,如下:
"X_train":
48.99999999999999, 42.000000000000014, 35.0, 6.999999999999999, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],

20.0, 28.999999999999996, 49.999999999999986, 60.000000000000014, 41.00000000000001, 53.000000000000014, 11.000000000000002, 12.999999999999998, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]

X_val":
9.0, 2.0, 4.000000000000001, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],
3.0, 8.0, 6.999999999999999, 14.000000000000004, 14.000000000000004, 15.0, 3.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]

X_test"
3.0, 4.000000000000001, 5.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],
6.0, 6.0, 6.999999999999999, 15.0, 12.999999999999998, 15.0, 0.0, 6.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
老师可以指导一下为什么每组数据是有20个数字组成的吗?另外,三组数据在数字上为什么同一个列上,数字上差别这么大呢?

@ant00469
Copy link
Author

第二个问题:如老师您的回信中所言,见下图:

X_train的shape,是一个N×T×H×W的矩阵,那为什么在下面这组X_train的shape是含有20个数据?这个的原因是什么呢?而且从这四组数据可以看出关于,第一组数据前4个数据非0 ,第二组数据前八个数据非0 ,到了第三组数据前9组数据非0 ,
按照我的理解因该每组数据只有前四位非0 ,好像才符合老师您提到的“X_train的shape,是一个N×T×H×W的矩阵”,我的理解是在哪里除了什么问题吗?
"X_train":
[48.99999999999999, 42.000000000000014, 35.0, 6.999999999999999, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],
[20.0, 28.999999999999996, 49.999999999999986, 60.000000000000014, 41.00000000000001, 53.000000000000014, 11.000000000000002, 12.999999999999998, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],
[1.0, 24.000000000000007, 39.99999999999999, 58.00000000000001, 71.00000000000001, 63.999999999999986, 39.000000000000014, 19.000000000000004, 11.000000000000002, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],
[9.999999999999996, 6.999999999999999, 27.0, 49.999999999999986, 16.0, 16.999999999999996, 26.000000000000004, 37.99999999999999, 31.000000000000007, 20.0, 11.999999999999998, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]

辛苦YUANyuan老师了!!

此致

还望老师多多指导批评为盼!!!

@ant00469
Copy link
Author

TaxiNYC2_short.json:(11维数据)
"X_train":
[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 4.000000000000001, 1.0, 4.000000000000001, 1.0, 1.0, 0.0],
[0.0, 0.0, 0.0, 0.0, 0.0, 2.0, 6.999999999999999, 0.0, 0.0, 0.0, 0.0, 0.0],

X_val":
[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 15.0, 9.0, 5.0, 1.0, 1.0, 0.0],
[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 29.999999999999996, 3.0, 6.0, 1.0, 1.0, 0.0],

"X_test":
[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 32.0, 5.0, 5.0, 2.0, 1.0, 1.0],
[0.0, 0.0, 0.0, 0.0, 0.0, 2.0, 39.99999999999999, 3.0, 6.0, 2.0, 2.0, 3.0],

BikeNYC_short.json(20维数据)

"X_train":
48.99999999999999, 42.000000000000014, 35.0, 6.999999999999999, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],

20.0, 28.999999999999996, 49.999999999999986, 60.000000000000014, 41.00000000000001, 53.000000000000014, 11.000000000000002, 12.999999999999998, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]

X_val":
9.0, 2.0, 4.000000000000001, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],
3.0, 8.0, 6.999999999999999, 14.000000000000004, 14.000000000000004, 15.0, 3.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]

X_test"
3.0, 4.000000000000001, 5.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0],
6.0, 6.0, 6.999999999999999, 15.0, 12.999999999999998, 15.0, 0.0, 6.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]

Yuanyuan老师:您好!
想请教一下:对于TaxiNYC2_short.json数据集是11维数据,而BikeNYC_short.json是20维数据,这个是什么原因呢?

@ant00469
Copy link
Author

如老师您在论文中的表4所示,假如南京的城市范围为16KMX20KM
那么目前按照16M*20M为一个空间分割,那公在南京这个城市
的空间网格应为1000个网格,每半小时采集一个网格的人群数
对应的人流数据应该是1000X48个对应的数组(一天24小时,共计48个半小时)
Yuanyuan老师您看我这样理解对吗?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants