Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

怎么样获得Twitter17数据集的dev.json文件train.json文件以及test.json文件 #22

Open
haxin3696 opened this issue Jul 22, 2024 · 9 comments

Comments

@haxin3696
Copy link

大佬打扰下,百度网盘下载的数据集中只有Twitter15文件夹下有。json文件,Twitter17为什么没有?是不需要吗?

@MANLP-suda
Copy link
Owner

你解压下文件,应该都在的。twitter17是公开的数据集,下载位置应该挺多的。

@haxin3696
Copy link
Author

你解压下文件,应该都在的。twitter17是公开的数据集,下载位置应该挺多的。

解压之后找了好久也没有,只有Twitter15文件夹下有.json文件,这个.json文件作用是什么

@MANLP-suda
Copy link
Owner

image
你去这里下载吧。按理说,应该不会漏掉上传的。

@MANLP-suda
Copy link
Owner

这是论文中的

@haxin3696
Copy link
Author

image 你去这里下载吧。按理说,应该不会漏掉上传的。

十分感谢大佬回复和解答

@haxin3696
Copy link
Author

image 你去这里下载吧。按理说,应该不会漏掉上传的。

十分感谢大佬回复和解答

屏幕截图 2024-07-22 202303,看到了lu等人的文章,里边说新建了数据集,但并没有作者新建数据集的链接,所以这个作者新建的数据集是不开源的吗?只给了这个网站链接https://archive.org/details/twitterstream,readme中也有提到这个链接,那么请问应当怎么确定要下载那个文件件呢?这么多文件

@haxin3696
Copy link
Author

image 你去这里下载吧。按理说,应该不会漏掉上传的。

十分感谢大佬回复和解答

屏幕截图 2024-07-22 202303,看到了lu等人的文章,里边说新建了数据集,但并没有作者新建数据集的链接,所以这个作者新建的数据集是不开源的吗?只给了这个网站链接https://archive.org/details/twitterstream,readme中也有提到这个链接,那么请问应当怎么确定要下载那个文件件呢?这么多文件

可以知道下您在数据处理的时候下载的都是这个网站上哪些数据文件吗?

@MANLP-suda
Copy link
Owner

image
zheg这个里面包含了。你可以参考下另一个人提过的类似的问题。

@MANLP-suda
Copy link
Owner

issue #15 然后处理下

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants