-
Notifications
You must be signed in to change notification settings - Fork 18
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[学术会议] 关于系统开展学术会议交流的想法 #199
Comments
基于上述信息,可以鼓励并形成实验室传统:
专利与软件著作权将作为非推荐类成果,除非有特殊考虑,不作为开源领域研究的主要成果。 |
以 ICSE 2024 为例,能够投论文的 track 包括:
同时,MSR 24 将会和 ICSE 2024 同时举办,会有不错的参会体验,值得参加~ |
SemEval-2014 Task 4 是个不错的参考,以系统构建各类 Task 的形式推动数据集与科研问题,可以是个不错的方法~ |
近期搜刮了关于文本标准数据集构成以及开源领域情感分析的相关论文,说一下自己阅读以后产生的一些想法: 关于形成标准数据集: 我在阅读了SemEval-2014 Task 4、SemEval-2015 Task 12、SemEval-2016 Task 5、SemEval-2017 Task 4以及ImageNet之后认为形成标准数据集且需要形成论文进行发表的主要工作包含以下几点: 1.首先是获取数据,对数据进行标注。 2.确定数据集可以完成的任务。 3.数据集的评估标准 |
我们也许可以完成的工作: 基于以上我们应该可以形成两个方向,一个是数据集,一个是基于该数据集的详细分析,也对应两篇论文。(关于情感分类方法的研究可以产出更多) 关于数据集我现在的想法是我们可以从二分类(正、负)、三分类(正、中、负)、多分类(anger, anticipation, disgust, fear, joy, sadness, surprise, trust等,具体后续再定)入手,形成三个子任务,这三个任务也是开源领域有人做过一定研究的,我认为是有意义的。 在数据集获取之后,这两部分任务可以并行的完成, 围绕数据集的论文,则需要基于数据集使用大量现有的方法进行间接验证,如果该数据集有三个子任务,每个任务都有10个方法,则就相当于要完成30个实验,当然这只是个预估。SemEval-2014 Task 4本身具有影响力,所以较多团队会进行支持,我们可能需要自己完成这些实验,所以这部分工作也是不好预估的,难度相对于另一个工作较大。 围绕开源领域评论文本的工作,我现在产生的一个点子就是对上面那片论文出现的一些缺点进行完善,不只是某一个点的完善,是从数据集到分析方法到分析维度,多个方面进行优化,这样应该也可以形成一篇论文,为此我专门搜索了该文章的作者近期发表的论文以及引用该论文的其他论文是否有对其进行优化,确信这部分工作还是空白的,其他研究生们也可以对其中的研究方法进行不断的优化,最后产出论文,但这样做的最大的缺点就是还是没有从一个新的落脚点去出发研究,我想近期我会尽量找出一个新的比较有意思的关于开源领域值得做情感分析的一个方面再进行讨论。 |
Description
和开源社区一样,学术会议是一个很好的实验室成果交流与展示平台,不仅对研究生培养/毕业提供了重要支持(如论文发表),近几年国际顶会所发展出来的各类丰富的 track,也能很好的用来宣传各类包括:工业界成果、工具、数据集、新想法、教学案例等成果,可以好好利用。
考虑实验室在 OpenRank、OpenDigger 等开源方向,以及软件工程、数据科学与工程等学科方向,列举部分会议及相关信息,欢迎大家一起来补充、提出好的建议想法。以下会议信息来源于 CCF。
1、软件工程
2、数据科学与工程
3、互联网与交叉学科
The text was updated successfully, but these errors were encountered: