-
Notifications
You must be signed in to change notification settings - Fork 18
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Presentation] Self-Supervised Learning for Recommender Systems: A Survey #311
Comments
这个链接预测的工作很有意义,有几个点想讨论一下:
|
对于第二个问题,我在做embedding计算的时候顺序是pr,issue,push,fork,release,共用一个节点特征(包括开发者和仓库)每次计算的时候边不同。后续我再尝试一下顺序 |
子图1:D->R实际对应的节点集合是
其中×为笛卡尔积运算。 |
|
不包括S_(D2)的是子图2:R->D。子图1和子图2是样本的不同子图。如果前面标号造成的误解,应该可以跳过下面的解释。
|
感谢娄博的解答。但还是有些疑惑想请教:
|
我也不太确定双向的预测准确度为什么会有差异以及是否和采样数据集的采样策略相关。我觉得有可能是因为使用的非线性规范化方法,图机器学习的表征中,特征传播使用的是 L2 规范化方法,这对于两侧的节点本身就是不对称的,主要是为了消除图学习中度高的节点带来过大的影响。可能可以考虑使用 L1 规范化也就是线性规范化方法,看是否会影响两个方向下的预测效果。 因为从统计上来说,仓库节点的平均度应该是远大于开发者节点的,尤其是头部仓库的开发者数量肯定是极高的,而普通开发者的活跃仓库数量是有上限的,一年中达到几百个就已经很高的,所以两类节点的度有很大的差异,也可以做一下统计上的对比。 |
[1]量化计算我们的子图的假设空间与全样本图的完整空间之间的信息差异(假设完整数据集边分布律的节点对的集合为E,被Mask的边分布律的节点对集合为E_MASK,则样本数据集边分布律的节点对集合为E-E_MASK,假设边e_i的存在概率是p_i,则完整数据集与样本数据集的信息差由E_MASK决定:I = Σ_{e_i ∈ E_MASK} (- p_i ln p_i),其中p_i>=0),在一阶齐次假设下,这个信息量与扩展到 |
Title
Self-Supervised Learning for Recommender
Systems: A Survey
Link
https://ieeexplore.ieee.org/document/10144391/
Year
2024
Author and affiliation
Junliang Yu
Conference or Journal
IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
Rank
SCI1区
Keywords
No response
Selecting Reason
可以应用至自监督的图协作网络的推荐与链接预测
Supplementary
No response
The text was updated successfully, but these errors were encountered: