[TOC]
- 图模型,支持 千万级别节点,亿级别边
- 深度排序模型,支持 亿级别特征,百亿级别样本
- 深度召回模型,支持 亿级别特征,百亿级别样本
包括 训练脚本
、预测脚本
和 demo 数据
,以下模型的 demo 都可以直接运行。
- 参考编译文档编译
-
要求 python3.6 或 python3.7 运行环境, 在 embedx/demo 目录下执行
pip install -r requirements.txt
-
修改 embedx/demo/env.sh 文件中的变量 BUILD_DIR_ABS
-
将 BUILD_DIR_ABS 修改为 embedx 编译输出的 bin 文件路径 embedx/build_xxxx 为 用户的编译输出绝对路径, 如
-
BUILD_DIR_ABS=/Users/yuanhangzou/embedx/build_xxxx
-
以下以 无监督图模型
、有监督的图模型
、深度排序模型
和 深度召回模型
为例分别介绍如何单机训练。
-
模型概述
- 无监督图模型包括
deepwalk
、node2vec
、struc2vec
、metapath2vec
、eges
和unsup_graphsage
等模型
- 无监督图模型包括
-
以无监督 graphsage 模型为例,介绍无监督图模型的单机训练流程
- 进入到
embedx/demo/single
目录,运行run_unsup_graphsage.sh
脚本 - 依次生成训练数据
edge
、邻居平均特征average_feature
、模型model
和 节点 embeddingembedding
- 进入到
-
模型概述
- 有监督图模型包括
sup_graphsage
- 有监督图模型提供了
多标签
和多分类
功能
- 有监督图模型包括
-
以
有监督 graphsage 模型多分类
为例,介绍有监督图模型的单机训练流程- 进入到
embedx/demo/single
目录,运行run_sup_graphsage.sh
脚本 - 依次生成邻居平均特征
average_feature
、模型model
和 节点 embeddingembedding
- 进入到
-
模型概述
- 深度排序模型包括
deepfm
和din
等模型
- 深度排序模型包括
-
以
deepfm 模型
为例,介绍深度排序模型的单机训练流程- 进入到
embedx/demo/single
目录,运行run_deepfm.sh
脚本 - 依次生成模型
model
和 样本打分结果probs
- 进入到
-
模型概述
- 深度召回模型包括
dssm
和youtube_dnn
模型
- 深度召回模型包括
-
以
dssm 模型
为例,介绍深度召回模型的单机训练流程- 进入到
embedx/demo/single
目录,运行run_dssm.sh
脚本 - 依次生成模型
model
、user_embeddinguser_embedding
和 item_embeddingitem_embedding
- 进入到