抖音首次公开推荐算法原理:通过潜在特征预测行为

抖音总裁韩尚佑今日宣布,“抖音安全与信任中心”网站上线。网站首次公开抖音推荐算法原理,介绍其推荐算法如何预估用户行为概率,并通过多目标建模等方式实现更优质、丰富的内容推荐,而算法需由平台治理体系对其进行约束和规范。

抖音算法

网站也披露了抖音平台治理的审核流程,阐述平台如何应对谣言、网暴等违规内容带来的挑战。同时,抖音还介绍了自家的“Wide&Deep”和“双塔召回”两种模型。

 

一条视频从海量信息中被选中,推送给用户,一般要经过进入内容池、召回、排序三个环节。用户发布的新视频首先要经过初步评估进入内容池,然后进入召回环节,其作用是从海量的内容池中,初步快速粗筛出一大批用户可能感兴趣的内容。

举例来说,召回环节需要用到召回模型,抖音最常用的召回模型是“双塔召回模型”(Two-Tower Retrieval Model)。双塔召回模型把用户和内容都转化为数学空间里的一个个点,就像是给用户和内容贴上了独特的“数字标签”,这个过程叫做向量化表征学习。其大概过程如下:

  • (1)分别将用户特征、内容特征进行数学转化(如展示小猫的视频为 0,展示小狗的视频为 1,短视频为 0,长视频为 1,那么一个展示小猫的长视频即(0,1),其实际长度取决于特征有多少维度,用户特征同理);

  • (2)将转化后的数学特征输入到用户塔、内容塔两个深度学习模型中,经过训练,各自形成一组新的数字集合,这叫做用户表征和内容表征。在这一步,原本各自代表一个现实特征的数字不再具备任何实际语义,两个模型会把用户特征和内容特征都转化为没有现实意义的数字代码 —— 因此,算法不用理解现实语义,只需处理纯粹的数学符号;

  • (3)将两组形式为纯粹的数字集合的用户表征和内容表征,放入同一个向量空间中,每一组数字集合便在向量空间中拥有了一组专属的向量值,好比一组独有的“数字指纹”;

  • (4)将训练过的所有内容表征的向量值和当前用户表征的向量值的距离进行对比,距离越接近代表用户越喜欢。当你的“数字指纹”和某个视频的“数字指纹”在坐标系里刚好比较“匹配”(距离近),算法就会推荐它。

抖音算法2

今年1月,抖音集团宣布拟推出10项措施,推动平台工作透明化,创建安全与信任的平台环境,打造更良好的网络生态,其中包括推进算法透明化和推进平台治理透明化。

 

 

版权声明:
1,Mac996站内所有应用软件及资料(除原创内容外)均来源于网络,如本站的内容对您的权利造成了影响,请与我们联系,我们会在第一时间进行修改或删除。
2,本站相关软件资源,仅供研究和学习使用,请在下载后24小时内删除。日常使用及商业用途的,请务必支持和购买正版。
3,本站赞助全凭自愿,您的赞助行为仅仅是出于对mac996的喜爱和支持,赞助将被用来提高网站的访问体验,而非购买资源。
4,如有问题/建议可加QQ群反馈,群号:958611112
5,本站统一解压密码:mac996.com
Mac996 » 抖音首次公开推荐算法原理:通过潜在特征预测行为

发表回复