推特算法是如何工作的?(3步漏斗模型)
在GitHub开源的代码中,X的推荐系统被描述为一个巨大的“漏斗”。当用户刷新推荐首页时,系统会在几百毫秒内完成以下3个步骤的计算:
第一步:海选(Candidate Sourcing)
这是漏斗模型的最顶端。系统会从数亿条推文中,为您抓取约1500条候选推文。这 1500条推文的来源来源通常是下面2种,各占百分之50。
- In-Network (关注的人):你关注的人最近发了什么。
- Out-of-Network (未关注的人):这是算法的核心。系统通过SimClusters(兴趣簇)技术,判断你属于哪个圈子(比如“科技圈”或“美妆圈”),然后把该圈子热门的推文抓取过来。
如何增加你的推文进入第一步海选的概率:你的推文应该有明确的主题,放大到更高的层面就是,你的账号应该也稳定的发布关于某些圈子的内容,打造账号的画像,让推特知道你到底是哪一个圈子的。
第二步:打分(Ranking)
这是漏斗的中间层。系统会用机器学习模型(Light Ranker)给这1500条推文打分。打分的标准非常功利:机器预测用户对这条推文互动的概率。
算法会问自己:“用户点赞这条推文的概率是多少?回复的概率是多少?”最终得分越高,排名越靠前。
如何才能打分更高:分数越高,排名越靠前。如果这条推文能触发高权重的互动(如回复),自然排名就会火箭式上升。你的推文可以在结尾,写一些让用户互动的内容,增加互动率。
第三步:过滤与重排(Filtering)
这是漏斗的底端。只有大概500条推文会进入这里,这一步会过滤掉:
- 已读内容:用户看过的推文不会再出现。
- 屏蔽内容:用户拉黑的作者,或者你屏蔽的关键词。
- 敏感内容:敏感内容会视情况被降权或折叠。
- 多样性限制:避免连续给你推同一个作者的推文。
在完成过滤之后,按打分的分数,从高到低为用户首页推送内容。
权重揭秘:具体的加分与扣分细则
在简单理解了算法之后,我们可以发现”打分“是一项非常重要的内容,分数的高低决定你能不能登上用户的推荐首页;下面我们根据公开的算法,看看什么行为会加分和扣分。
核心加分项(Boosts)
- 回复且作者回应(权重 75x):这是算法中最大的秘密。算法非常喜欢有互动性的推文,而且是双向的互动。这意味着如果有人评论你,你必须回复他,才能获得最大幅度的加权。
- 点击并停留(权重 11x - 22x):用户点进推文并停留超过2分钟。时间越长权重越高,因此长推文和视频更有优势。
- 转发(权重 20x):转发权重也很高,因为转发用户认可你的内存产出,意味着你的内容值得传播。
- 点赞(权重 0.5x - 1x):点赞是最廉价的互动,权重其实很低。指望靠点赞上首页是比较困难的。

致命扣分项(Penalties)
- 被屏蔽/拉黑:如果你的推文导致用户屏蔽或拉黑你,权重会扣除-74x甚至更多。这意味着你需要几百个赞才能挽回一个拉黑的损失。
- 带站外链接:只要正文包含跳转链接,系统会自动标记为垃圾广告嫌疑。除非该推文互动极高(才能豁免),否则很难上首页。
- 无文字纯图:现在的机器学习模型能理解完整的图文。如果发图不配文字,可能被视为低质量内容。
如何利用算法写出爆款推文?
基于上述算法逻辑,我们为您总结了3条“算法友好型”发推策略:
1. 制造“对话陷阱”(针对75x权重)
发完推文不是结束,而是开始。不要写陈述句,要写疑问句。比如:“你们觉得今天这张照片好看吗?如果是你们,喜欢带什么发饰呢?”。通过设问来合理的增加互动性
2. 链接的正确放法(规避降权)
既然外链会降权,那就不要放在正文里。请把链接放在评论区下面。这样既能引流,又不会触发正文的降权检测。
3. 垂直领域
为了在第一步“海选”中被选中,你必须让算法看懂你是谁。如果你是卖宠物的,就一直发关于宠物的内容;如果你是做食品生产的,就一直发关于食品的内容。千万不要今天发猫狗,明天发自己喜欢的球星,这样会导致你的账号在“兴趣簇”中权重分散,降低系统推送你的可能性。
关于如何更好的打造你的垂直标签,您可以参考这篇文章:给推特账号打上“垂直标签”的方法
附录:推特(X)算法开源代码仓库
本文的所有解读均基于X(前推特)官方在GitHub上公开的源代码。如果您是技术人员,或者想深入研究更多细节(如SimClusters的具体分类),可以直接访问官方仓库进行查阅。
GitHub 仓库地址:https://github.com/xai-org/x-algorithm