深入了解 TikTok 看似无所不知的算法

深入了解 TikTok 看似无所不知的算法

自 2016 年首次推出以来,TikTok 每月用户量已超过 10 亿。其成功的关键在于其令人上瘾的滚动和无休止的视频流,这些视频似乎就是专门针对你的。很长一段时间以来,人们一直在想,字节跳动旗下的这款微视频分享应用收集了哪些用户数据,以了解如何为这台内容机器提供内容。现在,我们离答案越来越近了。

周日, 《纽约时报》记者从 TikTok 北京工程团队获得了一份内部文件,该文件解释了点赞、评论、观看时间和分享如何输入到推荐算法中,然后该算法评估视频对特定用户的吸引力。此外, 《纽约时报》看到的一张截图暗示,内容审核团队可以看到你发送给朋友或私下上传的视频,这暗示了更深层次的个性化。

《纽约时报》写道,这种算法的简化分解“揭示了该应用的数学核心,也让我们深入了解了该公司对人性的理解——我们对无聊的倾向、对文化线索的敏感性——这有助于解释为什么这款应用如此难以放下”。但它也强调了算法如何将你引入有毒内容的陷阱,“可能导致自我伤害”。

这些新细节基于《华尔街日报》今年早些时候的一项调查,该调查使用了 100 个自动“机器人”账户来记录个人在 TikTok 上的体验从各种流行的主流视频到更有针对性、更符合个人兴趣的内容的转变。例如,《华尔街日报》将一个对政治感兴趣的机器人编程为最终向其投放了有关选举阴谋和 QAnon 的视频。TikTok 的一位发言人反驳了《华尔街日报》的报道称他们的实验“不能代表真实的用户行为,因为人类的兴趣多种多样。”

[相关:为什么 Spotify 的音乐推荐总是如此准确]

根据《纽约时报》看到的文件,基于用户活动对视频进行评级的公式通常考虑了点赞、评论、播放次数和观看视频的时间等因素。其中还有一个公式,可以计算出个人创作者对观众的吸引力。《纽约时报》报道称:“推荐系统会根据这个公式对所有视频进行评分,并向用户返回得分最高的视频。”

库存问题

最终目标是提供一系列内容,最大限度地延长用户在应用上花费的时间,并让他们不断回访。但 TikTok 工程师意识到,如果他们只向用户提供一种类型的视频,该用户会感到无聊并离开该应用。为了解决这个问题,他们提出了两项​​算法补充,即向用户展示更多来自他们认为你喜欢的创作者的视频,并对具有相同标签的视频设置每日限制。他们还考虑在“为你推荐”标签中提供多样化推荐,将你可能喜欢的内容与你平时可能不会看到的内容穿插在一起。

“基本的想法是,他们希望页面能吸引眼球。你希望人们使用你的产品,”纽约大学社交媒体与政治研究中心联席主任乔舒亚·塔克 (Joshua Tucker) 说道。

“我认为 TikTok 的独到之处在于,它有一个界面,你可以直接联系你的粉丝,或者你可以说,TikTok,给我看看你认为我想看的内容,”塔克说。通过这种方式,TikTok 解决了塔克所说的“库存问题”,这个问题困扰着 Facebook 和最初的 Twitter 等平台。机器学习现在允许应用程序处理大量数据并推断个人偏好,而不是向每个用户提供相同的基本内容选项。除了你的偏好之外,平台还希望了解你的互动可能会如何根据你的网络发生变化。例如,你会因为你的朋友在看内容而查看它吗?

[相关:社交媒体确实让我们在道德上更加愤怒]

Facebook 的局限性在于,除了广告之外,它只会显示你关注的朋友和页面的帖子。而长期以来,Twitter 只显示你关注的用户的推文。“如果你注意到 Twitter 上最新的内容,即这些‘主题’,就会发现它们正在解决库存问题,”塔克说。“它为你提供了一种获得更多库存的方式,这意味着他们可以尝试更多的东西来了解你喜欢什么。TikTok 从一开始就通过‘为你推荐’做到了这一点。”

TikTok 的人工内容版主负责处理计算机算法难以分类的有争议的内容。根据 Netzpolitik 获得的一份泄露文件,他们可以删除内容、限制观看视频的人,并阻止视频被推荐或进入推送。随着 TikTok 审核系统日益自动化,如果创作者认为他们的视频被错误删除,他们可以向人工内容版主上诉。

TikTok 对您的了解有多少?

塔克认为,TikTok 之所以能如此迅速地了解你的品味,或许是因为他们拥有更多关于你可能喜欢什么的数据。

去年 6 月,TikTok 罕见地披露了其推荐算法的工作原理。该公司在一篇博客文章中写道,系统会权衡用户互动(点赞、评论或关注帐户)、视频信息(字幕、声音和主题标签)以及帐户设置(语言偏好、位置)相关的数据,以计算用户的兴趣。

[相关: YouTube 为何隐藏视频上的不喜欢内容]

尽管 TikTok 声称使用点赞、评论和分享作为衡量你对特定内容参与度的指标,但《华尔街日报》发现,该应用分析的最重要的元素是视频的观看时长——你是立即点击离开、暂停还是重新观看。数据科学家 Guillaume Chaslot 在回顾他们的实验时告诉《华尔街日报》,该算法可以看到你的反应,并能快速找出“你容易受到攻击的内容,这会让你点击,让你观看,但这并不意味着你真的喜欢它,也不意味着它就是你最喜欢的内容”。《华尔街日报》称,随着用户的信息流越来越小众,他们更有可能遇到审核人员审查较少的有害内容。成为一个问题,因为 TikTok 的用户群往往比 Facebook 或 Youtube 等其他社交媒体平台更年轻。

持续审查

自从 Facebook 举报人 Frances Haugen 在国会作证称,这些网站将参与度置于安全性之上,可能会放大危险的错误信息,此后网站的推荐算法就受到了越来越多的关注。立法者对此作出了回应,讨论了可能的监管变化,要求采用这些算法的平台对推荐内容可能带来的危害负责。

在研究 YouTube 的推荐算法时,塔克一直想知道,到底是算法引导你观看特定内容,还是人们的个人选择决定了结果。“无论如何,如果这些平台上的内容有助于美化儿童自杀,那么无论你通过什么方式看到,这些内容都不应该出现在那里,”塔克说。

[相关:国会正在为大型科技公司出手——原因及方式]

TikTok 表示,它一直非常谨慎地删除违反其规定的内容(包括自残内容)。该公司过去曾表示,它使用计算机和人工相结合的方式审查其内容。但错误还是会发生,有时视频会被错误标记,或者漏掉过滤器。

9 月,TikTok 在一份新闻稿中表示,该公司将推出新的“健康指南”,为通过该平台分享个人经历的用户提供支持,并提出负责任的参与技巧。该公司还宣布将扩大搜索干预措施,以便在用户搜索令人痛苦的内容时更好地提供危机支持资源。

“这对这些公司来说是一个真正的挑战,因为它们的规模太大了,”塔克说。“TikTok 发展得太快了。Facebook 也出现了这种情况:它发展得太快了,以至于没有意识到不同语言正在发生的危害。”

<<:  如何在一切事情上屏蔽某人

>>:  这些滑翔无人机可以将空军飞机上的补给运送到战场

推荐阅读

美国宇航局的 Ingenuity 直升机为何在火星上短暂熄火

美国宇航局的“机智号”直升机是一架火星旋翼机,上周与“毅力号”探测器短暂失联。此后,这架直升机已恢复...

评《大雪山英雄》:宏大的冒险与深刻的人物

《大雪山英雄Gaoh》:讲述人与自然共存的动人故事1978年播出的电视动画《高王:大雪山勇者》改编自...

有一个“空垃圾袋”围绕着我们的星球

地球轨道周围有很多太空垃圾,但很少有物体像 A10bMLz 这样奇特,天文学家将其描述为“空垃圾袋”...

《TALES OF THE RAYS 永恒宿命》的魅力与评价:追寻永恒的宿命

光芒传说永恒命运评论和细节概述《光之传说 永恒命运》是万代南梦宫娱乐公司出品的人气游戏系列《传说》的...

美国环保署称小型飞机仍在美国各地排放有毒铅

由于环境保护署的监管,美国空气中的铅含量自 1980 年以来下降了 99%,但含铅汽油并未完全消失。...

Wotakoi:宅男的爱情很难(7)特别版:终极宅男情侣面临的新挑战是什么?

《Wotakoi:爱对宅男来说很难》特别版OVA详细评论与推荐《宅男的恋爱真难》改编自藤田的人气漫...

测谎仪测试不能作为测谎仪,而且从来没有

历史学家肯·阿德勒写道,测谎仪长期以来被视为“美国的机械良心”。人们在危机时刻求助于机器,要求生物医...

聆听 OceanGate“泰坦”内爆的令人毛骨悚然的水下音频

美国国家海洋和大气管理局 (NOAA) 发布了致命的 OceanGate Titan内爆时的音频片段...

梅津一雄的诅咒:探索恐惧与迷恋的深度

《木叶村的诅咒》全方位测评与推荐概述《木村一雄的诅咒》是一部于 1990 年以 OVA 形式发行的作...

中国货船获得军事选择

中国人民解放军海军 (PLAN) 正在寻找新方法来扩大其海上后勤能力。虽然中国海军的重点是阻止敌方海...

使用 Google Drive 的搜索芯片,再也不会丢失文件

在全球最大搜索引擎公司旗下的平台上很难找到文件,这简直是讽刺。我们认为 Google 不会忽视这一点...

岩石可能能够释放二氧化碳,也可以储存它

岩石风化的自然过程可能向空气中排放与全球火山一样多的二氧化碳 (CO 2 )。10 月 4 日发表在...

美国宇航局正在测试太空激光将数据发回地球

在太空中通信可能具有挑战性。但 12 月 7 日凌晨,NASA 启动了激光通信中继演示 (LCRD)...

使用触控笔可以更好地使用智能手机

众所周知,苹果公司的史蒂夫·乔布斯不喜欢在智能手机上使用触控笔。但有很多理由可以忽略他的观点。首先,...

农事少女的魅力和评价! - 对乡村生活的新视角

“农家女孩!” “单镜头故事的吸引力及其背景“农家女孩!” 《おおおおすぎ》是一部于2010年10月...