社交分发与算法分发融合：信息传播新规则及其价值挑战

2019年11月26日 10:34 来源：《当代传播》2018年第6期作者：师文陈　　二、社交信息流原理及其算法

　　社交信息流在计算机业界也被称为Feed流，Feed指的是一种实时消息，在互联网平台

上，若干消息源会分布式地生产海量级别的Feed，汇聚成一个待筛选、排序的Feed池，平台则依据某种算法从池中筛选出特定的Feed，按照某种优先级顺序推送到用户界面，形成持续更新的Feed流(见图1)。

　　Feed流本质是一种信息分发方式，其名称最早源于RSS订阅中接收信息更新的接口，后来用来指将用户主动订阅的若干消息源组合在一起形成内容聚合器，帮助用户持续地获取最新的订阅源内容。

图1 社交信息流推送示意图

　　由于界面简单清晰易操作、可以实时更新，Feed流成为社交媒体最常用的信息呈现方式，微信的朋友圈，微博的好友动态均采用Feed流方式呈现，并通过在Feed流中嵌入非订阅的广告内容作为营收。在实际应用中，Feed流界面往往吸引了用户大量的注意力，对Feed的筛选排序机制成为调节用户信息消费行为的关键，其可以控制用户是否看到特定的内容，以及看到这些内容的顺序，优化Feed流的筛选排序算法成为社交平台提升内容质量，增加用户粘性的关键。

　　(一)社交信息流算法：传统的时间重力算法

　　时间重力算法也称Timeline模式，是社交平台发展初期最常采用的排序模式，其并非智能化算法，该算法假设所有关注者的动态都是同等重要的，因而在进行排序时，时间是唯一影响因素，完全按照反向时间顺序呈现社交圈中的新鲜事。时间重力算法借助消息队列以“先进先出”的原则呈现信息，一旦用户关注的对象生产出新的事件，便将其添加至队列尾部，而随着新事件的加入，时间较早的事件在列表中逐渐自然淘汰。

　　时间重力算法不对社交平台上的动态进行筛选，算法透明度高，用户界面上的信息列表是完整的信息环境，平台对用户信息消费的干预程度最低，通常不存在伦理层面的算法风险。

　　然而，从实际效果来看，筛选机制的缺失使平台缺乏“去重”操作，随着平台规模扩大和用户数量增加，大量冗余信息、无关信息重复出现，损害用户体验。同时，时间排序机制过于简单，智能化因素的缺失导致无法为内容设置优先级，用户的注意力资源未能进行最优分配，平台信息交互的效率有进一步提升的空间。

　　(二)社交信息流算法：关系加权算法

　　社交平台依托社交关系网构建，但用户之间的关系并非具有同等的价值，因而，通过对关系的筛选实现内容筛选成为智能化社交信息流算法的重要思路。对关系进行加权的思路有两条算法路径：

　　第一种是亲密关系加权算法，其典型代表是Facebook曾经采用的EdgeRank算法，[5]即用户执行的每个行为都会创建一个边(行为)，该算法试图对边的重要性进行排序。EdgeRank的公式为

，其中有三个因素在影响行为的重要性，其中，u是EdgeRank算法的核心，其表示的是行为发生者和行为观察者之间的亲密度，Facebook通过查看用户近期采取互动的频率、二者在社会网络中的距离来计算两个用户亲密度得分；w表示边的权重，用户此前不同的行为类型具有不同的权重，即发生深度互动的用户关系强于点赞之交；d是与社交关系无关的客观指标，表示时间衰减因子，控制内容的时效性，使事件的重要性随着时间的流逝降低。

　　第二种关系加权路径是对重要关系进行加权，其代表是PageRank算法。[6]PageRank算法由Google的两名创始人Larry Page与Sergey Brin提出，最早应用于搜索引擎，是通过超链接关系对网页重要性进行排序的大数据算法。PageRank算法认为网页的入链数量和网页质量两个因素决定了网页的重要性，如果一个网页被很多其他网页链接，则说明这个网页比较重要，网页对应的PageRank值会相对较高，进一步讲，如果一个PageRank值很高的网页链接到一个其他的网页，那么被链接到的网页的PageRank值会相应提高。PageRank的计算公式是

，其中p1，p2，p3，…，pN为所有被研究的页面，q为阻尼系数，L(pi)为pi链出的页面数量，N是所有页面的总数。学者在此基础上针对Twitter上社交网络的拓扑结构改进提出TwitterRank算法，[7]衡量特定用户在关系网中的地位，[8]并据此为用户调整推荐权重。

　　EdgeRank算法中对亲密社交关系强调符合社交平台的产品定位，但是对亲密社交关系的长期加权很容易使用户陷入相对封闭的同质化社交圈。根据社会学家的研究，[9]纵然人们可能在社交平台上拥有大量好友，但是人类智力和社会网络的特征决定人类拥有稳定、亲密的社交规模约为150人，算法对亲密社交圈的识别可以帮助用户进行高效信息筛选，但是势必会促使大范围的交往变成私人领地内部的互动，阻碍新的社交关系形成和维护，最终导致开放性剥落，“亲密专制”兴起。在宏观层面上，这种对社交关系的强调会进一步加剧圈层的分化，不同圈层建构出迥异的群体认同和社会感知，社会割裂成一个个隔绝甚至对立的回声室，社交平台无法通过高效的信息传播和意见送达实现社会整合功能，本应具有公共属性的社交平台变得碎片化。

　　PageRank算法可以一定程度上弥合EdgeRank对于群体中“强连接”的片面强调，其逻辑本质是通过计算机数据结构中的有向图计算锁定社交网络中的意见领袖，发挥群体中“弱连接”的优势。这类意见领袖虽然与用户互动的频率较低，但是其社会经济地位高、教育背景良好、与大众媒体接触较频繁，通常会为群体提供高质量、非同质化的信息，强加这类节点对于信息扩散的把关能力，有助于促进信息的垂直流动，加快信息扩散。

　　(三)社交信息流算法：兴趣加权算法

　　对兴趣进行加权的社交信息流算法试图为用户推荐与其兴趣相似度高的新闻产品。[10][11]其技术路径有两种，[12]其一是基于内容的推荐，其原理为根据用户显式披露的或隐式呈现的信息偏好，通过机器学习模拟用户的兴趣模型，随后对待排序的内容文本进行特征提取形成向量，计算文本向量与己有兴趣模型的相似度，得出文本的兴趣权重。第二种对兴趣特征进行加权的方式是协同过滤算法。协同过滤算法是一种利用群体智慧的推荐方式，进一步分为基于用户的协同过滤算法和基于物品的协同过滤算法。前者的假设是“对某条内容感兴趣的人群，有较大的概率在其他方面也有共同的兴趣”，后者的假设是“两条内容如果总是被同一个用户阅读，则对其中一条感兴趣的用户，有更大概率对另外一条内容也感兴趣”，不论是基于用户的协同过滤还是基于物品的协同过滤，其背后依托的都是属于无监督机器学习的聚类算法，无监督机器学习的训练数据集中仅有特征，没有标签，在程序员输入数据和聚类的簇数后，机器自动生成参数，将用户或者内容分成类内相似、类间不相似的若干类别，在类内展开内容推荐。

　　以上两种算法均为推荐系统的经典算法，通过对用户兴趣进行建模和预测，兴趣加权算法可以推荐用户更愿意阅读的内容，提高用户的粘性。但是相比推荐系统在购物、音乐等领域的应用，其在社交平台中的应用需要面对更严格的审视。李普曼指出，人们日常生活中存在三重环境，[13]第一重环境是现实中存在着的不以人的意志为转移的“客观现实”，第二重环境是传播媒介经过有选择地加工后呈现的“拟态环境”，第三重环境是存在于人们主观意识中的“关于外部世界的图像”。其中，“拟态环境”和客观环境一起影响受众主观意识中的世界。如今，社交平台成为越来越多人进行社会感知的信息来源，虽然传统的时间线排序方式呈现的信息环境也不意味着对客观现实的精准镜像呈现，但是基于兴趣推荐的算法会使符合用户头脑中主观期待的信息有更大概率被呈现，即算法介入之后，用户头脑中的“主观现实”得以对拟态环境施加影响，而拟态环境也反过来对“主观现实”起到持续加固作用，这种循环互动过程会导致二者日趋封闭，与客观现实环境发生更大的错位。在兴趣加权算法的介入下，传统大众传播时代的非个性化的信息环境变成“投其所好”式的定向投放，信息价值观发生偏向，大众传播的教育、整合功能在智能化社交平台上日渐淡化。

　　(四)社交信息流算法：互动加权算法

　　虽然对内容和关系进行加权之后在很大程度上可以满足用户的信息需求和人际需求，但是对于社交平台而言，二者不能解决所有的问题。一方面，基于兴趣和基于关系的加权仅增加了用户的信息消费行为，却不一定能促进评论、转发等信息再生产行为，既无法满足平台方通过增强互动提升用户粘性的需求，也无法为社会提供公共讨论的空间；另一方面，上述打破传统时间线的两种加权方式使得时间维度被降权，平台对新闻的响应能力下降，需要其他加权方式进行弥补。因而部分社交平台将互动指数引入算法，将特定内容引发的转发、评论、赞同的能力作为互动指标进行加权推荐，将在公共讨论中处于显著地位的内容优先加入社交信息流。

　　互动指标的引入是一把双刃剑，其在一定程度上可以增强热点议题的推荐权重，促进公共讨论，加强社交平台的公共性。但是在后真相时代，诉诸情感和信仰比陈述客观事实更能影响民意，情绪化的内容更容易引发社交平台上的互动和传播，[14]在此基础上，算法对于互动指标的加权推崇，加剧了推荐结果陷入情绪化陷阱的风险，煽情、耸动、肤浅的内容将有更大概率获得推荐，社交平台面临电子时代的“黄色新闻潮”风险，对互联网治理，对社会责任、新闻伦理、新闻专业性受到挑战，[15][16]或成为信息传播中的边缘价值。　三、算法的效率与伦理缺陷

　　面对社交平台信息过载的问题，智能化的信息流算法可以帮助用户筛选感兴趣的高质量内容，提高用户获取内容的效率，改写传统媒体时代的大众传播规则，使原本割裂的智能分发和社交分发融合形成全新的智能化社交分发机制。但是通过对社交信息流算法的权重剖析，我们可以看出，效率意味着代价，各类加权算法均具有一定的伦理缺陷，对兴趣的加权容易加剧用户信息环境与客观现实的错位，对关系进行加权需要妥善平衡“强连接”和“弱连接”在群体传播中的角色，而对互动指标加权会助长后真相时代的弊端，甚至诱发社交媒体上的黄色新闻潮。

　　在实践中，社交平台多采用综合考量了各类加权指标的混合算法，这是一个有意义的努力。但是，混合算法不一定能使各种加权算法的内在缺陷消失，它是在权衡各类风险。值得注意的是，采用混合算法会进一步降低算法的透明度，正如Facebook一直未公布EdgeRank算法的进一步细节，社交平台的信息流算法属于商业机密，复杂的算法无法接受公众的详细审视，也并非工程师个人可以掌控，掌握信息分发权力的科技巨头拥有黑箱算法的完全决定权，成为名副其实的“把关人”，一定程度上决定了用户的信息消费和生产行为。在算法的介入之下，社交平台既可以通过屏蔽关键字使特定事件出现在公众议程上的概率降低，也可以出于商业动机为某些本不应被推荐的内容进行加权。在社交媒体日益成为人们获取信息、交换意见重要渠道的情况下，科技权力的“信息把关权”一旦为政治、商业权力背书，即会向社交平台的公共性发起挑战，使公共领域面临“再封建化”的风险。

　　在传统媒体时代，新闻生产和分发的权力均由传统媒体掌控，职业新闻人的新闻专业主义为大众媒体信息传播的合法性提供保障；在社交分发时代，内容和渠道发生分离，新闻分发的权力被转移到社交平台的用户手中，传播的中心性被弱化，普通用户成为拥有权力信息把关人；在算法分发时代，技术精英通过技术优势使传播的控制权从人类转移到机器，事实上收回了信息把关权。而算法对社交领域的介入，实则是科技精英和机器逻辑的进一步扩张，对此，新闻传播学界一方面要前瞻性地考察智能化社交信息流算法为传统分发、社交分发、算法分发的既有格局带来变革，一方面也要深入算法逻辑内部，对算法背后隐藏的价值观进行考量，警惕智能算法介入社交平台人际传播、群体传播之后产生的方向性偏差和价值风险，用人文关怀弥合技术逻辑背后的价值缺失。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。