伴随电子商务的飞速发展与社交媒体的广泛应用,商品、交易、新闻、评论、用户等社会化大数据呈爆炸式增长。海量的网络用户、巨大的市场规模,在促进经济与社会迅猛发展的同时,也带来了新的挑战。一方面,面对海量交易信息以及文本、图片、视频等复杂信息,信息超载问题日益突出,严重制约了市场相关参与主体的目标达成;另一方面,尽管当前信息传播的多元化、智能化推动了网络内容的多样化、情感化与信息共享的便捷化、普惠化,但面对全球各种思想文化交流交融交锋的复杂情景以及商业网络平台存在的逐利现象,一些违背主流价值导向的网络内容甚至是低俗信息在网络传播中的存在,对社会稳定和有效治理形成挑战。在此背景下,从技术层面解决信息超载问题,并通过信息定向引导构建良好的信息环境,成为应对挑战的关键要素,而科学有效的社会化推荐对于解决上述问题具有重要现实意义。
传统推荐方法在大数据时代面临瓶颈
推荐研究可追溯到1992年美国施乐公司帕克研究中心研发的邮件过滤系统Tapestry。面对大量电子邮件,人们迫切需要高效的文件管理技术提升工作效率,而Tapestry的诞生满足了这一需求。20世纪90年代末,作为亚马逊网站核心竞争优势的人工书目推荐团队,设立了《亚马逊的声音》栏目,成功提升了书籍的销售业绩;而后,基于客户历史偏好信息与商品的相似性,亚马逊公司又推出了新的推荐技术,带来了远高于人工推荐团队的经济价值,其销售贡献达到亚马逊网站的30%。2009年以来,伴随社交媒体的发展,好友推荐技术成为脸谱、推特等社交平台用户规模扩张与保持用户黏性的重要法宝。近年来,随着人工智能的快速发展,深度学习技术极大推动了推荐研究的发展,并成为国际商业公司的重要推荐方法。
在中国电子商务产业发展进程中,电商平台高度重视推荐系统的研发。例如,淘宝推荐系统涵盖了诸如商品详情、购物车等近百个不同的推荐应用场景;京东推荐系统基于用户偏好、长短期行为以及地域三类召回模型构建候选商品数据库,并应用排序模型生成商品推荐列表。电商平台推荐系统的应用,实现了从传统的“千人一面”界面到“千人千面”界面的转变,极大促进了经营业绩的提升。在新闻、娱乐等领域,推荐系统也已成为面向文本、图片、视频等多源异构内容传播与推送的核心途径,并推动了新兴媒体的发展。
面对广泛而深度的应用市场,全球众多研究机构、高校的科研团队围绕推荐方法开展了持续深入的研究,基本形成了基于内容的推荐、协同过滤推荐、混合推荐三大类划分,并针对冷启动、可解释性、结果评价等系列问题开展了进一步探索。科学研究与市场应用的交叉创新,推动了推荐系统的发展。当前,我国网民规模已超过8亿,电商平台与社交媒体正在深刻改变人们的生活方式。面对海量、异构社会化大数据的复杂情境,一方面,在推荐方法的科学研究层面,推荐场景的复杂性与动态性为我们带来了新的决策困难;另一方面,如何通过信息技术的创新实现对信息定向传播的引导、优质内容的推荐,弘扬正能量,是摆在我们面前更为重要的挑战。
计算社会科学为完善推荐方法提供新视角
传统推荐方法基于用户的历史评分数据构建行为偏好模型进而生成推荐方案,但受地域、情感等多维因素的影响,推荐效果受到明显制约。随着社交媒体的广泛应用,复杂的社交行为催生了用户群体的社会化网络。社会化网络环境下,人们的通信、交通、交易甚至是浏览数据被完整记录与存储,海量的“数字脚印”绘制成包含多维信息的个人画像、群组画像以及群体网络拓扑图。在社会化网络中,不同的子群体形成了横向结构,不同的社会角色形成了纵向结构,而子群体内部的个体关系、子群体之间的行为差异、不同角色之间的结构均衡则影响着社会化网络的稳定和演变。事实上,子群体内部个体之间的链接关系反映了相近的偏好,不同子群体的行为差异反映了群组的偏好特征。基于网络子群体的特征分析,社会化网络研究已广泛应用于经济学、管理科学、历史学、哲学、新闻传播学等社会科学领域,并推动了计算机科学的发展。
2009年,来自于信息科学、经济学、管理科学、社会学、政治学、历史学等不同领域的全球15位顶尖学者在《科学》杂志上提出了“计算社会科学”的概念,他们认为计算社会科学这门新的学科可为人类社会复杂规律的分析与挖掘提供新的研究范式。近年来,伴随社会化网络的日益复杂,计算社会科学领域的研究成果逐步涌现。从推荐方法现有的研究瓶颈来看,冷启动、可解释性、结果评价等仍然是其面临的主要挑战,而立足于社会化大数据分析的计算社会科学,将为推荐理论与方法体系的发展完善提供一个新的研究方向。
社会化推荐应关注价值观塑造与知识传播
与传统推荐方法相比,社会化推荐优势显著。面向个体用户,海量社会化大数据引入了用户关系、用户交互行为等信息以及跨领域的多维度信息,而用户交互行为以及跨领域信息的融合可有效应对冷启动、可解释性的挑战,也有利于实现推荐结果的多样性。而且,社会化信息的融合实现了日益精准的兴趣建模,极大推动了“量身定制”的个性化推荐。面向群组用户,在社会化网络中,频繁的用户交互行为引致网络社区不断涌现,如学术交流群组以及诸多公共服务均表现出典型的群组特性,社会化网络大数据为群组相似性偏好、差异性偏好、群体偏好集结提供了天然的基础数据支撑。如此,社会化推荐有助于增强用户黏性,促进企业经营业绩的增长。但与此同时,如果社会化推荐仍与传统推荐方法一样,为产品营销所驱动,则会带来显而易见的弊端。对个体用户而言,个性化推荐的信息同质性问题会诱导出“信息茧房”效应,进而引发个体偏执、极端甚至个体社会化属性的衰退;对群组用户而言,“信息茧房”效应的蔓延将引致群体的观点同质、行为同质、偏好同质,在社会重大问题或热点问题中极易引发舆情极化行为,进而影响社会稳定和经济发展。
有鉴于此,社会化推荐更应关注价值观塑造与知识的传播。具体而言,面向个体用户,社会化推荐应立足于社会化大数据的多维度信息优势,通过个体社交大数据的有效挖掘,精准判断个体的价值倾向与兴趣偏好,有效表达用户的多元化需求,基于社交影响力与兴趣建模实现面向个体的价值引导,挖掘新颖性产品或信息,实现推荐结果的多样化。面向群组用户,社会化推荐应着眼于社会化网络中横向结构群体之间的偏好差异、纵向结构群体之间的外部关联,通过融合网络结构与多源数据信息,准确判断建模群组的价值倾向、行为偏好与群组个体的影响力,实现面向群组的主流价值信息定向传播,规避“信息茧房”效应。唯有如此,社会化推荐才能在深度挖掘用户兴趣偏好与价值倾向的同时,实现推荐精度的提升与主流价值的定向引导。
(作者:宋鹏、梁吉业,分别系山西大学MBA教育中心执行主任;山西大学副校长、计算智能与中文信息处理教育部重点实验室主任)