青记独家丨AI如何做新闻:基于全球106个案例的分析(2017-2022)

Mark wiens

发布时间:2023-01-22

  本文依托mAkIngnews案例库对2017—2022年约5年间全球106个AI做新闻的案例进行时空分布、采纳主体、技术应用三个层次的分析。研究发现,全球范围内AI做新闻的时空分布严重不均,欧美地区优势明显;传统媒体和通讯社对AI技术的采纳更为积极,但均停留在较为浅层次的应用上;AI做新闻在一定程度上可以帮助媒体纠偏,但受数据与模型影响也会引入新的偏见。据此本文讨论了新闻业采纳AI技术做新闻的技术、用户、信息、环境四方面影响因素。

  “新闻业的未来及其商业模式似乎总是受到技术部署的渗透与束缚。”[1]近年来,新闻媒体在新闻产品的生产与分发,新闻服务的创新与改革方面,均受到了来自技术驱动的极大影响。这种影响是双向的,既可以在各种新颖的新闻产品和新鲜的业界实践中感受到,也能从媒体机构、新闻从业者、平台公司之间众多的争议问题中体察出来。自2017年以来,关于人工智能技术(AI)的讨论一直是热议话题,而采用AI做新闻也成为了新闻业的一种“淘金热”[2]:一方面,持续迭代进化的AI技术简化了新闻业中繁重僵硬的日常工作,自动化写作将记者从机械式的“填空新闻”中解放出来,数据分析可以为记者提供新闻线索,发现新闻点,互动新闻拉近了内容产销的规模化效率,在一定程度上提高了新闻消费等;而另一方面,对智能技术和计算思维的陌生成为记者的职业天花板,被其超过和取代的恐慌足可称之为职业梦魇,巨大的资源投入和不确定的收益让媒体机构对引入AI技术的态度模棱两可,在新闻生产中引入AI技术或将更多的控制权转移给平台公司,并增加新闻业对平台公司的依赖性,而该领域的高水平人才也会在综合考虑薪酬待遇和未来发展后对入行媒体心怀不安。

  但这种蓬勃向上又危机四伏的状态可能伴随每一种新鲜事物的成长。2017年,国务院发布了《新一代人工智能发展规划》,这是我国第一个国家层面对人工智能发展所做出的中长期规划。此后,工信部、教育部、科技部、发改委等均印发了相关发展规划,积极开展工作行动,明确具体的任务指标,营造有利的制度环境,推动人工智能的基础建设,促进人工智能产业发展。人工智能技术在新闻业中具体采纳和开展的情况如何?引入人工智能到新闻业中是不是又一次的“引狼入室”或“同床异梦”?据此,本文通过分析全球范围内采用人工智能技术做新闻的具体案例,从实证的角度对这一问题进行考察。

  在展开具体分析之前,本文需要对两个概念以及相关关系进行界定和说明:第一,人工智能技术。一直以来,关于何为人工智能,哪些技术可以归入人工智能的范畴,其内涵和边界处于不断变动之中。作为“计算机学科中专注于模拟人类智能的分支”[3],人工智能的定义有广义和狭义之分,涵盖的技术形式也有通用和特定之分。比如根据2020年8月国家标准化管理委员会联合中央网信办、国家发改委、科技部、工信部印发的《国家新一代人工智能标准体系建设指南》(以下简称《建设指南2020》),人工智能标准体系框架划分为基础共性、支撑技术与产品、基础软硬件平台、关键通用技术、关键领域技术、产品与服务、行业应用、安全/伦理八个部分。这八个部分紧密相连,共同构成了人工智能的体系框架。其中“支撑技术与产品”包括大数据、物联网、云计算、边缘计算、智能传感器、数据存储及传输设备;“关键通用技术”包括机器学习、知识图谱、类脑智能计算、量子智能计算、模式识别;“关键领域技术”包括自然语言处理、智能语音、计算机视觉、生物特征识别、虚拟现实/增强现实、人机交互;产品与服务包括智能机器人、智能运载工具、智能终端、智能服务。

  就新闻业来说,对于人工智能体系框架的采用并非平均的。在研究了人工智能技术在媒体产业中的采用情况后,有观点认为,人工智能目前虽然是归属于计算机科学领域,但其核心任务“认知的自动化”的发展必须是与数据、传感器等相关技术领域齐头并进的[4]。有研究从实际应用的角度出发,认为虽然何为人工智能是一个有争议的概念,但其九大功能主要分布在七大技术子领域中:机器学习,计算机视觉,语音识别,自然语言处理,计划、调度与优化,专家系统,以及机器人[5]。但这样的划分依然存在问题,如果对照“七大子领域”和《建设指南2020》我们会发现,这七个子领域分别处于标准体系不同的部分中,跨越了支撑技术与产品、基础软硬件平台、关键通用技术、关键领域技术、产品与服务等,并在一些领域和应用中还存在交叉。因此对于新闻业来说,在一定程度上所谓“人工智能”并不单指某一技术形式,而是一系列联合采用人工智能体系框架的组合。

  第二,新闻业是不是人工智能技术的场景?如果仔细寻找会发现,在《建设指南2020》规划的行业应用中,涵括了智能制造、智能农业、智能交通、智能医疗、智能教育、智能商务、智能能源、智能物流、智能金融、智能家居、智能政务、智慧城市、公共安全、智能环保、智能法庭、智能游戏在内的16类行业应用,但没有“智能新闻”的说法。2022年7月,科技部等六部门联合印发了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》(以下简称《指导意见2022》),其中再次明确了建设智能社会所需要打造的重大场景,“以更智能的城市、更贴心的社会为导向,在城市管理、交通治理、生态环保、医疗健康、教育、养老等领域持续挖掘人工智能应用场景机会,开展智能社会场景应用示范”,其中依然没有新闻业。

  所以人工智能做新闻是不是一个伪命题?本文认为,人工智能技术定义边界的不稳定性,与新闻业未能明确在相关纲要提出的人工智能建设的场景中,并不影响对人工智能做新闻的研究。首先,不管是人工智能的“七大子领域”还是《建设指南2020》中罗列的技术类型,在新闻业的生产传播实践中均已有涉及和应用;其次,虽然没有明确建设“智能新闻”的场景,但几乎在所有人工智能创新的建设中,都离不开基于内容—界面的人机交互,那么新闻业所进行的内容生产传播必然处于其中;再次,不管是中介化还是深度媒介化,人工智能的“关联、识别、预测”功能都极大地依赖于新闻业在社会中所处的连接位置与关系创生。

  因此,本文将“AI做新闻”定义为“基于人工智能标准体系,采用相关技术、产品、服务所进行的新闻生产与传播实践”。根据这一标准,结合现今已有的关于AI做新闻的案例研究,我们在媒体从业者、互联网公司技术人员、教育培训机构的帮助与协作之下,在全球范围内收集整理了106个AI做新闻的项目案例,时间跨度从2017年至2022年约5年时间。限于本研究的项目规模和选取标准,这106个案例无法涵盖全球范围内人工智能做新闻的所有案例,但在一定程度上可以反映该领域的一些现实问题。通过分析,本文尝试回答以下三个问题:

  (一)时空分布。本次研究依托的mAkIngnews案例库,截至2022年12月共征集到106个有效案例,分布于21个国家,6个地区。其中,美国的案例数量最多,有40例;其次为英国,有22例。从地区分布来看,北美(41例)、欧洲地区(40例)探索AI在新闻领域使用的案例也是最多的,此外还有8例显示为“全球”,分别来自路透社(6例)和国际调查记者联盟(2例),2例显示为地区媒介集团。可见,AI在新闻领域的实践在地区分布上并不平衡,集中在北美、欧洲两大地区,而尤以美国、英国两国居多。

  从各地区开始出现AI做新闻案例的时间来看,北美、欧洲最先于2017年就开始了相关探索,其中,北美3例,均来自美国;欧洲的1例来自英国。到2018年,大部分地区都开始出现了相关案例。而大洋洲AI做新闻案例出现的时间相对较晚,第一个案例出现于2020年,较大部分地区晚了两年。

  (二)采纳主体。在106个有效案例中,涉及的参与主体基本可划分为传统媒体、通讯社,媒体集团,公共广播电视机构,数字媒体,技术公司,学校六大类。其中传统媒体、通讯社的案例数达到49个,占46.2%,也就是有近半数的AI技术使用案例仍来自老牌媒体公司。

  从各地区进行AI探索的主体视角来看,大部分地区都以传统媒体、通讯社为主要主体。值得关注的是,欧洲的公共广播电视机构案例数量与传统媒体、通讯社齐平,均有12例。媒体集团的表现也相对突出(7例)。在案例出现时间偏晚的大洋洲,其参与主体也存在与地区十分不同的现象,主要为公共广播电视机构及媒体集团,却没有传统媒体、通讯社的身影。此外,关注到人工智能教学时,发现只有北美、欧洲出现了将人工智能引入新闻学院教学的案例。

  (三)技术应用。通过案例统计发现,新闻业对AI技术的征用已涉及新闻采集、写作、呈现、分发、反馈、交互等各个环节。mAkIngnews案例库中的106个案例,涉及的AI技术应用类型主要包括:自动化新闻写作、新闻报道、增强记者报道、视频图像处理、个性化推荐、用户订阅、评论识别、用户互动、新闻责任、教育培训、新闻工作室AI布局、信息聚合、创新应用等。

  在各环节的技术采纳中,新闻写作环节(包括自动化新闻写作、新闻报道、增强记者报道)对AI技术的使用最为突出,共有47例,占44.3%。“自动化新闻写作”指完全由机器写作新闻或标题。在自动化新闻写作中,关于“人工智能是否会取代人”的讨论时常出现,但在涉及相关讨论的案例中,并未有案例表示人工智能的使用是为了代替人类记者,相反,往往出现人工智能在“提供常规新闻报道工作之外的内容”、将AI应用于“不会投入工作人员报道的领域”等此类表述,表明自动化新闻生产是为了扩大报道范围,而不是取代人类记者已经报道的领域。不少案例中也展现出其扩大本地新闻报道,减少新闻荒漠的效果。

  “新闻报道”指将AI技术应用于具体报道内容中,主要集中于事实核查报道及调查性报道。“增强记者报道”指由人工智能提供线索、人机协作生产新闻或是通过判断已有报道的价值,为人类记者提供报道方向参考的案例。在此类案例中,人工智能通过大量数据整理为人类记者提供可发掘的新闻故事,此类技术同样可以生成语句,但并不追求完整报道,而是强调与人类协作,完成各自擅长的部分。或是通过为文章生成自动标签等方式识别为已发布文章主题,并进行价值评分,预测热门话题,以供记者参考。

  当涉及文字、语音处理时,被提到最多的是技术形式是机器学习(Machine Learning,ML)与自然语言处理(Natural Language Processing ,NLP)技术;而在图像、视频处理中,计算机视觉(Computer Vision)则较为常见。科技公司在技术提供方面的优势是比较突出的,不少案例中提到应用技术时,指出自己使用了一些公开的技术模型,或是与技术公司、学校等进行合作。比如,在2例有关评论识别的案例中,无论是西班牙的《国家报》[6]还是美国的《纽约时报》[7],均使用的是谷歌旗下的Jigsaw开发的机器学习模型Perspective。

  在新闻写作之外,新闻业对于AI技术的采纳也很早出现在新闻分发环节。在尝试过使用AI技术自动写作新闻后,不少媒体机构发现其投入高、实现难度大,进而转向人机协作,由AI与人类记者协作进行报道。目前自动化写作仍多用于体育、房地产、教育等数据强相关、模版性较强且在常规新闻报道工作中不会大范围涉及的垂直领域。

  有关用户互动技术的使用出现时间较晚,且集中于公共广播电视机构,主要涉及对话式用户界面的构建(conversational user interfaces,CUI)。这需要跨越多个平台收集新闻数据,涉及文本、语音、视觉多方面技术的应用,整体构建仍处于早期阶段,有待进一步产品优化、完善实施。

  人工智能作为技术创新,其在新闻业中的采纳和传播过程中会带来双面影响。比如对于采纳主体来说,AI技术的引入确实带来了减少报道歧视的可能。比如挪威的《卑尔根时报》借助计算机视觉识别报道中女性形象出现的次数,发现女性读者的比例随着女性图片比例的增加而增加。[8]尽管是出于拓展用户群体寻求报道多样化的需求,但这样的探索的确改善着报道。英国《金融时报》通过使用机器人对代词和名字进行识别,当新闻中突出女性角色方面做得不够,就会收到警告[9]。

  但另一方面,在人工智能工具训练中,又不可避免地带入数据和模型中已经存在的性别、种族等偏见。比如《纽约时报》在应用评论识别机器学习模型Perspective时,就发现其评论筛选存在偏见问题[10]。为此,我们不能盲目相信机器学习,也需要对其进行持续监督。在历年的AI技术采纳分析中也可以发现,在2018-2020年AI技术的密集征用时期,有关新闻业需要“负责任地使用AI技术”的讨论在增多。

  而通过对这106个AI做新闻的案例进行分析我们还发现,新闻业对AI技术的采用还受到技术、用户、信息、环境四方面因素的制约:

  就其技术本身而言,受先发优势与基础条件的影响,全球范围内AI做新闻的时空分布严重不均。美国、欧洲在项目数量、发起时间上均占有明显的优势。但近年来的趋势也反映出在亚洲、大洋洲等地区,AI做新闻的项目呈现上升趋势,基于人工智能的后发项目可以吸取之前的经验和数据,启动更快效果更好,甚至可以实现弯道超车。

  对潜在采用机构来说,传统媒体、通讯社对于试水AI做新闻项目更为积极,表现为新闻创新的动力和全球传播的业务需要。但这些机构对于人工智能技术的采用均处于较为浅层的水平,很多只是既有业务的数字化和重心转移,比如自动化写作、事实核查、增强记者报道等。其中原因与传统机构的新闻业务、生产盈利模式相关,也同制度环境、资金投入、变革阻力、未来定位等相联系。

  在技术的扩散条件上,平台媒体和技术公司在AI做新闻中扮演了重要角色。尤其是像谷歌、字节跳动这样的技术公司,在计算机视觉、个性化推荐等核心技术方面占有绝对优势。很多传媒集团和机构在开展此类项目时,必须选择同数字媒体和技术公司合作。这将带来的可能后果是,人工智能技术进一步扩大了平台技术公司对媒体机构新闻生产的控制权,并将这种控制权力从分发渠道侧渗透进内容生产侧。

  就AI做新闻的现实环境而言,其所需的高水平计算机人才成为关键的制约因素。相比其他行业和领域开出的薪资待遇,传媒业对可以从事AI做新闻业务的高水平计算机人才普遍缺乏吸引力。虽然很多AI做新闻的项目意在协助记者进行新闻生产,但由于缺乏计算思维和相关知识结构,很多AI做新闻的项目后续乏力。同时,在新闻院校中对于该交叉学科人才的培养仍旧非常欠缺。

  (方师师:上海社会科学院新闻研究所副研究员,互联网治理研究中心主任;贾梓晗:上海社会科学院新闻研究所硕士研究生)

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186