“我们选择的标准是为了让它们比较严谨、有价值,有历史保存价值,也有读者看的价值。”
在极权政府掌控的资讯环境中,资讯不仅不公开透明,各种内容都会被审查,甚至遭删除,这严重影响历史档案的保存与资讯传递,但在这20多年间,陆续有专门保存档案的民间机构成立,投入公开、传播资料的行动。
《中国数字时代》(China Digital Times,CDT)是2003年在美国成立的中英文新闻资讯网站,其中有个“404文库”项目,专门保存在中国网路上遭封锁或删除的文章。
“(保存档案)困难不在于技术,在于怎么样去判断,什么样的(资料)需要(保存)”,CDT创办人萧强提到,现在有许多技术可保存档案,像是区块链(Blockchain),更易存档,还不能修改,但这是借由区块链技术特性,并非有标准查核流程,所以要用区块链技术存档,必须要有鉴定方案,这关系到人的信誉。
香港行动文献库(Hong Kong Action Archives,HKAA)执行长Sam同样对区块链有疑问,虽然区块链的好处是能对抗审查,因为放上去的内容会永久存放在那边,但当提供物品的原物主可能之后有困扰,就会面临无法撤下资料的情况。HKAA是在台湾的香港人于2025年4月成立的组织,保存1960年代以来,香港大小社会运动中的物品和文件。
同样在2025年4月成立的香港问责档案库(Hong Kong Accountability Archive,HK Archive)专门保存2019年“反送中”(反修例)运动中,警察执法情况的影像资料。对于是否会用区块链保存档案,该组织回道:“我们当前优先要务是确保目前平台的可持续性,以及扩大可提供给使用者的内容。”
档案存放区块链有双面影响
2019年创立的台湾新创科技公司“主张数据”(Numbers Protocol),则是借由区块链技术,强化数位资产的安全性和透明度,并开发数位内容注册工具“Capture”。该公司共同创办人严世纪(Sofia Yan)说,自己不是媒体人,所以把Capture当成存证工具,因为就算现在手机拍照会自动带入诠释资料(元数据,Metadata),但仍能修改,Capture则不同。
Capture有电脑版本的Capture Dashboard、手机应用程式(App)的Capture Cam,以及开发者工具Capture SDK,透过这些系统上传、拍摄的影像都会放在区块链,并拥有细节资料,确保影像真实性及可信度,同时保障这些影像资产,且影像获得的“数位身份证”符合内容来源与真实性联盟(C2PA)及ERC7053标准,其为让数位内容拥有可信足迹的以太坊(Ethereum)标准。以太坊是去中心化、开源的区块链平台。
主张数据(Numbers Protocol)有个“Numbers Archive”计划。图为2022年收录的政治类档案。(翻摄Numbers Archive网站)
严世纪提到,任何人想用Capture上传的影像,要取得原作者的授权。她也说,媒体公司与自由接案的摄影记者、公民记者合作时,这也有助于查证他们提供的影像;传统媒体则可借此活化自己的资料库。
此外,Numbers Protocol曾与史达林实验室(Starling Lab)合作,向国际刑事法院(ICC)提交加密影像,作为控诉俄罗斯在乌克兰犯下战争罪行的证据。史达林研究室是在美国的学术研究机构,由史丹佛大学电机工程学系(Stanford EE)与南加州大学浩劫基金会(USC Shoah Foundation)共同创立,旨在把历史学者、法律专家及新闻工作者带入Web3新世纪。
有助问责警察执法、AI生成训练
谈到保存档案,严世纪直言,“我觉得很重要”,这如同史书让人们了解过去的历史,另个重要之处是生成式人工智能(AI)需要模型训练,而这些训练资料都是人类所生产,“如果这些没被存档起来,就是我们在网上的所有这些遗迹的话,怎么去产生新的模型?”
严世纪告诉《田间》,Numbers Protocol有个“Numbers Archive”计划,收录年度大事件的影像资料,涵盖选举和大型社会运动,但版权仍属原作者所有。HKAA与HK Archive保存的档案中,同样有版权是属于原作者或提供者。
Sam表示,HKAA期许成为民间典藏机构,虽然各国都有学术单位愿意保存档案,但民间自主搜集和保存,会希望有一天能带回香港展示。她提到,HKAA的短期目标是先建立归档系统,这在筹备阶段就有进行,且是参照国际档案理事会(ICA)制定的《国际档案描述通用标准》(ISAD(G))来建档;中期目标则是在2026年推出线上博物馆,放上约2000件保存的档案资料;公开所有保存物品则是长期目标。
香港问责档案库(HK Archive)透过影像档案统计警方在2019年示威活动中的执法情形。(翻摄HK Archive官网)
HK Archive的短期目标与HKAA相同,都是先把收到大量影像分类归档,这是相当耗时的程序,同时检视回馈,让网站变得更好使用。HK Archive坦言,当前香港政治局势为建档带来诸多挑战,大部分涉及安全议题,因为在《香港国安法》实施后,原本提供档案的人担心遭到香港政府和香港警务处(HKPF)报复。
HK Archive强调,其成立目的就是向在2019年和平集会中,迫害权利的人究责,并进行独立调查,只有这样才能提升HKPF对集会人群的执法行为,以及政府如何回应香港人民的渴望及人权。
“2019年集会的相关影片是HKPF当时执法的重要证据,保存且能公开取得它们(影片)是究责过程的重要一部分。它们也是历史纪录的一部分,能促进独立分析,这对反制不实资讯很重要。”HK Archive表示。
“疯传”内容易遭审查
至于404文库,现于美国加州大学柏克莱分校任职的萧强告诉《田间》,最初CDT团队是追踪中国部落格上的文章,但当中国入口网站公司“新浪”(Sina)2009年推出“微博”(Weibo)后,资讯变得很庞大,而自己和学生主要研究公共舆论,一开始并非关注被审查的内容,只是发现原本关注的内容常被删除,之后就开始保存这些资讯。他表示,CDT借由算法来抓取文章,有些不一定有被删除。
随著社群平台愈来愈多,CDT要存取的档案自然也更多,但有什么标准?萧强回道,CDT做的是监督中国审查者的行动,而大多数被删除的内容都是审查者认为“疯传”(go viral)且引起共鸣的内容,“如果不是迅速传播的话,审查者很可能也没注意到”。
萧强说,尽管中国审查系统能删除文章,但网友会转发到其他社群平台,一定有足迹找到原本被删掉的内容,也有人是透过通讯软体群组投稿遭删除的内容。这么多的资讯要如何筛选?他表示,CDT的编辑会以严格新闻伦理标准把关,“我们选择的标准是为了让它们(资料)比较严谨、有价值,有历史保存价值,也有读者看的价值”。
《中国数字时代》(CDT)的“404文库”项目专门保存被封锁、删除的中国网路文章和资料。(翻摄CDT官网)
萧强指出,每天“翻墙”上网的中国人次是以百万,甚至千万计,而先前在社群平台做的问卷调查发现,不少35岁以下的读者是在中国境内“翻墙”来看CDT网站。不过他提到,现在有些虚拟私人网路(VPN)安全无保障,资料会交给政府,就算能用Google网站,也无法看到所有资讯。
谈到媒体删除报导的标准,萧强直言,威权时代的政府对媒体有一系列做法,不单是标准,还有政策、法规、措施、人员、机构去控制媒体,包括威胁到直接的暴力行为,“中国大陆的情况实际上比台湾当年的国民党威权时代有过之而无不及,今天也这样,它会审查是因实际上是威权、极权政府,特别担心资讯自由和活跃会影响他们的政权,包括执政各方面的政治”。
事实查核、建立信任是存档基础
“在中国极权政府的资讯生态下,真实的声明和真相是对审查的最大伤害”,萧强强调,网路在这方面发挥作用,而CDT保存这些真相。不过他也提到,网路中有大量混淆、故意扭曲真相的资讯,言论自由、媒体自由的环境下更容易放大这些问题,今日的人工智能(AI)技术也增加这方面的可能性,“更加不易知道什么是真实的”。
萧强认为,保存真实的有价值资料本身并不困难,因为“网际网路档案馆”(Internet Archive)网站就提供存档服务,重点在于众人参与传播真相,而新闻记者的工作本身就要求对事实有更严谨的查核。
“愈多的人参与,愈多人有这些良知和意识,并且加以训练,所谓加以训练就是你自己不断地实践,你有这个良知你会知道,谁在那说谎、谁在那欺骗、谁在那说真话,说真话在压力下是有代价的,都是能够看得出来的。”萧强说道。
Sam认为,如何沟通、建立信任,让更多报导出现,是新闻记者要面对的课题,“尤其在香港现在这个状况,就是人与世界的信任越来越低的时候,我们要怎么把这个信任再建立起来,我觉得这个是对记者非常重要的”。