Deepseek(“深度求索”)突破冒起,除了获政府支持,本台再发现,亦靠“三大招数”,包括在香港集资、在芯片禁令“空窗期”囤货、以及利用美国免费开放AI资源等;而且是百度、商汤、华为等中国巨擘在制裁下仍急速发展的关键。另值得留意的是,今次与2023年一样,每当美国发布制裁时,中国便会高调推出“惊世”产品,声称能无惧制裁并超越美国。有台湾国防和美国智库学者向本台分析指,中国这“三招”已发展成熟,能抗衡美国,亦能在宣传战上建立强者形象。
在美国严厉制裁下,中国竟在两年内诞生可媲美ChatGPT的“国产”AI DeepSeek,而且其开发及训练成本仅为其他大模型的不足5%,及仅用2千块英伟达(NVIDIA)芯片就可建成。本台深入发现,总结出“速成”背后三大关键。
DeepSeek成功之道一:在美国AI研发数据上“加工”
第一,在美国AI研发数据上“加工”。本台取得DeepSeek所属公司“北京深度求索人工智能基础技术研究有限公司”的一份专利说明书。当中就“人工智能模型训练资料集的建构方法”指出,具体实施时“需要建构用于大语言模型训练的资料集”,“数据的来源可以使用现有数据集,例如各种开源资料集,也可以是从自行取得的资料”,之后整理一套模型,可“在不增加额外的系统负担的情况下,使得资料管理及资料存取更加便利”。
“北京深度求索”的一份专利说明书,指出数据的来源包括各种开源资料集。(“北京深度求索”专利说明书)
事实上,日前多间美媒已引述知情人士指出,OpenAI及其合作伙伴Microsoft(微软)去年已开始调查DeepSeek盗用其模型进行开发。而OpenAI已掌握一些证据,显示DeepSeek透过“蒸馏”技术(distillation)来建造的,即以AI模型为模仿基础,来训练和改进,从而在低成本下达到同级的效果目标。另美国Meta免费开放的“Llama”亦疑是DeepSeek的“蒸馏”对象。
本台早前已报道,中国近年已成熟地利用美国开源模型进行开发,包括利用“Llama”并结合国产“百度”的“文心一言”、清华大学“智谱”研发的开源AI“ChatGLM”等大模型,提升解放军AI的作战能力。
DeepSeek成功之道二:民企、大学搜购大量美国芯片
第二,以“奇招”囤积美国芯片。即使中国向国内芯片业投资数以千亿元人民币,目前“最先进”的芯片是“中芯国际”7奈米芯片“麒麟9000S”,然而在欠缺技术和零件设备下,亦无法取代ChatGPT主要运用的美国“英伟达”的A100和H100芯片。
那如何达到ChatGPT的级数?本台据中共官方资料发现,在2022年9月至2023年10月美国逐步扩大对华的芯片出口禁令期间,DeepSeek的母企“幻方量化”,与一众与中国政府关系密切的科企,包括百度、商汤、华为、腾讯、阿里以及字节跳动等大力投资AI的公司,分别囤购数以万张英伟达A100和H100芯片,继续其AI开发。尤其是制裁令实施初期,美方容许英伟达数月禁售“缓冲期”,包括推出性能稍低的A800及H800芯片供应中国。
本台亦发现,大学和中介公司亦是中国取得英伟达先进芯片的渠道。过去2年,北京航空航天大学、深圳大学、郑州大学、中国科学院大学和武汉大学和南方科技大学等十多高等科技院校,在美国制裁令下,仍一直招标采购英伟达A100和H100等芯片。
中国科学院大学2023年5月政府采购GPU服务器,注明需搭载英伟达原厂芯片。(中国政府采购网)
而幻方量化亦积极与大陆多所大学合作研发,并在大学招揽年轻科技精英组成研发团队;其模式与中国军民融合的发展模式相似。
DeepSeek成功之道三:利用香港对外集资
第三,“背靠祖国”并利用香港对外集资。虽然DeepSeek宣布成本仅需600万美元,惟遭外界质疑夸大事实,指出AI研发和生产资金成本,一般需至少数亿美元。
据公开资料,早计芯片,英伟达A100和H100等芯片,平均每枚需约2万美元。以DeepSeek宣布收购1万枚来计,已涉及2亿美元。
那DeepSeek的资金从何而来?本台发现,其除了借助中国政府大笔补助外,亦利用幻方量化旗下多个资产管理公司,筹集多达千亿元人民币,造就其成为中国国内量化私募领域的“四大天王”。
其中,资金主力之一是来自幻方量化在2019年成立的“幻方资本管理(香港)有限公司”。该公司取得香港证监会发出的“资产管理牌照”(9号牌),意味着在国际资本市场上获得了“通行证”,不仅可以直接参与境外的投资,还可管理运用海外投资者的资金,包括将外资送往大陆。
美智库:中国利用“三招”逃避美国的制裁
美国詹姆斯敦基金会(Jamestown Foundation)副研究员张崑阳(Sunny Cheung)指出,这“三招”已成为中国成熟模式,逃避美国的制裁。
张崑阳说:“问题是(美国制裁禁令)执行上,往往依赖公司的尽职调查(due-diligence)和上报商务部,导致出现漏洞和灰色地带。另一问题是香港作为国际金融中心,有自己的股票市场和金融体系,而这股票市场是否容易让中国集资?这是必然的。尤其是,Deepseek弹起后,从政府角度,中国望热钱(Hot money)或硅谷(Silicon Valley)资金重新流入中国市场,特别是中国人工智能的建设上。而现在美国仍未有很建全的对外投资规定(Outbound investment regulations),即未有严格限制美国资金流入中国。其实美国芯片禁令在2023年才执行,而2022年首提禁令,当中有1、2年的空窗期,让中国公司有机会大量搜购英伟达(Nvidia)芯片,或以不同名目设立子公司,继而与‘干净’且有能力取得高科技芯片的公司,透过中介人、或第三国的模式取得芯片,这是很常见的做法。”
另值得留意的是,今次Deepseek的震撼推出,正值美国川普政府蕴酿新一轮对华芯片禁令的时机。本台发现,情况与2023年美国最初推出芯片禁令时相似,当时中国相继推出宣称不逊于ChatGPT的百度AI文心一言,以及搭载中芯麒麟9000S芯片的华为Mate60系列5G手机,大肆宣传突破美国的围堵。
侍建宇:Deepseek成绩对“大内宣”有很大帮助
台湾国防安全研究院副研究员侍建宇指出,这都是中国宣传战略,试图营造强者不败的气势。
侍建宇说:“就算不是世界级的东西,也是名列前茅的一个AI技术。所以此情况之下,它对‘大内宣’也是有很大的帮助,尤其在这1、2年中国的经济不景之下。当然‘大外宣’也是有效果的。因为毕竟它还是短期之内,造成了美国股票市场的震荡;从长期的角度而言,它最近几年向‘全球南方’,尤其金砖国家,表现出其实中国是有能力带领她们在科技向前走。”
不过,侍建宇指出,虽然不少人质疑中国的AI和芯片发展“名过其实”,但仍要警惕中国发展的程度,以及训练AI的目的,包括窃取个人资料和监控,“因为这都是不透明的”。他又关注到,愈来愈多事实证明香港是中国规避美国制裁的集资和集资的“中转港”,所以他对香港前景并不乐观。