首页

Deepseek（“深度求索”）突破冒起，除了获政府支持，本台再发现，亦靠“三大招数”，包括在香港集资、在芯片禁令“空窗期”囤货、以及利用美国免费开放AI资源等；而且是百度、商汤、华为等中国巨擘在制裁下仍急速发展的关键。另值得留意的是，今次与2023年一样，每当美国发布制裁时，中国便会高调推出“惊世”产品，声称能无惧制裁并超越美国。有台湾国防和美国智库学者向本台分析指，中国这“三招”已发展成熟，能抗衡美国，亦能在宣传战上建立强者形象。

在美国严厉制裁下，中国竟在两年内诞生可媲美ChatGPT的“国产”AI DeepSeek，而且其开发及训练成本仅为其他大模型的不足5%，及仅用2千块英伟达（NVIDIA）芯片就可建成。本台深入发现，总结出“速成”背后三大关键。

DeepSeek成功之道一：在美国AI研发数据上“加工”

第一，在美国AI研发数据上“加工”。本台取得DeepSeek所属公司“北京深度求索人工智能基础技术研究有限公司”的一份专利说明书。当中就“人工智能模型训练资料集的建构方法”指出，具体实施时“需要建构用于大语言模型训练的资料集”，“数据的来源可以使用现有数据集，例如各种开源资料集，也可以是从自行取得的资料”，之后整理一套模型，可“在不增加额外的系统负担的情况下，使得资料管理及资料存取更加便利”。

“北京深度求索”的一份专利说明书，指出数据的来源包括各种开源资料集。（“北京深度求索”专利说明书）

事实上，日前多间美媒已引述知情人士指出，OpenAI及其合作伙伴Microsoft（微软）去年已开始调查DeepSeek盗用其模型进行开发。而OpenAI已掌握一些证据，显示DeepSeek透过“蒸馏”技术（distillation）来建造的，即以AI模型为模仿基础，来训练和改进，从而在低成本下达到同级的效果目标。另美国Meta免费开放的“Llama”亦疑是DeepSeek的“蒸馏”对象。

本台早前已报道，中国近年已成熟地利用美国开源模型进行开发，包括利用“Llama”并结合国产“百度”的“文心一言”、清华大学“智谱”研发的开源AI“ChatGLM”等大模型，提升解放军AI的作战能力。

DeepSeek成功之道二：民企、大学搜购大量美国芯片

第二，以“奇招”囤积美国芯片。即使中国向国内芯片业投资数以千亿元人民币，目前“最先进”的芯片是“中芯国际”7奈米芯片“麒麟9000S”，然而在欠缺技术和零件设备下，亦无法取代ChatGPT主要运用的美国“英伟达”的A100和H100芯片。

那如何达到ChatGPT的级数？本台据中共官方资料发现，在2022年9月至2023年10月美国逐步扩大对华的芯片出口禁令期间，DeepSeek的母企“幻方量化”，与一众与中国政府关系密切的科企，包括百度、商汤、华为、腾讯、阿里以及字节跳动等大力投资AI的公司，分别囤购数以万张英伟达A100和H100芯片，继续其AI开发。尤其是制裁令实施初期，美方容许英伟达数月禁售“缓冲期”，包括推出性能稍低的A800及H800芯片供应中国。

本台亦发现，大学和中介公司亦是中国取得英伟达先进芯片的渠道。过去2年，北京航空航天大学、深圳大学、郑州大学、中国科学院大学和武汉大学和南方科技大学等十多高等科技院校，在美国制裁令下，仍一直招标采购英伟达A100和H100等芯片。

中国科学院大学2023年5月政府采购GPU服务器，注明需搭载英伟达原厂芯片。（中国政府采购网）

而幻方量化亦积极与大陆多所大学合作研发，并在大学招揽年轻科技精英组成研发团队；其模式与中国军民融合的发展模式相似。

DeepSeek成功之道三：利用香港对外集资

第三，“背靠祖国”并利用香港对外集资。虽然DeepSeek宣布成本仅需600万美元，惟遭外界质疑夸大事实，指出AI研发和生产资金成本，一般需至少数亿美元。

据公开资料，早计芯片，英伟达A100和H100等芯片，平均每枚需约2万美元。以DeepSeek宣布收购1万枚来计，已涉及2亿美元。

那DeepSeek的资金从何而来？本台发现，其除了借助中国政府大笔补助外，亦利用幻方量化旗下多个资产管理公司，筹集多达千亿元人民币，造就其成为中国国内量化私募领域的“四大天王”。

其中，资金主力之一是来自幻方量化在2019年成立的“幻方资本管理（香港）有限公司”。该公司取得香港证监会发出的“资产管理牌照”（9号牌），意味着在国际资本市场上获得了“通行证”，不仅可以直接参与境外的投资，还可管理运用海外投资者的资金，包括将外资送往大陆。

美智库：中国利用“三招”逃避美国的制裁

美国詹姆斯敦基金会（Jamestown Foundation）副研究员张崑阳（Sunny Cheung）指出，这“三招”已成为中国成熟模式，逃避美国的制裁。

张崑阳说：“问题是（美国制裁禁令）执行上，往往依赖公司的尽职调查（due-diligence)和上报商务部，导致出现漏洞和灰色地带。另一问题是香港作为国际金融中心，有自己的股票市场和金融体系，而这股票市场是否容易让中国集资？这是必然的。尤其是，Deepseek弹起后，从政府角度，中国望热钱（Hot money）或硅谷（Silicon Valley）资金重新流入中国市场，特别是中国人工智能的建设上。而现在美国仍未有很建全的对外投资规定（Outbound investment regulations），即未有严格限制美国资金流入中国。其实美国芯片禁令在2023年才执行，而2022年首提禁令，当中有1、2年的空窗期，让中国公司有机会大量搜购英伟达（Nvidia）芯片，或以不同名目设立子公司，继而与‘干净’且有能力取得高科技芯片的公司，透过中介人、或第三国的模式取得芯片，这是很常见的做法。”

另值得留意的是，今次Deepseek的震撼推出，正值美国川普政府蕴酿新一轮对华芯片禁令的时机。本台发现，情况与2023年美国最初推出芯片禁令时相似，当时中国相继推出宣称不逊于ChatGPT的百度AI文心一言，以及搭载中芯麒麟9000S芯片的华为Mate60系列5G手机，大肆宣传突破美国的围堵。

侍建宇：Deepseek成绩对“大内宣”有很大帮助

台湾国防安全研究院副研究员侍建宇指出，这都是中国宣传战略，试图营造强者不败的气势。

侍建宇说：“就算不是世界级的东西，也是名列前茅的一个AI技术。所以此情况之下，它对‘大内宣’也是有很大的帮助，尤其在这1、2年中国的经济不景之下。当然‘大外宣’也是有效果的。因为毕竟它还是短期之内，造成了美国股票市场的震荡；从长期的角度而言，它最近几年向‘全球南方’，尤其金砖国家，表现出其实中国是有能力带领她们在科技向前走。”

不过，侍建宇指出，虽然不少人质疑中国的AI和芯片发展“名过其实”，但仍要警惕中国发展的程度，以及训练AI的目的，包括窃取个人资料和监控，“因为这都是不透明的”。他又关注到，愈来愈多事实证明香港是中国规避美国制裁的集资和集资的“中转港”，所以他对香港前景并不乐观。

责任编辑：方寻　来源：RFA 转载请注明作者、出处並保持完整。

相关新闻