评论》苹果救不了台积电,但Nvida可以

台积电的 7nm 制程曾一度陷入尴尬的处境,不过今年的 AI 热潮解决了这一问题。本文源自远川科技评论研究员叶子凌,由 元宇宙日爆 整理、重新撰稿。
(前情提要:摩尔定律掰!Nvidia宣告「黄氏定律」:AI晶片性能十年成长1000倍 )
(背景补充:解决AI晶片危机!OpenAI有意自研晶片,正评估潜在收购公司 )

本文目录

今年 8 月,The Information 爆料了苹果和台积电之间的 「甜心交易」(sweetheart deal): 苹果下单了台积电 3nm 工艺,但台积电必须独自承受报废晶片的良率损失,这一举措能为苹果省下几十亿美元的成本 。

曾经苹果和台积电被称为 「最完美的合作关系」:藉由规模庞大的研发投入和资本开支,台积电在晶片制造上始终保持领先,苹果则用大规模的订单给台积电报销开发成本,帮助其进一步扩大领先优势。

然而,这个双赢合作却在这两年出了些问题。

一方面,先进制程的开发成本越来越高,台积电也有点扛不住。另一方面,由於手机市场的萎靡,最爽快的两大客户苹果和高通也难免囊中羞涩。

面对巨大的利润压力,台积电选择先涨为敬。根据媒体报导进行估算,2023 年台积电的晶圆代工价格与两年前相比大约上涨了 16%(先进制程)到 34%(成熟制程)。在过去十多年里,台积电都从未大幅提价。

在台积电宣布涨价後,苹果曾以一贯的强势态度表示坚定拒绝,几经博弈之下,才有了那份 「按良率付费」 的协议。

去年 10 月,台积电还颇有先见之明的表示,预计 2023 年整个半导体行业可能会下滑,於是下调资本开支至 360 亿美元。

结果两个月後 ChatGPT 横空出世,全世界的 AI 晶片公司又把台积电送上了神坛。

昂贵的进步

今年 9 月苹果释出会结束,顶着 「首个 3nm 制程晶片」 的 A17 pro 问世,10% 的 CPU 效能提升让人忍不住感叹牙膏还能这麽挤。台湾媒体第一时间出来为台积电甩锅,表示主因在於苹果的设计过於保守,加上 iPhone 散热效率太差,影响了 3nm 制程的发挥。

为了 3nm 工艺节点,台积电不可为不尽力,创下历史新高的资本开支就是最好的证明。

一般来说,晶片制程越先进,需要的生产环节也就越多,成本自然水涨船高。在一些特殊节点,由於生产工艺的彻底改变,原本的装置和产线会被彻底淘汰,成本瞬间被拉高。

前者的代表就是刻蚀环节的增加:

所谓刻蚀,就是将光刻标记出来的区域,通过物理或化学方法去除,精准雕刻出设计好的功能外形。由於光刻技术受波长限制,单凭光刻机很难满足 5nm、3nm 及更先进的工艺,只能通过反覆的刻蚀来实现更小的尺寸。

现阶段先进制程工艺的提升,相当程度上源於刻蚀步骤的叠加。因此近两年刻蚀和薄膜沉积(刻蚀的逆过程)在装置行业的市场份额极速上升,甚至超越了光刻机。

後者则创造了 14/16nm 这个经典制程: 在 14/16nm 之前,晶片制造的主流工艺是 HKMG(High-k Metal Gate),2014 年,三星依靠梁孟松团队抢先台积电攻克 14nm。当时,梁孟松用了 FinFET 工艺解决了生产问题,但工艺变化也意味着装置、产线的大手术。

一些晶圆厂在 14nm 的生产良率反而超过 28nm,也是工艺变化的原因。

而由於 DUV 光刻机的精度限制,晶片制造深入到 7nm 制程後,就需要用 EUV 光刻机,价格是 DUV 光刻机的至少 3 倍。台积电曾尝试利用 DUV 光刻机 + 多重曝光的方式生产 7nm 晶片,但扛不住低良率的钜额成本,最後还是老老实实买 EUV 光刻机。

这个昂贵的技术爬坡之所以多年来行之有效,是因为以苹果为首的一大批晶片设计公司,每年会排着队给台积电下订单。但当财大气粗的苹果都嫌贵的时候,这个回圈就会出现问题。

根据 IBS 的测算,10nm,7nm 和 5nm 晶片的 IC 设计成本分别 1.7 亿、3.0 亿和 5.4 亿美元,而 3nm 晶片的设计成本则达到惊人的 5 亿至 15 亿美元。

由於晶片架构和 IP 复用等因素影响,业界对晶片设计成本的测算常常被高估。但即便排除这些影响,这也是个天文数位。任何晶片设计公司下单之前都得掂量掂量,自己有没有那麽大的出货量。

越来越贵的成本只是台积电的焦虑之一。过去几年,台积电面临的问题有两个:

前者在业内被反覆提及,後者则常常被忽略。

延伸阅读:Nvidia向台积电放「晶片业核弹」!AI加速晶圆制程、台积电6月导入

7nm:既不先进,也不落後

2019 年,台积电痛失大客户华为,结果苹果、AMD 这些大客户立马承包了闲置的产能,所以台积电一边说 「影响不大」,一边宣布 2021 年起,台湾地区工作的 5 万名员工的通通涨薪 20%。

由於众所周知的原因,7nm 的热度在今年又被炒了起来。不过在台积电,7nm 制程的处境一度尴尬。

台积电的 7nm 工艺创造了很多经典产品,比如苹果的 A12 晶片,AMD 的 Zen 2/3 架构处理器,以及海思的麒麟 985 晶片。

一般来说,当一个新制程量产後,苹果和高通是第一个吃螃蟹的。而随着工艺升级,苹果和高通、AMD 会更新到下一代制程,上一代制程的产能会降价,留给 AMD 等晶片公司。随着制程继续升级,成熟制程就会慢慢留给伺服器晶片、汽车晶片等等产品代工。

对台积电来说,老制程虽然已经落後了,但产能不会被浪费。随着产线的成本慢慢折旧完,持续开动的产线反而能贡献可观的利润。 在台积电的营收里,将近 1/3 都是 40/45nm 以上的成熟制程贡献的。

了解了这个背景,就能看出 7nm 的尴尬之处: 说它是先进制程,也没有那麽先进;说它是成熟制程,也没有那麽成熟。

随着苹果和高通已经用上了更先进的 5nm 甚至 3nm,作为关键替补队员的汽车晶片,却仍在使用成熟制程。截至 2021 年,14nm 以下的车用晶片比例仅为 6%。

从台积电的年报中也可以发现,从 2020-2022 年,5nm 份额逐年增加,但 16nm 以上的产品占比却变化不大。 理论上的 「末位淘汰」 逻辑并未发生,真正遭到挤兑的是上一代冠军:7nm。

2020-2022 年,台积电 7nm 的收入占比从 33% 下降至 27%。根据台湾媒体爆料,台积电 7nm 的产能利用率在 2021 年一度超过 100%,到 2022 年底跌到了不足 50%,今年年初更是一度跌至 30%。

原因也很简单,对於替补队员们来说,7nm 还是太贵了。

正如前文所述,7nm 是由 DUV 光刻机换为 EUV 光刻机的重要节点,也成了成本激增的起点。另外,7nm 流片时,用於对向矽片上投影晶片影象的耗材掩膜版急剧增加,这一项就能花掉一千多万美元。

和前两代的 16nm 相比,7nm 的设计成本增至将近 3 倍。这些成本最终传导到下游客户的报价上,物联网、汽车等装置等晶片出货量远低於动辄年产十几亿的智慧手机,面对高昂的价格自然望而却步。

所以苹果、高通、AMD 陆续在 7nm 节点短暂停留後,长期为台积电 7nm 贡献收入的产品只有辉达的车载晶片 Orin X 和 A100 GPU。

如果没有新的增量市场,7nm 大概率不会是唯一尴尬的一代,5nm,4nm 甚至 3nm 都很快就会步其後尘。

但 ChatGPT 的横空出世改变了这一点。

躲得过辉达,躲不过台积电

今年 9 月,台湾媒体 DigiTimes 传来捷报,台积电各制程产能集体回升:6/7nm 制程的产能利用率自 10 月起,有望逐步回到 60% 以上,4/5nm 制程的产能则将回升至 80% 左右。

疯狂下单的除了老客户苹果和高通,还有两个关键角色:辉达和辉达的客户。

辉达的热情不难理解,目前追梦大模型的硬通货 H100 就采用了台积电 N4(5nm)工艺,顺便带火了台积电的 CoWoS 先进封装产能。

按照分析师 Robert Castellano 的测算,一片 N4 工艺的 12 寸晶圆价格为 13400 美元,理论上可以切割 86 颗 H100 晶片。如果不考虑生产良率,那麽每生产一颗 H100,台积电就能获得 155 美元的收入。但封装一块 H100,台积电可以入帐 723 美元。

也就是说,每颗 H100 给台积电带来的收入很可能超过 1000 美元。

延伸阅读:Nvidia的AI晶片H100有多神?为何一片难求?

同时,AMD 的 MI300、英特尔的 Gaudi 3 也都采用了台积电 5nm 工艺。

一直以来,面向 AI 训练和推理的高效能 GPU 市场并不算大,但 ChatGPT 引发了科技公司和云服务商的恐慌性抢购,导致产能不足反而成了限制辉达的问题。考虑到辉达敢於把 H100 按照物料成本直接加个零卖,就算台积电漫天要价,辉达也有能力照单全收。

处境尴尬的 7nm 则在同一时期等来了关键的替补队员:辉达的客户。

Google从 2016 年开始投入使用的自研 AI 晶片 TPU,就一直交由台积电代工。2015 年 「内测」 阶段的 AlphaGo 还需要辉达的显示卡训练,到了 2016 年酣战李世石,就已经换上了自家的 TPU。

目前,最新的第四代 TPUv4 就采用了 7nm 工艺。英国明星初创公司 Graphcore 的 IPU 晶片,同样采用了 7nm 制程,还用上了台积电的 WoW 矽晶圆堆叠技术。

7nm 的另一个大客户是特斯拉:2021 年 8 月,马斯克在特斯拉 AI Day 活动上公布了 Dojo ExaPOD 超级电脑,内建自研 7nm 工艺的 D1 晶片,由台积电代工。

Dojo ExaPOD 由 120 个训练模组组成,每一个训练模组包含 25 块特斯拉自研的 D1 晶片,总晶片数量达到了 3000 块,直接让 Dojo 以 1.1 EFLOP 的算力,成为全球第五大算力规模的电脑。

Dojo 负责人 Ganesh 展示 D1 晶片,2021 AI Day

早在几年前,特斯拉还曾被黄仁勳视为标杆客户。但随着 Dojo 的问世,两家公司的塑料友谊暴露无遗。

一方面,D1 晶片是特斯拉为了适配自家产品,专门针对汽车、机器人等应用场景的研发,强调视觉处理等功能。和辉达的通用 GPU 相比,制程要求略低,同时不会造成算力的浪费。另一个目的就是省钱,根据摩根士丹利的测算,晶片自研让特斯拉足足省下了 65 亿美元。

时至今日,全球主要的 AI 晶片中,超过 80% 都由台积电生产,既有Google和辉达这类老牌列强,也有 Graphcore 这类初创公司,中国大陆的 GPU 设计公司,目前也依赖台积电的产能。

台积电能照单全收的另一个原因,恐怕也是老对手三星的掉队。虽然三星在每个节点都没落後太多,甚至率先宣布量产了 3nm 工艺。但由於良率和功耗控制等原因,不仅没等来大客户,反而接连坑哭了高通和辉达。这也难怪 SemiAnalysis 在报告里阴阳怪气的说:就连英特尔也能抢走三星的客户了。

要知道去年 10 月,台积电总裁魏哲家在内部沟通时,还罕见地鼓励员工休假。没想到一年过去,订单就挤满了台积电十八厂的 N4/N5 产线。

躲过了辉达的算力税,终究没躲过台积电的宝刀。

📍相关报导📍

Nvidia力挺,四年估值80亿美元!Coreweave到底是何方神圣?

美中晶片禁令扩大!游戏显卡RTX 4090中国全网断货、二手暴涨

中国晶片黑市火爆!网传「背包走私客」招聘:一趟拿66万、为祖国作贡献

Leave a Reply

Your email address will not be published. Required fields are marked *