英伟达在人工智能芯片领域或面临亏损风险

在英伟达第二季度263亿美元的数据中心收入中,Inference占了40%。 随着人工智能的成熟,推理计算的需求将会增加。...

  • 在英伟达第二季度263亿美元的数据中心收入中,Inference占了40%。
  • 随着人工智能的成熟,推理计算的需求将会增加。
  • Groq和Cerebras等公司正在推出推理芯片,与英伟达竞争。
感谢您的报名!转到时事通讯偏好

在人工智能硬件圈里,几乎每个人都在谈论推理。

英伟达首席财务官科莱特•克雷斯(Colette Kress)在周三的财报电话会议上说,在英伟达第二季度263亿美元的数据中心营收中,约有40%来自推断业务。AWS首席执行官马特·加曼最近在No prior播客上表示,目前人工智能计算服务器上一半的工作可能是推理。而且这一份额很可能会增长,吸引渴望削弱英伟达王冠的竞争对手。

本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.

因此,许多希望从英伟达那里夺取一些市场份额的公司都是从推理开始的。

由谷歌校友组成的创始团队创立了Groq,专注于推理硬件,并在8月份以28亿美元的估值筹集了6.4亿美元。

2023年12月,Positron AI推出了一款推理芯片,据称可以执行与英伟达H100相同的计算,但价格便宜五倍。亚马逊正在开发训练和推理芯片——分别被恰当地命名为Trainium和Inferentia。

“我认为多样性越多,我们的处境就越好,”加曼在同一个播客上说。

有关的故事

据首席执行官安德鲁·费尔德曼介绍,以超大人工智能训练芯片而闻名的加州公司Cerebras上周宣布,它已经开发出了一款同样大的推理芯片,这是市场上最快的。

并非所有的推理芯片都是一样的

为人工智能工作负载设计的芯片必须针对训练或推理进行优化。

训练是开发人工智能工具的第一阶段——当你将标记和注释的数据输入模型时,它就可以学习产生准确和有用的结果。推理是在模型被训练后产生这些输出的行为。

训练芯片倾向于优化纯粹的计算能力。推理芯片需要较少的计算量,实际上一些推理可以在传统的cpu上完成。这项任务的芯片制造商更关心延迟,因为令人上瘾的人工智能工具和令人讨厌的人工智能工具之间的区别往往归结为速度。这正是大脑公司首席执行官安德鲁·费尔德曼所指望的。

据该公司称,该芯片的内存带宽是英伟达H100的7000倍。这就是费尔德曼所说的“极速”。

该公司已经开始了首次公开募股(IPO)的进程,还推出了包括免费套餐在内的多层服务。

“推理是一个内存带宽问题,”费尔德曼告诉《商业内幕》。

为了赚钱在AI中,扩展推理工作负载

选择优化用于训练或推理的芯片设计不仅仅是一个技术决策,也是一个市场决策。大多数制造人工智能工具的公司在某些时候都需要这两种工具,但他们的大部分需求可能会在一个领域或另一个领域,这取决于公司在其构建周期中的位置。

大量的训练工作量可以被认为是人工智能的研发阶段。当一家公司转向以推理为主时,这意味着它制造的任何产品都是为终端客户服务的——至少在理论上是这样。

随着越来越多的人工智能项目和初创公司的成熟,预计推理将代表绝大多数计算任务。事实上,根据AWS的Garman的说法,这是实现数千亿美元人工智能基础设施投资尚未实现的回报所需要的。

Garman告诉No prior:“推理工作负载必须占据主导地位,否则所有这些对大型模型的投资都不会真正得到回报。”

然而,对于芯片设计师来说,训练和推理的简单二元关系可能不会永远持续下去。

数据中心业主Databank的首席执行官Raul Martynek说:“我们数据中心的一些集群,客户同时使用它们。

英伟达最近收购了Run。ai可能会支持Martynek的预测,即推理和训练之间的墙可能很快就会倒塌。

今年4月,英伟达同意收购以色列公司Run:ai,但据Politico报道,这笔交易尚未完成,目前正在接受美国司法部的审查。Run:ai的技术使gpu的运行效率更高,允许在更少的芯片上完成更多的工作。

“我认为,对大多数企业来说,它们会合并。你将有一个训练和推理的集群,”Martynek说。

英伟达拒绝对这篇报道置评。

本文来自作者[admin]投稿,不代表tzezi号立场,如若转载,请注明出处:https://m.tzezi.cn/life/202507-1676.html

(10)

文章推荐

  • 统计局:马来西亚企业展望2023年第三季度将迎来改善

        吉隆坡,8月29日——马来西亚统计局(DoSM)指出,企业对2023年第三季度(3Q)的

    2025年07月16日
    9
  • 马哈拉施特拉邦政府定于8月17日发布重点计划,聚焦五大关键领域

    在下周的RakshaBandhan之前,马哈拉施特拉邦政府将于8月17日推出其旗舰“MukhyamantriLadkiBahin”计划。马哈拉施特拉邦副首席部长DevendraFadnavis周四宣布,根据这一计划,该邦超过1000万名妇女每月将获得1500卢比的直接财政

    2025年07月18日
    14
  • 用经济实惠的方法在家为稀疏眉毛增添浓密感——眉毛着色技巧大揭秘

      抛开繁琐的化妆步骤吧,例如用眉笔精细描绘眉毛。如今有许多新技术可以提升眉毛的美感,从微刮刀到眉毛贴膜和粉眉,但眉毛着色是最简单且经济的选择,能够有效填补稀疏的眉弓。给眉毛上色不仅能让眉毛看起来更浓密,还能遮盖白发——效果比用铅笔持久得多,且费用远低于昂贵的沙龙护理。在这里,顶

    2025年07月20日
    12
  • 英国会迎来印度式的夏季吗?气象局发布最新天气预报

    随着英国受到暴雨和暴风雨天气的袭击,许多人都在想,随着秋季的到来,我们是否还会迎来一段温暖的天气。在过去的两周里,暴雨席卷了整个国家,英国气象局发布了今天和明天的雷暴黄色天气。天气预报员警告说,今天英国南部将有大雨,可能会造成破坏。

    2025年07月27日
    11
  • 金鲜雅以增重策略赢得众人喜爱

    收视率高达40%的MBC电视剧《我叫金三顺》的男主角金善雅(30岁)在首尔中区清潭洞拍摄最后一集时,差点昏倒。为了配合紧张的拍摄日程,她连续三周每天只睡一个小时,不得不三次被送往医院。她几乎不抬眼皮,告诉《朝鲜日报》:“我一直靠林格溶液生活。但作为角色,她让自己的眼睛

    2025年08月01日
    10
  • 苏丹第二大城市激战升级,准军事部队成功控制该镇

    目击者称,苏丹准军事部队周一深入贾兹拉州(Al-Jazira)首府瓦德马达尼(WadMadani)的前避风港,并占领了鲁法阿镇。一天前,准军事部队快速支援部队在瓦德马达尼建立了一个基地,他们的进攻使数千人逃离苏丹第二大城市和前援助中心,其中许多人已经流离失所

    2025年08月03日
    9
  • 查尔斯国王与女王在皇家周活动前造访爱丁堡

      国王与王后将参与苏格兰的一系列活动,庆祝爱丁堡建城900周年。查尔斯和卡米拉将前往苏格兰首都,参加为期两天的王室活动,包括国王在授职仪式上颁奖,以及女王为书店老板、作家和文学组织举办的招待会。通常情况下,女王每年都会在爱丁堡的荷里路德宫停留

    2025年08月03日
    7
  • 前北约指挥官:麦卡锡辞职标志着普京的胜利时刻

    前北约驻欧洲最高盟军司令、退役海军上将詹姆斯·斯塔夫里迪斯说,前议长凯文·麦卡锡被赶下台对俄罗斯总统弗拉基米尔·普京来说是“伟大的一天”。他补充说,他一生中从未见过华盛顿特区与世界其他地区之间出现如此严重的混乱。“我觉得好像我们在家里……有点脱节。双方都有极端党

    2025年08月03日
    9
  • 终于呈现“微乐麻将有开挂方法”其实确实有挂

    微乐麻将有开挂方法是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开挂功能,一键便可以生成出手

    2025年08月04日
    12
  • 意大利建筑坍塌,兄妹不幸遇难

    意大利南部一座两层楼房倒塌,两名年幼的兄弟姐妹遇难,他们的母亲和一名老妇人被困。消防队员在他们的官方电报频道上说,燃气爆炸可能导致萨维阿诺镇的倒塌。救援人员找到了一名六岁男孩和一名四岁女孩的尸体,称他们的父亲和两岁的弟弟还活着。

    2025年08月05日
    12

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年07月27日

    我是tzezi号的签约作者“admin”!

  • admin
    admin 2025年07月27日

    希望本篇文章《英伟达在人工智能芯片领域或面临亏损风险》能对你有所帮助!

  • admin
    admin 2025年07月27日

    本站[tzezi号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年07月27日

    本文概览:在英伟达第二季度263亿美元的数据中心收入中,Inference占了40%。 随着人工智能的成熟,推理计算的需求将会增加。...

    联系我们

    邮件:tzezi号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们