pg电子 (中国)·官方网站 - 电子科技大亨

欢迎访问pg电子 (中国) 官方网站

AI创投周报|NVIDIA发布最强AI芯片GB300科研平台Lila Sciences获2亿美元种子资金

首页 > 公司资讯 > 行业资讯 > AI创投周报|NVIDIA发布最强AI芯片GB300科研平台Lila Sciences获2亿美元种子资金

AI创投周报|NVIDIA发布最强AI芯片GB300科研平台Lila Sciences获2亿美元种子资金

  AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。

  在NVIDIA GTC大会上,黄仁勋发布旗下最强AI芯片GB300,和去年发布的GB200相比,推理性能是其1.5倍。据悉,GB300将在今年的下半年出货。

  他还预览了2026年下半年发货的下一代AI超级芯片Vera Rubin,其性能将达到GB300的14倍。进一步,他预告了Vera Rubin的下一代产品Feynman。

  此外,NVIDIA推出两款个人AI超级计算机DGX Spark和DGX Station,面向研究人员、数据科学家、AI开发者和学生设计。

  在GTC上NVIDIA还发布了AI云服务,机器人,软件库等一系列新产品和新技术。

  勋GTC演讲中关键技术:PD分离,UCSD华人团队力作,大语言模型吞吐量跃升4倍

  在2025年GTC大会上,NVIDIA创始人黄仁勋展示了PD分离技术,这一技术已成为大模型推理服务优化的关键。PD分离,PG平台 PG电子官网即预填充-解码分离技术,由UCSD华人团队创新提出,能够在严格的延迟约束下,将大语言模型的有效产出率提升至现有系统的4.48倍,或实现10.2倍更严格的服务级目标(SLO)达成率。

  该技术已被多家公司如Mooncake和DeepSeek采用,并成为NVIDIA和PyTorch下一代大模型服务系统的基础。PD分离的核心在于将预填充和解码分配到不同的GPU上,从而避免两者之间的资源竞争和性能干扰,显著提升系统的有效吞吐量,即每秒完成的符合SLO的请求数。

  UCSD华人团队在其博客中详细剖析了PD分离技术的原理和应用场景。他们指出,现有的大模型服务系统虽然通过连续批处理技术提高了吞吐量,但无法有效满足不同应用场景下的延迟需求。例如,聊天机器人需要快速响应,而代码补全则要求实时生成。

  为了解决这一问题,团队提出了有效吞吐量的概念,强调在满足SLO的前提下优化系统性能。通过PD分离,团队开发了系统原型DistServe,成功在保持严格延迟约束的同时,大幅提升了有效吞吐量。这一创新不仅降低了大模型服务成本,还显著改善了用户体验。

  OpenAI发布全新语音智能体API,此次发布的模型在语音识别、语音转文本(ASR)及文本转语音(TTS)方面均达到SOTA水平,能够更精准地处理复杂音频环境,包括口音差异、嘈杂背景和变速语音。

  此外,gpt-4o-mini-tts让开发者可以直接操控 AI 语音的表达方式,使其更具个性化和表现力。gpt-4o-transcribe和gpt-4o-mini-transcribe 模型的语音API,最低每分钟仅0.015 美元,适用于客户服务、会议记录和语音助手等应用场景。

  谷歌Gemini近日推出全新Canvas功能,Canvas允许用户通过语音指令快速生成代码原型,并实时可视化输出结果,极大提升了开发效率。例如,用户在不到60秒的时间内搭建了一个Stripe仪表板,整个流程从录制到编辑仅耗时约10分钟。

  此外,Canvas还支持所见即所得的预览功能,用户可以直接制作简单的小游戏或进行数据可视化分析。同时,Gemini还引入了Audio Overview功能,能够将文档、幻灯片和深度研究转化为播客,进一步扩展了其应用场景。谷歌CEO Sundar Pichai表示,这些新功能标志着人工智能辅助认知从理论走向实践,是“人类思维下一次进化的蓝图”。

  5.百度版深度思考模型免费上线,API定价比DeepSeek R1再砍一半

  百度近日宣布其文心大模型4.5和文心大模型X1正式上线,并免费向用户开放。文心大模型4.5是一款原生多模态基础大模型,具备强大的语言能力和多模态融合能力,已在百度智能云千帆大模型平台上线,企业用户和开发者可立即调用API。

  文心大模型X1则是百度版的深度思考模型,具备更强的理解、规划、反思和进化能力,支持多模态,并能自主运用多种工具,如高级搜索、文档问答、AI绘图等。两款模型的API调用价格极具竞争力,文心大模型4.5的输入价格为0.004元/千tokens,输出价格为0.016元/千tokens;文心大模型X1的输入价格为0.002元/千tokens,输出价格为0.008元/千tokens,相比DeepSeek R1标准时段价格便宜了一半。百度还计划在6月30日正式开源文心大模型,并预计在下半年发布文心大模型5.0,持续推动人工智能技术的发展和应用。

  6.谷歌推出全新Scaling Law,为大语言模型的分布式训练提供更高效、更稳健的解决方案

  谷歌近期发布了一项名为Diloco的全新算法,由谷歌Research、谷歌Search和谷歌DeepMind三大核心团队协作推出,这一突破性技术为大语言模型的分布式训练提供了更高效、更稳健的解决方案。Diloco的核心优势在于其能够在多个数据中心进行模型训练,且随着模型规模的扩大,其性能优势愈发显著,开创了新的Scaling Law。

  与传统的数据并行训练相比,Diloco在超参数稳定性、带宽需求、批大小容忍度等方面表现出色,尤其是在模型规模超过20亿参数时,其优势更为明显。

  这一技术的发布,不仅解决了大规模模型训练中的通信瓶颈问题,还为未来AI模型的扩展提供了全新的可能性。谷歌的研究团队通过大量实验验证了Diloco的Scaling Law,并指出其在合理调优的情况下,甚至在小规模模型上也可能优于传统的数据并行训练。

  清华AIR与字节跳动联合SIA Lab近日发布了其首项研究成果——DAPO,这是一个开源的大规模LLM强化学习系统。DAPO通过解耦剪辑和动态采样策略优化,显著提升了强化学习的效率和稳定性。

  该算法在AIME 2024基准测试中,使用Qwen2.5-32b模型获得了50分的成绩,优于同等规模的DeepSeek-R1-Zero-Qwen-32b,且训练步数减少了50%。相比之下,使用GRPO的Qwen2.5-32b模型仅获得30分。DAPO的成功在于其解决了GRPO面临的熵崩溃、奖励噪音和训练不稳定等关键问题,为工业级大规模强化学习系统的开发提供了新的解决方案。

  CelestialAI由半导体行业资深专家David Lazovsky和Preet Virk联合创立。公司专注于利用光子学技术解决AI计算中的数据传输瓶颈,其核心产品“Photonic Fabric”通过光信号替代传统铜基电信号,实现芯片间超高带宽、超低延迟及高能效的数据传输。

  作为英伟达NVLink技术的主要挑战者,Celestial AI通过开放式的光互联架构为AMD、英特尔等厂商提供替代方案,它的方案可以将算力卡的XPU(算力核心)和内存解耦,将数千个XPU虚拟化为“算力集群”,与“储存集群”快速通信,从而支撑万亿参数大模型的分布式训练和推理。目前其技术已与台积电2.5D封装工艺兼容,并获微软、亚马逊等超大规模企业测试。

  2.AI科研智能平台Lila Sciences完成高达2亿美元的种子轮融资

  本轮资金将用于加速其“科学超级智能平台”的算力升级、自主实验室基础设施建设,目标是通过整合生成式AI、自动化设备和机器人技术,打造“自动驾驶实验室”以规模化执行科学实验。

  Lila Sciences由生物医药领域知名创投机构Flagship Pioneering孵化,公司专注于开发跨学科的“科学超级智能平台”,其核心技术突破传统AI依赖历史数据的限制,通过自主生成假设、设计实验并优化结果,加速生命科学、化学和材料科学领域的创新。

  例如,该平台已成功设计出低成本绿色制氢催化剂,成本仅为商业铂基催化剂的零头,并开发出工业级碳捕获新材料,其性能在热稳定性和吸附效率上显著超越现有产品。此外,其大语言模型具备科学推理能力,可协助研究人员快速筛选治疗靶点并生成基因疗法结构,已成功验证数百种新型抗体和肽类分子。

  Pete Florence此前是DeepMind的机器人与人工智能高级研究科学家,他的新身份在本周的NVIDIA GTC大会曝光——Generalist AI 的联合创始人兼 CEO。这家创业公司已经获得NVIDIA的投资,虽然还没有披露具体的业务,但显然与机器人技术有关。

  Florence在GTC表示,“我们坚定不移地致力于制造能够完成任何任务的机器人,我们希望在机器人的赋能下,体力劳动的边际成本被降至零。”

  曾师从Bengio,o1/o3后训练掌门人出走创业,瞄准AI材料,获OpenAI投资

  OpenAI后训练团队负责人William Fedus近日宣布离职,将创办一家专注于AI材料发现的创业公司。OpenAI对其新公司进行投资并建立战略合作伙伴关系。

  William Fedus拥有深厚的学术背景和丰富的行业经验。他毕业于MIT和剑桥大学,获得物理学学士学位,并在加州大学圣迭戈分校获得基本粒子物理学硕士学位,随后,他又在蒙特利尔大学获得了计算机科学博士学位,师从Yoshua Bengio。2022年加入OpenAI后,他作为核心开发人员参与了ChatGPT的创建,并主导了多个重要模型的后训练研发工作。2024年10月,他接替Barret Zoph成为后训练团队负责人。

  Cartesia脱胎于斯坦福大学AI实验室,由机器学习专家Karan Goel博士联合斯坦福教授Chris Ré(麦克阿瑟“天才奖”获得者)等人共同创立。其核心产品Sonic 2.0语音模型通过状态空间模型(SSM)架构,实现仅需3秒音频即可精准克隆语音,捕捉口音、情感甚至背景音效,支持15种语言及长文本处理,已在客服、医疗、游戏等领域落地。例如,Adobe利用其低延迟特性优化产品语音交互,Spotify则用于生成自然播客旁白。技术突破还体现在将语音转语音(Speech-to-Speech)全双工系统的延迟从90毫秒压缩至45毫秒,显著提升实时对话流畅度。

  目前,Cartesia已服务超10万家客户,包括Quora、Cresta和Rasa等企业。其最新发布的Sonic Turbo模型进一步将延迟降至40毫秒,结合“语音本地化到任意语言”功能,正推动数字分身、元宇宙社交等新兴场景的应用。公司通过开源组件LiveKit和WebRTC技术构建语音编排平台,使开发者能快速部署定制化Voice Agent,将传统需6-12个月的开发周期缩短至数周。

  5.AI网络安全公司Cybereason完成软银领投的1.2亿美元战略融资

  Cybereason专注于提供基于人工智能的端点检测与响应(EDR)解决方案。其核心技术通过实时监控网络活动(如运行程序、文件访问、用户输入行为等),结合AI算法帮助企业预防、检测和应对高级网络威胁。其产品覆盖端点安全、威胁狩猎及托管检测与响应(MDR)服务,能够贯穿网络攻击的全生命周期防护,目前已在全球40多个国家落地应用。

  在技术层面,Cybereason的软件以全面数据采集和实时分析为核心优势,不仅追踪传统网络行为,还能捕捉键盘输入、鼠标移动等细粒度用户操作,从而精准识别异常模式。这种能力使其在应对勒索软件、供应链攻击等复杂威胁时具备显著优势。此外,公司通过AI驱动的自动化响应机制,大幅缩短了威胁处置时间,助力企业构建动态防御体系。

  在美国市场,通常情况下,每辆卡车每年的保费高达15000至20000美元,而且整理报价和保单通常需要数周时间,提交索赔和获得赔付又要让司机数周无法上路,这些都对利润微博的中小车队企业带来直接的生存威胁。

  Nirvana通过整合嵌入式物联网设备(如车队远程信息处理系统)实时采集驾驶数据,结合超过200亿英里的真实驾驶记录,构建了专有的风险评估和定价模型,帮助保险公司优化承保策略并降低赔付成本。

  Nirvana的创始团队经验丰富,Rushil Goel(CEO)曾在MIT做过研究助理,做过BCG的咨询官,Abhay Mitra拥有多年的软件工程师经历,Alex Carges则有丰富的精算从业经历。

  Norm AI是法律与合规自动化平台,旨在改变企业处理法律、法规和行业要求的方式。该平台采用“设计即合规”的方法,将合规检查融入商业活动中,包括AI生成内容、内部沟通、协议以及外部企业沟通(如营销内容和销售材料)。Norm AI并非将合规与业务割裂开来,而是主动实施合规检查,并提供端到端的企业级解决方案。

  Norm AI的解决方案基于其法律工程自动化平台(Leap)构建,这是一个专有系统,用于创建具备法律和监管领域专业知识的 AI 代理。Leap使 Norm AI的律师和前监管人员能够将复杂的政策转化为由大型语言模型驱动的可操作AI系统。

  Norm AI由斯坦福大学AI与法律交叉领域专家John Nay博士创立,核心团队汇聚了前美国证券交易委员会委员Troy Paredes、法律工程师及合规领域资深从业者。

  8.AI视频工具Opus Clip完成2000万美元B轮融资,软银愿景领投

  Opus Clip专注于AI驱动的视频编辑技术,其核心平台可将长视频自动切割、重组为适配TikTok、YouTube Shorts等平台的短视频,并通过“爆款基因算法”分析镜头切换频率、背景音乐节奏等数据,优化内容的传播效果。例如,平台能实时生成20个剪辑版本,使完播率提升最高达600%,已服务超1000万创作者及Univision、Visa、LinkedIn等企业客户。

  Opus Clip总部位于美国,由清华校友赵洋(Young Zhao)担任CEO,联合创始人包括林娜(CTO)和Mike Chen(CMO)。赵洋表示,Opus Clip的目标是构建“视频创作超立方体”,通过数据飞轮持续优化AI的“社交直觉”,让非专业用户也能产出爆款内容。随着短视频算法转向“主题优先”逻辑,其技术正成为企业内容战略的核心基础设施。

  Bria专注于开发完全基于授权数据训练的生成式AI模型。其核心技术通过整合Getty Images、Envato、Alamy等30余家数据合作伙伴的授权内容,构建了覆盖图像、视频的多模态训练体系。专利归因技术能够将AI生成内容追溯到具体训练数据来源,并根据数据贡献度对版权方进行程序化补偿,例如某张合成图片中若包含Getty Images的10%数据权重,后者将自动获得相应比例收益。该模式不仅解决版权合规问题,还开创了数据供应方、开发者和用户的三方共赢生态。

  创始人兼CEO Yair Adato透露,公司2024年实现超400%的年度经常性收入增长,计划年内将团队规模翻倍,重点招募生成式AI研究员、版权专家及全球市场团队。目前,Bria的平台已支持通过AWS SageMaker、Azure AI Foundry等集成使用其模型,并提供Adobe Photoshop和Figma插件。

  本文由阿尔法公社综合自多个信息源,并在AI大模型的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。