对话七维科技CEO殷元江:AI加速XR虚拟制作周期

对话七维科技CEO殷元江:AI加速XR虚拟制作周期

 

对话七维科技CEO殷元江:AI加速XR虚拟制作周期

“What’s Next in AI Starts Here”,在硅谷圣何塞会议中心涌动的科技热浪中,英伟达2025GTC大会(当地时间3月17日-3月21日)再次成为全球AI技术演进的“风向标”。

黄仁勋长达两小时的主题演讲里,"具身智能"与"AI Agent"成为贯穿始终的技术注脚,当机器人Blue作为压轴角色精彩亮相时,会场爆发的掌声昭示着AI技术从数字世界向物理世界突破的临界点到来。

作为连续两年入选英伟达初创企业展示的中国XR技术公司,网易科技对七维科技CEO殷元江进行了一次专访。

以下是网易科技和殷元江的对话,在不改变原意的基础上进行编辑整理。

生态共振,中国企业的创新解法

网易科技:作为连续两年参加GTC的企业,今年感受到哪些技术演进的关键信号?

殷元江:2025英伟达 GTC大会以“AI的下一步从这里开始”为主题,彰显了GTC作为AI时代开发者盛会的核心地位。今年的大会尤为显著地体现了AI技术从基础模型层面向各垂直领域的深入渗透。展台上不仅展示了医疗、教育等行业专用的AI Agent,还推出了诸如AI产品经理等创新应用。这一“行业Agent化”的趋势虽在去年已初见端倪,而今年则在功能的完整性和场景覆盖度上实现了质的飞跃。

此外,值得注意的是,具身智能机器人已开始规模化落地,我们在GTC现场目睹了手术机器人、物流机器人等实体化应用的展示,这与软件层面的Agent形成了虚实结合的技术格局。在黄仁勋演讲的最后,还展示了机器人Blue,相较于去年压轴亮相的人形机器人军团,其能力在今年显然有了显著提升。这一切的背后,是CUDA计算架构与Isaac机器人平台技术的强力支撑与共振。

网易科技:在今年的Startup Pitch环节中,七维作为唯一入选的中国XR技术企业,目前与英伟达有哪些具体的合作?

殷元江:英伟达以GPU为核心,构建了一个涵盖API、SDK等在内的全栈式技术生态系统。我们的软件产品在各个功能模块上,广泛运用了英伟达的多种技术能力。具体而言,在Omniverse的合作中,这种双向合作颇具代表性:一方面,通过采用USD标准,我们整合了仿真级的3D资产管理能力;另一方面,我们将XR渲染技术与Omniverse的渲染引擎进行对接,并基于CUDA架构实现了计算力的优化。

此外,我们的数字人技术也融入了Audio2Face等先进技术。英伟达推出的Holoscan for Media实时AI平台,也已被我们整合到产品中,以增强其实时处理能力。在影视媒体领域,特别是在传输环节,我们采用了英伟达Rivermax技术,它提供了超高带宽、低延迟、GPU Direct以及零内存复制的优势。在显卡应用方面,我们大量使用了RTX A5000专业卡,这些显卡不仅能够高效进行三维渲染和视频加速,还在一定程度上实现了AI功能的集成。

总体而言,我们的产品在软件与硬件层面都与英伟达的技术实现了深度结合。每个软件授权都捆绑了一到多张RTX显卡的销售,同时,每个销售方案中也包含了一个Omniverse的授权,这种结合确保了我们的产品在性能上的卓越表现。

AI加持,起底七维科技的技术逻辑

网易科技:您谈到“2.5D环境生成”目前仅需5步,能否展开讲一讲其技术逻辑与应用?

殷元江:实际上,2.5D生成是一种巧妙的做法,为什么这么说呢?在传统虚拟场景构建过程中,效率常常成为瓶颈——手工建模需要数周时间,而3D扫描方案则成本高昂。我们的方法则另辟蹊径:首先生成或拍摄一张2D图片,随后利用AI技术进行图像扩展,提升其画幅和分辨率,并估算深度信息。

尽管这种基于AI算法得出的深度信息无法与扫描或手工建模的精度相媲美,但在XR虚拟制作流程中,由于摄影机多在前方的30至45度之间移动,这种深度已经足以营造出空间感和体积感。通过这种方式,我们能够将原本需要数周的建模时间压缩至几天甚至更短,极大地帮助内容生产者和创作者实现了降本增效。

XR的应用十分广泛,例如,在北京电视台和影视基地等机构中,XR被用于虚拟场景的合成渲染,使得直播和交互成为可能,而无需外景拍摄。在高校如传媒大学,XR则作为一种教学工具,为不同专业的学生提供接触新一代技术和实践操作的机会。

网易科技:此次GTC上七维还展示了AI故事板生成产品ViStoryboard,可否具体结合客户的案例来说明下这个产品的应用情况?

殷元江:AI故事板是我们AI Studio中极具创新性的一个模块。AI Studio作为一个全面且强大的工具集合,以AI为驱动力,为我们带来了前所未有的新功能。通过这一平台,客户能够从最初的文本剧本处理开始,逐步进行分镜故事板的精细制作,再到创意图的生成以及视频的制作。如果涉及虚拟拍摄,AI Studio可以进一步创建虚拟拍摄环境,随后结合时间线编辑器,将所有步骤无缝串联,提供全栈式的便捷服务。

故事板在影视、广告、游戏等内容的创作过程中,起着至关重要的作用,它不仅是前期创意构思的核心工具,也为实际拍摄提供了宝贵的指导。AI故事板的生成工具ViStoryboard,通过用户输入的文字剧本,自动依据预设的风格和模板,生成一系列分镜画面。这些画面清晰地展示了场景布局、角色动作、镜头运动等关键信息,极大地提升了制作效率。目前,这一先进的产品工具已经在光线传媒、十月文化等知名客户中得到了成功验证,并取得了显著成效。

网易科技:目前生成式AI赛道竞争激烈,七维科技的技术护城河是什么?与竞品相比,差异化体现在哪些环节?

殷元江:七维虽非大模型厂商,但我们与众多模型开发商建立了深厚的合作关系。在AI studio的产品阵容中,我们不仅整合了Deepseek、Stable Diffusion、SAM(Segment Anything Model)等多种先进模型,还致力于将其打造为最贴近用户需求的内容创作工具。通过与影视工作室、媒体机构和高等院校的紧密合作,我们能够获取最前沿的市场需求反馈,从而不断优化产品功能。我们的目标是与Adobe等业界领袖看齐,让用户在我们的产品下拉菜单中便能轻松调用任何所需的模型,始终坚持以产品和客户需求为导向。

我每年参加GTC的主要原因有两点。首先是与英伟达的研发负责人沟通,了解他们今年的开发路线图,探讨即将推出的新功能和变化,并确定其中哪些对我们有用。其次,是在英伟达的大会展厅中,与其他创业公司进行交流。

远征计划,XR技术的全球化渗透

网易科技:除影视和广电领域,七维科技的技术未来还在哪些垂直场景中应用?海外拓展有哪些具体的计划?

殷元江:我们在教育行业的各个院系和专业领域已广泛应用,同时在文旅展览陈列,特别是政府和企业展示方面也有众多应用。我们自身的部分工具将全面实现Web化和轻服务化,旨在覆盖更小的内容生产机构和个体创作者。我们的产品内核涵盖广泛,从媒体、娱乐到教育,再到政府企业的泛内容场景,直至面向更小型内容创作者的Indie Studio。

去年是我们的出海元年,目前我们正处于全球市场开拓阶段。美国、加拿大、韩国已有部分客户,日本市场也在初步推进中,接下来我们将进一步扩展渗透欧美,中东,东南亚等市场。我们在海外市场的投入是坚定且持续的。

网易科技:七维科技目前的商业模式是怎么样的?包括软件授权、硬件销售及解决方案服务?未来是否会向内容聚合平台转型?目前的营收情况怎么样?

殷元江:我们拥有核心的软件授权,并提供软硬一体的解决方案,此外还有一些租赁和服务收入。今年,我们的发展重点是拓展线下VR大空间和XR院线的票务收入模式。公司去年已成功参与多个具有标志性的项目,例如北京大学武汉人工智能研究院的“文明一万年”项目。今年,我们将进一步与不同的科技馆、博物馆以及影视IP衍生的场景展开合作。目前,公司正处于盈利状态。

未来三年,公司计划在技术产品上实现轻量化、AI化和全球化,同时在业务方面加强国内垂直行业的布局,拓展海外市场和渠道建设。此外,我们还将探索To B和To C的业务模式,以轻量化产品面向“小B”和专业用户,推动线下大空间和XR院线业务的发展。

网易科技:您认为生成式AI对XR虚拟拍摄和数字内容生产流程有怎样的影响?是否可能取代传统3D建模?版权溯源难的问题如何解决?

殷元江:AI会加持XR虚拟拍摄和制作的进度与周期。XR其实理解是把虚拟场景实时渲染和真人表演实时合成的和实时交互的一个流程,只要是涉及到这块,那它始终会存在。未来会有更多的比例和环节来AI化。AI有望在生成简单模型和道具方面取代传统3D建模,从而加速精细化模型和场景的创建。

AI将在XR虚拟拍摄和制作过程中发挥重要作用,加速项目进度并缩短制作周期。XR技术,即通过实时渲染虚拟场景并与真人表演进行合成及互动,在未来的应用中将有更多环节实现AI化。AI在创建简单模型和道具方面展现出巨大的潜力,有望取代传统的3D建模,从而加速精细化模型和场景的构建。

然而,在处理定制化和复杂内容时,AI目前仍无法实现完全可控的流程,特别是在游戏和影视制作中,制作人和导演对内容的精细度和可控性有极高的要求。尽管如此,AI在2D转3D、点云处理等环节的潜力不容忽视,它能够帮助降低制作成本并提升效率。

面对生成式AI带来的版权溯源挑战,目前行业尚处于初期的混沌阶段。然而,值得关注的是,Getty Images和Shutterstock等国外公司已在积极应对,他们在推出AI生成技术和服务时,强调其生成内容基于自有版权数据。我们不仅与这些公司展开合作,同时也在建设自己的资产库,目前已拥有数千个完整的3D资产和10万G的3D模型。尽管与Getty Images和Shutterstock相比,我们的资产量仍较小,但我们正在不断积累和扩展。