Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Spark 2.0 重磅开源!李飞飞团队 Web 端 3D 高斯溅射引擎,突破亿级 splats 实时渲染瓶颈
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AI 工具 > Spark 2.0 重磅开源!李飞飞团队 Web 端 3D 高斯溅射引擎,突破亿级 splats 实时渲染瓶颈
AI 工具AIGC 资讯

Spark 2.0 重磅开源!李飞飞团队 Web 端 3D 高斯溅射引擎,突破亿级 splats 实时渲染瓶颈

站外新闻
最近更新: 2026年5月25日 下午10:29
3D 高斯溅射 Spark 2.0 WebGL2 World Labs 实时渲染
SHARE

💡 站外导读:在元宇宙、数字孪生和沉浸式 Web 应用浪潮下,Web 端大规模 3D 场景的实时渲染一直面临严峻挑战:传统基于网格的渲染在亿级复杂场景下性能捉襟见肘,加载缓慢、设备兼容性差成为行业痛点。由李飞飞创立的 World Labs 推出的开源引擎 Spark 2.0,正直击这些核心瓶颈,为下一代 Web 3D 体验铺平道路。

Spark 2.0是什么

Spark 2.0是World Labs(李飞飞创立)开源的Web端3D高斯溅射渲染引擎,基于Three.js和WebGL2构建。Spark 2.0首创LoD细节层次系统、渐进式流式传输与虚拟内存技术,可在桌面、手机、VR等任意设备浏览器中实时渲染超1亿个splats的大规模3D世界,实现场景从粗糙到精细的平滑渐进式加载,突破传统Web 3D渲染的规模与性能瓶颈,让海量超大场景即时交互、沉浸式流畅浏览成为可能。

阅读目录
  • Spark 2.0是什么
  • Spark 2.0的主要功能
  • Spark 2.0的技术原理
  • 如何使用Spark 2.0
  • Spark 2.0的关键信息和使用要求
  • Spark 2.0的核心优势
  • Spark 2.0的项目地址
  • Spark 2.0的同类竞品对比
  • Spark 2.0的应用场景
      • 📝 站长洞察 (Editor’s Insight)

Spark 2.0

Spark 2.0的主要功能

  • 超大规模场景渲染:支持在桌面、手机、VR 等任意设备的浏览器中流式传输并实时渲染包含超过 1 亿个 splats 的超大 3D 世界。
  • 多对象全局合成:同时渲染多个独立的 3DGS 对象,自动对所有 splats 进行统一的全局深度排序,确保不同对象在空间中正确融合而非简单叠加。
  • 连续 LoD 细节层次:通过构建 LoD Splat Tree 层级结构,根据相机距离和视角动态计算最优的树切割线,自动在近处显示高精度、远处显示低精度,实现平滑无跳变的细节过渡。
  • 渐进式流式传输:采用自研的 .RAD 文件格式,使场景首次加载时立即呈现 64K splats 的粗糙版本,根据视角优先下载并细化可见区域的数据,实现边传输边精细化的流畅体验。
  • 虚拟内存管理:为 splats 分配固定的 GPU 内存池作为页表,根据用户在场景中的实时位置自动从网络获取和置换数据块,突破移动设备内存限制访问海量数据。
  • 注视点渲染优化:通过 Foveated Rendering 技术自动将渲染预算向视野中心倾斜,降低屏幕边缘和相机后方区域的细节级别,在不影响主观画质的前提下显著提升帧率。
  • 实时编辑与重光照:支持在浏览器中直接对 3D 高斯溅射场景进行实时编辑、颜色调整和动态重光照操作,无需离线预处理可看到修改效果。
  • 可编程特效系统:提供基于 GLSL 的代码接口和可视化着色器图节点系统,支持开发者创建动态动画、SDF 几何裁剪、透明度调整等丰富的自定义视觉效果。

Spark 2.0的技术原理

  • 3D 高斯溅射基础:Spark 2.0 采用 3D Gaussian Splatting 技术,用数百万个半透明 3D 椭球体(splats)替代传统三角网格表示场景,每个 splat 由位置、缩放、旋转、颜色和不透明度定义,通过 GPU 按深度顺序混合渲染形成最终图像。
  • 三步渲染管线:系统采用“生成全局列表→全局深度排序→实例化绘制”的架构,将多对象 splats 转换到统一坐标系并应用动态效果(动画、裁剪等),通过 GPU 计算距离后由 CPU 基数排序确定渲染顺序,最后单次绘制调用完成所有 splats 的光栅化。
  • 连续 LoD Splat Tree:为解决亿级 splats 的渲染压力,Spark 自底向上构建层级树结构,将子节点合并为父节点形成多分辨率表示,运行时通过优先级队列在固定预算(50-250 万 splats)内动态计算最优“树切割线”,实现近精细远粗糙的平滑过渡。
  • 渐进式流式传输:采用自研 .RAD 格式将数据分块(每块 64K splats)列式压缩存储,文件头记录随机访问索引,使场景可先以 64K 粗糙版本即时呈现,根据视角通过 HTTP 范围请求动态下载细化数据块,实现边下边看的渐进加载。
  • 虚拟内存管理:分配固定 GPU 内存池作为 splat 页表,结合 LoD 树遍历结果动态判断当前视口所需数据块,当用户移动时自动从网络拉取新数据并置换旧数据,使浏览器能访问远超本地内存限制的海量 splats。
  • LoD 树生成算法:提供 Tiny-LoD(基于空间网格快速合并,采用排序代替哈希优化缓存,适合网页实时生成)和 Bhatt-LoD(基于 Bhattacharyya 距离度量高斯相似度进行高质量合并,适合离线处理)两种无训练依赖的算法构建层级结构。

如何使用Spark 2.0

  • 环境引入:在项目中通过 CDN 或 npm 安装 Spark 2.0 和 Three.js,确保目标浏览器支持 WebGL2 标准。
  • 基础加载:对于小规模场景,直接调用 loadSplat 方法加载 PLY、SPZ 或 Splat 格式的原始 3DGS 文件并添加到 Three.js 场景中。
  • 大场景预处理:针对超亿级 splats 的大规模场景,用命令行工具 spark build-lod 将原始文件离线转换为支持渐进式流式传输的 .RAD 格式。
  • 流式加载:在代码中调用 loadRad 方法加载转换后的文件,配置 splat 渲染预算和注视点渲染参数控制细节层次和性能表现。
  • 渲染更新:在动画循环中持续调用 splat 对象的 update 方法并传入当前相机参数,自动完成深度排序和 LoD 细节切换。
  • 多对象合成:同时加载多个 LoD 对象时,Spark 会自动遍历所有对象的 splat 树并统一分配全局渲染预算,实现无缝融合。

Spark 2.0的关键信息和使用要求

  • 产品定位:World Labs(李飞飞创立)开源的 Web 端 3D 高斯溅射(3DGS)渲染引擎,基于 Three.js 和 WebGL2 构建,可在任意设备浏览器中实时渲染超 1 亿 splats 的大规模 3D 场景。
  • 核心技术:① LoD Splat Tree(连续细节层次,动态选择渲染精度);② 渐进式流式传输(.RAD 格式,先呈现粗糙版本再按需细化);③ 虚拟内存(固定 GPU 内存池动态置换数据块)。
  • 性能表现:支持桌面、iOS、Android、VR 全平台,突破设备内存限制,实现边下载边交互的流畅体验。
  • 环境要求:
    • 支持 WebGL2 的现代浏览器(Chrome、Safari、Firefox、Edge 等)。
    • 无需 WebGPU,兼容性更广
  • 硬件支持:桌面端、移动端(iOS/Android)、VR 设备(Quest 3、Apple Vision Pro 等)。

Spark 2.0的核心优势

  • 超大规模承载:突破消费级设备通常仅支持 1-500 万 splats 的限制,可实时渲染 1 亿+ splats 的巨型场景。
  • 即点即看的流式体验:采用自研 .RAD 格式与渐进式传输技术,场景用 64K 粗糙版本即时呈现,无需等待数百 MB 数据完全下载。
  • 全平台无缝兼容:基于 WebGL2  构建,覆盖桌面、iOS、Android 及 VR 设备,无需担心 API 支持差异。
  • 智能细节平衡:独创连续 LoD Splat Tree 系统,根据视角距离与注视点动态调整精度,近实远虚且过渡平滑无跳变。
  • 多对象全局融合:支持同时加载多个独立 3DGS 对象,自动进行跨对象全局深度排序,解决传统渲染器”贴图叠加”问题。
  • 内存无感扩展:通过虚拟内存页表机制,自动从网络置换数据块,使浏览器可访问远超本地 GPU 内存限制的海量资源。

Spark 2.0的项目地址

  • 项目官网:https://www.worldlabs.ai/blog/spark-2.0
  • GitHub仓库:https://github.com/sparkjsdev/spark/

Spark 2.0的同类竞品对比

对比维度 Spark 2.0 Luma AI
产品形态 开源 JavaScript 库,开发者可深度定制、私有化部署与任意集成 闭源 SaaS 平台,提供标准化上传-查看托管服务
实时编辑 支持浏览器内实时修改 splat 属性、颜色调整、SDF 裁剪与动态特效 仅提供固定视角浏览与预设路径,不支持实时参数调整
数据主权 支持 PLY/SPZ/Splat 等多种输入格式并开放 .RAD 标准,数据完全自主 封闭生态,仅支持平台生成的特定格式,导出受限
场景规模 通过 LoD 系统智能管理显存,可流畅浏览超大规模城市级场景 受限于平台处理能力与订阅等级,超大场景需排队或降质处理
成本结构 免费开源,仅需承担自身服务器带宽与存储成本 按使用量、导出分辨率与 API 调用的订阅制收费
离线能力 支持完全离线环境或私有 CDN 部署,无需外网依赖 必须持续联网访问 Luma 云端服务,依赖平台可用性

Spark 2.0的应用场景

  • 数字孪生与城市治理:用于构建城市级数字孪生底座,支持在浏览器中实时浏览包含数千万 splats 的智慧城市三维模型,无需部署重型客户端可实现远程巡检与管理。
  • VR/AR 沉浸体验:用于 VR/AR 头显设备上的大空间沉浸式漫游,可在 Quest 3 或 Apple Vision Pro 中流畅探索超大规模的虚拟文旅与世界构建场景。
  • 实时内容创作:用于基于网页的实时协作与内容创作,支持在浏览器中直接对 AI 生成的 3D 世界进行实时编辑、重光照及动态特效调整。
  • 线上展览与电商:用于博物馆、艺术展及房地产的线上展示,通过渐进式流式加载技术让用户 instant 浏览大型数字化场景而无需等待完整下载。
  • 网页游戏与虚拟活动:用于开放世界网页游戏和虚拟演唱会,实现边玩边下载的流式场景加载,支持超大规模虚拟环境的实时交互渲染。

📝 站长洞察 (Editor’s Insight)

Spark 2.0 的发布绝非一次简单的工具更新,它标志着 Web 端 3D 渲染范式的一次重要跃迁。其核心价值在于,它首次在消费级硬件和浏览器环境中,系统性地解决了 3D 高斯溅射(3DGS)这一新兴表示方法从“可用”到“大规模实用”的工程难题。通过 LoD Splat Tree、.RAD 格式和虚拟内存的组合拳,它将学术界前沿的 3DGS 技术,封装成了开发者开箱即用、可部署于真实互联网环境的生产级工具。这预示着,基于 NeRF/3DGS 的神经渲染技术,正从实验室的“炫技”快速走向驱动电商、文旅、建筑、游戏等行业的“生产力工具”。World Labs 通过开源 Spark,不仅是在推广一个引擎,更是在抢占下一代 Web 图形标准的技术制高点和生态话语权,其战略意图深远。对于开发者而言,这是拥抱空间互联网时代必须关注的关键基础设施。

Leap Touch
Kimi WebBridge深度解析:月之暗面如何用浏览器插件让AI Agent真正接管网页操作
Content Company
2026 AIGC峰会前瞻:京东科技JoyInside如何定义“AI World”,让智能硬件成为家庭新成员?
Bloony
TAGGED:3D 高斯溅射Spark 2.0WebGL2World Labs实时渲染
分享
Email 复制链接 打印
Share
上一篇 百度ERNIE-Image 8B文生图模型重磅开源:中英长文本精准渲染+24GB显存本地跑
下一篇 明略科技开源Mano-P 1.0:纯视觉GUI智能体模型,OSWorld霸榜,端侧本地部署重塑自动化
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

PokeClaw:全球首个全本地离线手机AI Agent,基于Gemma 4开源免费,隐私安全自动化新标杆
AI 工具 AIGC 资讯
量子芯片科技感占位特色图
奔腾4惊现AI复活赛!2006年古董CPU硬扛Meta Llama 3大模型,每秒仅0.21 Token背后藏何玄机?
AI 工具 AIGC 资讯
Webwright 开源:微软发布代码驱动网页智能体,彻底告别传统点击模式
AI 工具 AIGC 资讯 最新趋势
米哈游蔡浩宇押注!17B参数LPM 1.0:实时全双工、无限时长、跨风格数字人新标杆
AI 工具 AIGC 资讯

相关推荐

AI 工具

Webullar

remaker
AIGC 资讯最新趋势

OpenAI高薪招安全研究员:年薪最高44.5万美元,要求「良好品位」引热议

站外新闻
AI安全 openai 人工智能 安全研究员 递归式自我改进
AI 工具

guizang-ppt-skill:开源 Claude Skill 一键生成杂志风单文件 HTML 演示文稿,零部署直接打开

站外新闻
AI Skill AIGC Claude Code HTML演示 开源
AI 工具

Notability AI

remaker
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI安全 AI工具 AI智能体 AI生成内容 AI绘画 AI编程 AI编程工具 AI视频 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos DALL-E3 DeepSeek Gemini GPT-5.5 meta Midjourney MoE MoE架构 MoE模型 NVIDIA openai Pika prompt runway stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 办公自动化 华为昇腾 咒语 商汤科技 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 女性 字节跳动 室内设计 家居 展台 建筑 建筑设计 开发者工具 开源 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 微摄影 微软 提示词 教程 新加坡 新闻 早报 智能体 智能体编程 月之暗面 水果 海报设计 清华大学 游戏 生成式AI 破碎 科幻 窗 端侧AI 网络安全 背景 腾讯混元 芭比 英伟达 视频编辑 语音合成 赛博朋克 运动 阶跃星辰 阿里通义 阿里通义千问 风景 马斯克
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.