Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集
AIGC 资讯

WebLI-100B – 谷歌 DeepMind 推出的1000亿视觉语言数据集

站外新闻
最近更新: 2026年6月9日 上午5:03
SHARE

WebLI-100B是什么

WebLI-100B是Google DeepMind推出的包含1000亿图像-文本对的超大规模数据集,用在预训练视觉语言模型(VLMs)。WebLI-100B是WebLI数据集的扩展版本,基于从网络中收集大量图像及其对应的标题或页面标题作为文本配对信息构建而成。WebLI-100B的规模是之前最大视觉语言数据集的十倍,用海量数据提升模型对长尾概念、文化多样性和多语言内容的理解能力。研究者在构建时仅进行基本的数据过滤,保留尽可能多的语言和文化多样性。WebLI-100B的出现为训练更具包容性的多模态模型提供了重要的基础资源。

阅读目录
  • WebLI-100B是什么
  • WebLI-100B的主要功能
  • WebLI-100B的技术原理
  • WebLI-100B的项目地址
  • WebLI-100B的应用场景

WebLI-100B

WebLI-100B的主要功能

  • 支持大规模预训练:WebLI-100B提供1000亿个图像-文本对,为VLMs的预训练提供丰富的数据资源,显著提升模型在多种任务上的性能。
  • 提升文化多样性:包含来自不同文化背景的图像和文本,帮助模型更好地理解和生成与不同文化相关的视觉和语言内容。
  • 增强多语言能力:数据集中包含多种语言的文本,有助于提升模型在低资源语言上的性能,促进多语言任务的开发和应用。
  • 支持多模态任务:WebLI-100B的数据用在多种多模态任务,如图像分类、图像描述生成、视觉问答等,为多模态模型的开发提供强大的支持。

WebLI-100B的技术原理

  • 数据收集:
    • 来源:WebLI-100B的数据主要来源于互联网,通过大规模的网络爬取收集图像及其对应的文本描述(如图像的alt文本或页面标题)。
    • 规模:数据集包含1000亿个图像-文本对,是迄今为止最大的视觉语言数据集之一。
  • 数据过滤:
    • 基本过滤:为了确保数据的质量和多样性,WebLI-100B仅进行了基本的数据过滤,例如移除有害图像和个人身份信息(PII),以保留尽可能多的语言和文化多样性。
    • 质量过滤(可选):研究中还探讨了使用CLIP等模型进行数据过滤,以提高数据质量,但这种过滤可能会减少某些文化背景的代表性。
  • 数据处理:
    • 文本处理:将图像的alt文本和页面标题作为配对文本,使用多语言mt5分词器进行分词处理,确保文本数据的多样性和一致性。
    • 图像处理:将图像调整为224×224像素的分辨率,适应模型的输入要求。

WebLI-100B的项目地址

  • arXiv技术论文:https://arxiv.org/pdf/2502.07617

WebLI-100B的应用场景

  • 人工智能研究者:用在模型预训练,探索新算法,提升视觉语言模型性能。
  • 工程师:开发多语言和跨文化的应用,如图像描述、视觉问答和内容推荐系统。
  • 内容创作者:生成多语言的图像描述和标签,提升内容的本地化和多样性。
  • 跨文化研究者:分析不同文化背景下的图像和文本,研究文化差异。
  • 教育工作者和学生:作为教学资源,学习多模态数据处理和分析。
龙猫LongCat – 美团自主研发的生成式AI大模型
Mureka O1 – 昆仑万维推出的音乐推理大模型
TheoremExplainAgent – AI教学双智能体,数理化定理自动转动画
米哈游蔡浩宇押注!17B参数LPM 1.0:实时全双工、无限时长、跨风格数字人新标杆
禁用12小时后全面恢复!Notion 澄清 Anthropic 模型下线传闻:仅为技术性故障
分享
Email 复制链接 打印
Share
上一篇 CLaMP 3- 清华团队推出的音乐信息检索框架
下一篇 Edicho – 蚂蚁集团联合港科大等高校推出的多图像一致性编辑方法
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

智源发布RoboCOIN:18万条演示数据,打造具身智能研究的开源基石
AI 工具 AIGC 资讯
NewBieAi Lab 开源3.5B动漫大模型:Next-DiT架构,8×H200训练4个月,专攻高质量动漫生成
AI 工具 AIGC 资讯
腾讯混元2.0震撼发布:4060亿参数MoE架构大模型,256K上下文,国内推理能力登顶
AI 工具 AIGC 资讯
美团开源LongCat-Image:6B参数逼平闭源模型,8105汉字渲染+图像编辑全搞定
AI 工具

相关推荐

AIGC 资讯

Open-Sora 2.0 – 潞晨科技开源的AI视频生成模型

站外新闻
AIGC 资讯

VideoChat-Flash – 上海 AI Lab 等机构推出针对长视频建模的多模态大模型

站外新闻
AIGC 资讯

ACE-Step – ACE Studio联合阶跃星辰开源的音乐生成基础模型

站外新闻
AI 工具AIGC 资讯

告别终端Agent上下文爆炸!TACO:北航等高校开源自进化压缩框架,省Token提准确率

站外新闻
上下文压缩 大模型效率 开源框架 终端智能体 长程任务
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI智能体 AI绘画 AI编程 AI编程工具 AI视频 AI视频生成 AI设计 AI音乐生成 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek Gemini GPT-5.4 GPT-5.5 MCP协议 meta Midjourney MiniMax MoE架构 NVIDIA openai OpenClaw prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 全模态大模型 具身智能 命令行工具 图像生成 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大模型推理 大语言模型 字节跳动 家居 小红书 展台 开源 开源AI工具 开源大模型 开源工具 开源框架 开源模型 开源项目 强化学习 微软 教程 早报 智能体编程 智谱AI 月之暗面 本地AI 海报设计 清华大学 生成式AI 科幻 端侧AI 端侧大模型 端侧部署 网络安全 腾讯 腾讯混元 英伟达 蚂蚁集团 视频生成 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 边缘计算 通义千问 长上下文 阶跃星辰 阿里通义 面壁智能 香港大学
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.