Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成
AIGC 资讯

StarVector – 开源多模态视觉语言模型,支持图像和文本到 SVG 生成

站外新闻
最近更新: 2026年6月8日 下午8:27
SHARE

StarVector是什么

StarVector 是开源的多模态视觉语言模型,ServiceNow Research、Mila – Quebec AI Institute 和 ETS Montreal 联合开发,专注于将图像和文本转换为可缩放矢量图形(SVG)代码。 模型采用多模态架构,能同时处理图像和文本信息,直接在 SVG 代码空间中操作,生成标准的、可编辑的 SVG 文件。StarVector 在包含超过 200 万个 SVG 样本的 SVG-Stack 数据集上训练,提供 StarVector-1B 和 StarVector-8B 两种规模,满足不同需求。

阅读目录
  • StarVector是什么
  • StarVector的主要功能
  • StarVector的技术原理
  • StarVector的项目地址
  • StarVector的应用场景

StarVector

StarVector的主要功能

  • 图像到 SVG 的转换(Image-to-SVG):能将图像直接转换为 SVG 代码,实现图像的矢量化。
  • 文本到 SVG 的生成(Text-to-SVG):可以根据文本指令生成相应的 SVG 图形。

StarVector的技术原理

  • 多模态架构:StarVector 采用多模态架构,将视觉和语言模型无缝集成。通过视觉编码器(如 Vision Transformer 或 CLIP 图像编码器)提取图像的视觉特征,然后通过适配器(Adapter)将这些特征映射到语言模型的嵌入空间,生成视觉标记。这些视觉标记与文本嵌入一起输入到语言模型中,实现对图像和文本的统一处理。
  • 图像编码与视觉标记生成:图像编码器(如 Vision Transformer)将输入图像分割成小块并转换为隐藏特征。通过非线性适配器投影到语言模型的嵌入空间,形成视觉标记。能捕捉图像的关键视觉特征,如形状、颜色分布和结构布局。
  • 语言模型与 SVG 代码生成:StarVector 使用基于 StarCoder 的语言模型,在训练期间,模型通过 SVG 代码的下一个标记预测任务进行监督学习。在推理阶段,模型基于输入图像的视觉标记来自回归地预测 SVG 代码。
  • 大规模数据集训练:StarVector 在包含超过 200 万个 SVG 样本的 SVG-Stack 数据集上进行训练。数据集涵盖了多样化的 SVG 样本,支持图像到 SVG 和文本到 SVG 的多样化任务。StarVector 引入了 SVG-Bench 评估基准,用于全面评估模型性能。
  • 性能优势:StarVector 在图像到 SVG 和文本到 SVG 的任务中表现出色。生成的 SVG 文件更紧凑、语义更丰富,有效利用了 SVG 原语。在 SVG-Bench 基准测试中,StarVector 在多个指标上优于传统方法和深度学习基线模型。

StarVector的项目地址

  • 项目官网:https://starvector.github.io/
  • Github仓库:https://github.com/joanrod/star-vector
  • arXiv技术论文:https://arxiv.org/pdf/2312.11556

StarVector的应用场景

  • 图标生成:根据文本描述或图像输入快速生成 SVG 图标,用于网页导航栏、按钮等。
  • 艺术创作:艺术家可以用 StarVector 将创意草图或文字描述转化为矢量艺术作品,方便后续编辑和修改。
  • 动画制作:生成的 SVG 图形可以作为动画制作的基础元素,进一步开发成动态效果。
  • 编程教育:学生可以通过 StarVector 学习 SVG 代码的生成和编辑,提高编程和图形设计能力。
  • 技术图表生成:根据文本描述生成技术图表,如流程图、结构图等,用于工程文档和技术说明。
  • 数据可视化:将数据可视化为 SVG 图形,方便在网页或报告中展示,同时保持图形的可编辑性和可扩展性。
2026年5月27日
黄仁勋内部讲话引爆科技圈:AI时代,宁可浪费钱也别浪费时间
​加大学开启 AI 实验:50 万师生与 ChatGPT 共探未来教育
Step-Video-TI2V – 阶跃星辰开源的图生视频模型
百度MEG组织架构调整:升级数字人业务并成立大商业事业部
分享
Email 复制链接 打印
Share
上一篇 GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
下一篇 Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型
AIGC 资讯
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
AIGC 资讯
GitHub MCP Server – GitHub推出基于 MCP 的服务器工具
AIGC 资讯
Probly – AI电子表格工具,交互式生成分析结果或可视化图表
AIGC 资讯

相关推荐

AIGC 资讯

SkyReels-V1 – 昆仑万维开源首个面向AI短剧创作的视频生成模型

站外新闻
AI 工具AIGC 资讯

复旦重磅发布LifeSim:全球首个长程用户生活模拟框架,革新AI助手评测与训练

站外新闻
AI助手评测 BDI认知模型 LifeSim 个性化AI 长程模拟
流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

AI与航天三巨头集体IPO:SpaceX、OpenAI、Anthropic万亿募资潮,2026美股能否消化史上最大抽血?

站外新闻
AI上市 Anthropic openai SpaceX 美股IPO
AIGC 资讯

Open Code Review – 阿里开源的 AI 代码审查 CLI 工具

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.