Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: Qihoo-T2X – 360 AI 研究院和中山大学开源的高效多模态生成模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > Qihoo-T2X – 360 AI 研究院和中山大学开源的高效多模态生成模型
AIGC 资讯

Qihoo-T2X – 360 AI 研究院和中山大学开源的高效多模态生成模型

站外新闻
最近更新: 2026年6月8日 上午11:33
SHARE

QIHOO-T2X是什么

Qihoo-T2X 是360 AI 研究院和中山大学推出的基于代理标记化扩散 Transformer(PT-DiT)的高效多模态生成模型,Qihoo-T2X引入稀疏代理标记注意力机制,显著降低传统扩散 Transformer 在全局自注意力计算中的冗余性,结合窗口注意力和移位窗口注意力增强细节建模能力。Qihoo-T2X 支持多种任务,包括文本到图像(T2I)、文本到视频(T2V)和文本到多视图(T2MV)生成。

阅读目录
  • QIHOO-T2X是什么
  • Qihoo-T2X的主要功能
  • Qihoo-T2X的技术原理
  • Qihoo-T2X的项目地址
  • Qihoo-T2X的应用场景

QIHOO-T2X

Qihoo-T2X的主要功能

  • 文本到图像:根据输入的文本描述生成高质量、高分辨率的图像,生成与文本描述高度一致的图像内容,适用于创意设计、艺术生成等领域。
  • 文本到视频:根据文本描述生成连贯的视频内容,支持生成动态场景和视频序列,适用于视频创作、动画制作等场景。
  • 文本到多视图:根据文本描述生成同一物体或场景的多视角图像,适用于 3D 对象的多视角展示,支持虚拟现实(VR)和增强现实(AR)应用。
  • 高效生成:基于优化的代理标记化注意力机制,显著降低计算复杂度,支持高分辨率图像和长视频的高效生成,降低训练和推理成本。

Qihoo-T2X的技术原理

  • 代理标记化注意力:传统的扩散 Transformer 用全局自注意力机制,计算复杂度高且存在冗余。PT-DiT(Qihoo-T2X的核心架构) 基于在每个时空窗口内计算平均标记作为代理标记(proxy tokens),对代理标记进行自注意力计算,大幅减少计算量。代理标记之间的全局语义信息基于交叉注意力(cross-attention)注入到所有潜在标记中,确保全局信息的有效传播。
  • 窗口注意力与移位窗口注意力:为增强局部细节建模能力,PT-DiT 引入窗口注意力机制,对局部窗口内的标记进行自注意力计算。移位窗口注意力机制用在避免因窗口划分导致的“网格效应”,进一步提升生成质量。
  • 稀疏代理标记的高效计算:基于稀疏代理标记机制,PT-DiT 在处理高分辨率图像和长视频时,显著降低计算复杂度,且保持生成内容的质量。
  • 多任务适应性:PT-DiT 的架构设计能无缝适应图像生成、视频生成和多视图生成等多种任务,无需对模型结构进行重大调整。

Qihoo-T2X的项目地址

  • 项目官网:https://360cvgroup.github.io/Qihoo-T2X/
  • GitHub仓库:https://github.com/360CVGroup/Qihoo-T2X
  • arXiv技术论文:https://arxiv.org/pdf/2409.04005

Qihoo-T2X的应用场景

  • 创意设计与艺术创作:基于文本描述快速生成高质量艺术图像,支持多种风格,加速设计流程,为艺术家提供灵感。
  • 视频内容生成:生成连贯的动画视频,适用于广告、宣传和动画制作,减少视频创作成本和时间。
  • 教育与培训:生成教学用图像和视频,帮助学生理解复杂概念,支持虚拟实验室和动态教学资源。
  • 娱乐与游戏开发:生成虚拟场景、角色和动态内容,用在游戏开发、虚拟现实(VR)和增强现实(AR)应用,提升沉浸感。
  • 广告与营销:快速生成个性化广告图像和视频,提高营销效果,满足品牌视觉内容需求。
Meta 全球强推 ‘Meta One’ 订阅生态:AI 算力+社交增值+商业赋能,开启万亿营收第二曲线
NodeRAG – 开源基于异构图的智能检索与生成系统
Mogao – 字节跳动Seed团队推出的多模态理解与生成统一架构
通义千问「拍照问健康」重大升级:AI圈图识异常、智能推理获三甲专家实测认可
混元图像2.0 – 腾讯推出的实时AI图片生成大模型
分享
Email 复制链接 打印
Share
上一篇 GigaTok – 港大联合字节推出用于自回归图像生成的视觉分词器
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

GigaTok – 港大联合字节推出用于自回归图像生成的视觉分词器
AIGC 资讯
FlashMLA – DeepSeek 开源的高效 MLA 解码内核,专为Hopper 架构 GPU 设计
AIGC 资讯
Anus – Manus 生成的开源 AI 智能体项目,复刻 Manus 部分功能
AIGC 资讯
Magic 1-For-1 – 北大、英伟达等推出的高效视频生成模型
AIGC 资讯

相关推荐

AIGC 资讯

Mellum2 – JetBrains 开源的混合专家模型

站外新闻
AIGC 资讯

Top five Romantic Vacation Destinations

lilizhu
AIGC 资讯

Magenta RealTime 2 – 谷歌Magenta开源的实时音乐生成模型

站外新闻
AIGC 资讯

ACI.dev – 为AI智能体设计的开源MCP基础设施平台

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.