Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: FluxSR – 上海交大联合华为等高校推出的图像超分辨率模型
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > FluxSR – 上海交大联合华为等高校推出的图像超分辨率模型
AIGC 资讯

FluxSR – 上海交大联合华为等高校推出的图像超分辨率模型

站外新闻
最近更新: 2026年6月9日 上午4:23
SHARE

FluxSR是什么

FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率(Real-ISR)任务。FluxSR基于FLUX.1-dev文本到图像(T2I)扩散模型,通过流轨迹蒸馏(FTD)技术将多步流匹配模型蒸馏为单步超分辨率模型。FluxSR的核心优势在于能在保持T2I模型高真实感的同时,高效地生成高质量的超分辨率图像。FluxSR用TV-LPIPS感知损失和注意力多样化损失(ADL)优化图像高频细节,减少伪影。FluxSR在多个数据集上展现出卓越的性能,尤其在无参考图像质量评估指标上表现突出,显著降低计算成本,为高效、高质量的图像超分辨率提供新的解决方案。

阅读目录
  • FluxSR是什么
  • FluxSR的主要功能
  • FluxSR的技术原理
  • FluxSR的项目地址
  • FluxSR的应用场景

FluxSR

FluxSR的主要功能

  • 高效单步超分辨率重建:在单步扩散过程中将低分辨率图像高效地恢复为高分辨率图像,显著减少计算成本和推理延迟,适合快速图像处理需求。
  • 高真实感图像生成:从预训练的文本到图像(T2I)模型中提取高真实感细节,将其应用于超分辨率任务,生成具有丰富细节和高真实感的图像。
  • 高频细节恢复与伪影抑制:能有效恢复图像的高频细节,减少高频伪影和重复模式。

FluxSR的技术原理

  • 流轨迹蒸馏(Flow Trajectory Distillation, FTD):
    • 噪声到图像流的生成:用预训练的T2I模型生成噪声到图像的流。
    • 低分辨率到高分辨率流的推导:基于数学关系推导出LR到HR的流轨迹,避免直接优化SR流导致的分布偏移。
  • 单步扩散模型的训练策略:基于对大模型友好的训练策略,离线生成噪声到图像的流数据对,避免在训练过程中依赖额外的教师模型。显著减少内存消耗和训练成本,让单步模型的训练更加高效。
  • 感知损失和正则化:
    • TV-LPIPS感知损失:结合总变差(TV)和LPIPS(Learned Perceptual Image Patch Similarity)损失,强调高频分量的恢复并减少生成图像中的伪影。
    • 注意力多样化损失(ADL):基于减少变换器中不同token的相似性,增强注意力的多样性,消除高频伪影。
  • 高效推理:在推理阶段仅依赖单个流模型,避免多步扩散模型的高计算开销。基于FTD技术,在单步中生成高质量的超分辨率图像,同时保持与多步模型相当的真实感。

FluxSR的项目地址

  • GitHub仓库:https://github.com/JianzeLi-114/FluxSR
  • arXiv技术论文:https://arxiv.org/pdf/2502.01993

FluxSR的应用场景

  • 老旧照片修复:将低分辨率、模糊或损坏的老照片恢复为高分辨率、清晰的图像。
  • 影视制作:在影视后期制作中,将低分辨率的素材提升为高分辨率,适应高清或4K制作需求
  • 医学影像增强:提升低分辨率的医学影像(如X光、CT、MRI)的分辨率,帮助医生更准确地诊断疾病。
  • 智能手机拍照:提升手机拍摄的低分辨率照片的清晰度,尤其是在低光照或快速运动场景下。
  • 质量检测:在工业生产中,提升生产线上的图像检测系统的分辨率,帮助更准确地检测产品缺陷。
港大重磅开源CLI-Anything:一键将GIMP、Blender等软件代码库转为AI Agent原生工具,彻底告别脆弱GUI自动化
Hi3DGen – 港中文、字节、清华联合推出的3D几何生成框架
小米OmniVoice震撼开源:600+语种、40倍实时,定义下一代多语言TTS新标杆
Keye-VL-2.0-30B-A3B – 快手开源的自研多模态大模型
ART – 微软联合清华和北大等推出的多层透明图像生成技术
分享
Email 复制链接 打印
Share
上一篇 Avat3r – 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型
下一篇 Kiln AI- 开源 AI 原型设计和数据集协作开发工具,微调专属模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

谷歌Gemini Embedding 2重磅发布:首个原生多模态嵌入模型,统一文本图像音频向量空间
AI 工具 AIGC 资讯
Lightricks LTX-2.3 开源发布:220亿参数视频生成模型,支持4K竖屏与音视频同步
AI 工具
英伟达Nemotron 3 Super开源发布:1200亿参数Mamba-MoE架构,智能体推理速度提升3倍,性能直逼Claude Opus 4.6
AI 工具 AIGC 资讯
阶跃AI发布StepClaw:一键部署云端AI助手,自主进化能力颠覆办公自动化
AI 工具

相关推荐

http://farm1.staticflickr.com/113/251326656_af46b5ba9b_z.jpg
AIGC 资讯

What you should Talk About over a First Date

lilizhu
全息流体渐变通用占位特色图
AIGC 资讯

腾讯会议多项AI功能升级,元宝纪要月使用时长增长近5倍

站外新闻
AIGC 资讯

Ming‑Flash‑Omni 2.0 – 蚂蚁开源的全模态大模型

站外新闻
全息流体渐变通用占位特色图
AIGC 资讯

“聊天已死”?OpenAI 秘密推进 ChatGPT 重大改版,拟打造全能“超级应用”

站外新闻
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AI AI Agent AIGC AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI绘画 AI编程 AI编程工具 AI编程智能体 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenClaw OpenRouter Pika prompt stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多智能体 多模态 多模态AI 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源AI工具 开源大模型 开源工具 开源平台 开源框架 开源模型 强化学习 形式化验证 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.