首页
语宙 AI 导航
AIGC 资讯
AIGC 早报
Hot
最新趋势
AI 工具
热门资源
AI 绘图
Prompt 实战
AI 绘画教程
模型精选
强化 AI 学习
AI 图库
人物
展台场景
Banner
游戏
动物
食物
自然
背景
海报
建筑
室内设计
出海数字营销宝典
社区
Search
登陆
通知
阅读更多
Search
首页
语宙 AI 导航
AIGC 资讯
AIGC 早报
Hot
最新趋势
AI 工具
热门资源
AI 绘图
Prompt 实战
AI 绘画教程
模型精选
强化 AI 学习
AI 图库
人物
展台场景
Banner
游戏
动物
食物
自然
背景
海报
建筑
室内设计
出海数字营销宝典
社区
已有帐户?
登陆
标签:
多模态模型
AI 工具
AIGC 资讯
腾讯混元 hunyuan-large-vision:多模态视觉大模型,52B激活参数登顶国内榜首,重塑视觉理解与内容创作
站外新闻
AIGC
多模态模型
腾讯混元
视觉理解
AI 工具
AIGC 资讯
上海AI Lab重磅开源Intern-S1-mini:8B+0.3B轻量多模态科学推理模型,2.5万亿科学标记赋能
站外新闻
Intern-S1-mini
Qwen3
上海人工智能实验室
多模态模型
科学推理
AI 工具
AIGC 资讯
阿里通义开源 Wan2.2-S2V:一张图+一段音频,分钟级生成电影级数字人视频的多模态大模型
站外新闻
AIGC
多模态模型
数字人
视频生成
通义万相
AI 工具
AIGC 资讯
腾讯混元HunyuanVideo-Foley开源:AI视频音效生成模型,多模态扩散变换器驱动沉浸式创作
站外新闻
AIGC
AI视频工具
多模态模型
腾讯混元
音效生成
AI 工具
AIGC 资讯
阿里通义Qwen3-ASR-Flash语音识别模型发布:支持11种语言与歌声识别,多语种Benchmark表现最优
站外新闻
AIGC
Qwen3
多模态模型
语音识别
语音转文字
AI 工具
AIGC 资讯
Sora 2 实测:AI视频同步音画+物理引擎88%合规率,OpenAI如何重新定义内容创作?
站外新闻
AIGC
AI视频生成
openai
Sora 2
多模态模型
AI 工具
AIGC 资讯
谷歌重磅开源T5Gemma 2:128K超长上下文多模态模型,重新定义端侧AI部署
站外新闻
T5Gemma 2
多模态模型
端侧AI
谷歌
长上下文
AI 工具
AIGC 资讯
商汤SenseNova-MARS开源:首个多模态自主推理模型,性能超越GPT-5.2与Gemini-3-Pro
站外新闻
Agentic VLM
商汤科技
多模态模型
大模型开源
自主推理
AI 工具
AIGC 资讯
谷歌DeepMind重磅开源TIPSv2:多模态模型SOTA,零样本分割领先,参数效率极高
站外新闻
Google DeepMind
TIPSv2
图像-文本检索
多模态模型
零样本语义分割
- 入群领取知识星球折扣卷, 仅剩99份 -
最近更新
WrenAI:开源商业智能AI Agent,用自然语言生成SQL,无需代码轻松分析数据
AI 工具
KittenTTS:仅25MB的开源TTS模型,CPU实时推理,离线语音时代来临
AI 工具
AIGC 资讯
字节清华联手发布DreamVVT:扩散Transformer实现视频虚拟试穿新突破,支持整套穿搭与卡通角色
AI 工具
AIGC 资讯
SkyReels-A3:昆仑万维发布DiT数字人模型,音频驱动照片开口说话,60秒视频一键生成
AI 工具
AIGC 资讯