首页
语宙 AI 导航
AIGC 资讯
AIGC 早报
Hot
最新趋势
AI 工具
热门资源
AI 绘图
Prompt 实战
AI 绘画教程
模型精选
强化 AI 学习
AI 图库
人物
展台场景
Banner
游戏
动物
食物
自然
背景
海报
建筑
室内设计
出海数字营销宝典
社区
Search
登陆
通知
阅读更多
Search
首页
语宙 AI 导航
AIGC 资讯
AIGC 早报
Hot
最新趋势
AI 工具
热门资源
AI 绘图
Prompt 实战
AI 绘画教程
模型精选
强化 AI 学习
AI 图库
人物
展台场景
Banner
游戏
动物
食物
自然
背景
海报
建筑
室内设计
出海数字营销宝典
社区
已有帐户?
登陆
标签:
视觉语言模型
AI 工具
AIGC 资讯
Pixel Reasoner:滑铁卢&港科大联手打造,像素空间推理VLM革新视觉理解
站外新闻
Pixel Reasoner
VLM
强化学习
视觉推理
视觉语言模型
AI 工具
AIGC 资讯
VRAG-RL框架详解:阿里通义如何用强化学习突破多模态RAG推理瓶颈?
站外新闻
VRAG-RL
多模态RAG
强化学习
视觉语言模型
阿里通义
AI 工具
AIGC 资讯
Hugging Face开源SmolVLA:4.5亿参数机器人模型,CPU可运行、消费级GPU可训练
站外新闻
Hugging Face
SmolVLA
开源机器人
机器人模型
视觉语言模型
AI 工具
AIGC 资讯
腾讯清华重磅开源MindOmni:强化学习驱动的多模态推理生成模型,重塑视觉AI边界
站外新闻
多模态大模型
强化学习
推理生成
腾讯ARC Lab
视觉语言模型
AI 工具
AIGC 资讯
VLN-R1:港大联合上海AI Lab发布具身智能框架,用视觉语言模型实现3D连续导航
站外新闻
VLN-R1
具身智能
强化微调
港大上海AI Lab
视觉语言模型
AI 工具
AIGC 资讯
智谱AI开源GLM-4.1V-Thinking:9B参数模型性能超越72B,视觉语言模型迎来‘思考’时代
站外新闻
AIGC
GLM-4.1V-Thinking
思维链推理
智谱AI
视觉语言模型
AI 工具
AIGC 资讯
小红书Hi Lab重磅开源dots.vlm1:12亿参数视觉编码器+DeepSeek V3,多模态大模型性能直逼闭源SOTA
站外新闻
DeepSeek V3
dots.vlm1
多模态大模型
小红书hi lab
视觉语言模型
AI 工具
AIGC 资讯
Hugging Face重磅开源FineVision视觉语言数据集:1700万图像+8900万轮对话,AI模型性能飙升20%
站外新闻
AIGC
Hugging Face
多模态数据集
开源AI
视觉语言模型
AI 工具
AIGC 资讯
IBM发布258M参数轻量级视觉语言模型:高效文档转换,支持多语言与复杂版式
站外新闻
IBM
企业级应用
多模态AI
文档转换
视觉语言模型
AI 工具
AIGC 资讯
Qwen3-VL:阿里通义最强视觉语言模型发布,4B/8B版开源,全面超越GPT-5 Mini与Claude4 Sonnet
站外新闻
AI开源模型
Qwen3-VL
多模态AI
视觉语言模型
通义千问
AI 工具
AIGC 资讯
字节抖音联合新加坡国立大学开源SAIL-VL2:MoE架构视觉语言模型革新多模态AI
站外新闻
AIGC
多模态理解
字节跳动
混合专家架构
视觉语言模型
AI 工具
AIGC 资讯
阿里Qwen3-VL Cookbooks发布:开发者必看的多模态AI应用与落地全指南
站外新闻
AI开发指南
Qwen3-VL
多模态AI
视觉语言模型
阿里云
AI 工具
AIGC 资讯
字节跳动重磅开源MineContext:主动式AI上下文感知工具,5秒屏幕挖掘重塑数字生产力
站外新闻
上下文感知
字节跳动
开源AI
知识管理
视觉语言模型
AI 工具
AIGC 资讯
DeepSeek-OCR开源:10倍压缩97%精度,高效文档处理迎来颠覆性突破
站外新闻
DeepSeek-OCR
光学字符识别
大模型训练数据
文档数字化
视觉语言模型
AI 工具
AIGC 资讯
Glyph视觉压缩框架:智谱清华联手,大模型推理速度提升4倍,显存占用直降2/3
站外新闻
上下文压缩
智谱
清华大学
视觉语言模型
AI 工具
AIGC 资讯
360重磅开源FG-CLIP 2:超越Google与Meta,全球最强双语视觉语言模型来了!
站外新闻
360开源
FG-CLIP 2
双语AI
细粒度对齐
视觉语言模型
1
2
- 入群领取知识星球折扣卷, 仅剩99份 -
最近更新
Pixel Reasoner:滑铁卢&港科大联手打造,像素空间推理VLM革新视觉理解
AI 工具
AIGC 资讯
中科院联手中国电信发布MTVCrafter:3D运动驱动、4D标记化技术,视频生成质量飙升65%
AI 工具
AIGC 资讯
Morphik:开源多模态RAG工具,用视觉理解革新文档检索与知识管理
AI 工具
AgenticSeek:开源本地AI Agent深度解析|Manus平替,自主执行任务全指南
AI 工具
AIGC 资讯