Prompt 语宙Prompt 语宙
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
Search
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2024 Prompt 语宙. HalfPX. All Rights Reserved.
阅读: WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列
Share
登陆
通知 阅读更多
Font Resizer字体
Font Resizer字体
Prompt 语宙Prompt 语宙
Search
  • 首页
  • 语宙 AI 导航
  • AIGC 资讯
    • AIGC 早报Hot
    • 最新趋势
    • AI 工具
    • 热门资源
  • AI 绘图
    • Prompt 实战
    • AI 绘画教程
    • 模型精选
  • 强化 AI 学习
  • AI 图库
    • 人物
    • 展台场景
    • Banner
    • 游戏
    • 动物
    • 食物
    • 自然
    • 背景
    • 海报
    • 建筑
    • 室内设计
  • 出海数字营销宝典
  • 社区
已有帐户? 登陆
  • Contact
  • Blog
  • Complaint
  • Advertise
© 2023 Prompt 语宙. Paooo.com. All Rights Reserved.
Prompt 语宙 > AIGC 资讯 > WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列
AIGC 资讯

WorldPM – 阿里Qwen团队联合复旦推出的偏好建模模型系列

站外新闻
最近更新: 2026年6月7日 下午8:03
SHARE

WorldPM是什么

WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500万条偏好数据进行训练,发现偏好模型在客观领域表现出明显的幂律下降趋势,在主观领域则因多维度特性难以呈现单一的扩展趋势。项目提供72B规模的基础模型和多个针对特定数据集微调的版本,WorldPM-72B-HelpSteer2适用于需要精确偏好判断的特定任务,WorldPM-72B-UltraFeedback适合处理大规模用户反馈场景,WorldPM-72B-RLHFLow专为低资源偏好建模设计,适合数据量较少的场景。支持基于Hugging Face快速使用。WorldPM为自然语言处理中的对话系统、推荐系统等任务提供了强大的偏好建模能力,助力相关领域的发展。

阅读目录
  • WorldPM是什么
  • WorldPM的主要功能
  • WorldPM的技术原理
  • WorldPM的项目地址
  • WorldPM的应用场景

凹凸工坊

WorldPM的主要功能

  • 偏好建模:学习人类的偏好模式,形成统一的偏好表示。
  • 提升泛化能力:帮助模型在不同数据集上表现更好。
  • 作为基础模型:用在偏好微调,提升模型性能。
  • 增强鲁棒性:识别处理错误或不完整信息。

WorldPM的技术原理

  • 偏好数据收集与处理:WorldPM从公共论坛(如StackExchange、Reddit等)收集用户生成的偏好数据。数据基于用户对不同回答的投票机制自然地形成偏好对。
  • 大规模训练与规模定律:WorldPM借鉴语言建模中的规模定律,模型性能随着模型参数规模和训练数据量的增加提升。基于在不同规模的模型(从1.5B到72B参数)上进行训练,WorldPM能探索偏好建模的规模扩展潜力。实验表明,在对抗性和客观性评估任务中,模型性能随着训练数据和模型规模的增加显著提升。
  • 偏好建模框架:WorldPM基于二元偏好对的建模框架。对于每一对偏好样本,模型计算每个回答的奖励分数,优化基于Bradley-Terry模型的BT损失函数来学习偏好模式。
  • 风格偏好分析与控制:为应对主观偏好评估中的风格偏好问题,引入风格偏好分析和控制机制。基于分离风格特征(如文本长度、Markdown格式等)和内容特征,模型能更准确地评估偏好,减少风格因素对评估结果的干扰。
  • 模型扩展与微调:WorldPM能直接用在偏好评估,或作为其他模型的初始化基础,用在进一步的偏好微调。基于在不同规模的人类偏好数据集上进行微调,WorldPM能进一步提升模型的性能,特别是在数据有限的情况下表现出显著的性能提升。

WorldPM的项目地址

  • GitHub仓库:https://github.com/QwenLM/WorldPM
  • HuggingFace模型库:https://huggingface.co/Qwen/WorldPM-72B
  • arXiv技术论文:https://arxiv.org/pdf/2505.10527

WorldPM的应用场景

  • 语言生成优化:让AI生成的文本更自然、更符合人类偏好,例如提升聊天机器人的回复质量。
  • 个性化推荐:根据用户偏好推荐内容,比如文章、视频或音乐,提高推荐的准确性和满意度。
  • 智能客服改进:帮助智能客服更好地理解用户需求,生成更符合用户期望的回复,提升用户体验。
  • 内容审核与安全:识别过滤掉错误或有害信息,确保内容的安全性和可靠性。
  • 多模态应用:扩展到图像和视频等多模态内容的偏好建模,优化内容生成和审核。
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
SuperGPQA – 豆包大模型联合 M-A-P 开源的知识推理基准测试集
日本30大巨头联手软银组建AI国家队,万亿参数模型剑指中美技术高地
Cua – 专为 MacOS 推出的开源 AI Agent项目
Qwen2.5-Omni – 阿里开源的端到端多模态模型
分享
Email 复制链接 打印
Share
上一篇 GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
发表评价

发表评价 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Please select a rating!

Ad image
- 入群领取知识星球折扣卷, 仅剩99份 -
Ad imageAd image

最近更新

GPT‑5.3‑Codex‑Spark – OpenAI推出的轻量级编程模型
AIGC 资讯
AgentRefine – 北京邮电大学联合美团推出的智能体合成框架
AIGC 资讯
Wonderland – 多伦多大学、Snap和UCLA联合推出的单视图3D场景生成技术
AIGC 资讯
MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法
AIGC 资讯

相关推荐

AI 工具AIGC 资讯

MiniMax M3大模型重磅发布:首创MSA架构,1M上下文全面开源,性能对标GPT-5.5

站外新闻
1M上下文 MiniMax M3 MSA架构
全息流体渐变通用占位特色图
AIGC 资讯

顾全全确认离职字节Seed团队,曾主导SeedFold与Seed2.0训练体系建设

站外新闻
AIGC 资讯

ART – 微软联合清华和北大等推出的多层透明图像生成技术

站外新闻
流光脑波AI大脑占位特色图
AIGC 资讯最新趋势

AI眼镜“iPhone时刻”逼近!2026年供应链追光逐芯,恒玄科技重押万亿新赛道

站外新闻
AI眼镜 MicroLED 恒玄科技 智能眼镜 智能穿戴
/ Prompt 语宙 /

Experience the limitless creative possibilities of generative AI and unlock new levels of innovation.

Quick Link

  • Remaker AI
  • BGRemaker 抠图Hot
  • AIGC 工具
  • Prompt 咒语生成器
  • 去水印工具

Support

  • Contact
  • Blog
  • Complaint
  • Advertise

标签

Agent AGI AI AI Agent AIGC AI商业化 AI大模型 AI安全 AI工具 AI搜索 AI智能体 AI生成内容 AI监管 AI绘画 AI编程 AI编程工具 AI编程智能体 AI芯片 AI视频 AI视频生成 AI设计 Anthropic chatgpt Claude Claude Code Claude Mythos Claude Opus 4.8 DeepSeek DuckDuckGo Gemini GPT-5.5 MCP协议 meta Midjourney MiniMax MoE MoE架构 NVIDIA openai OpenRouter Pika prompt SpaceX stable diffusion SWE-Bench xAI 世界模型 丛林 人工智能 人物 企业级AI 具身智能 命令行工具 图像生成模型 多模态 多模态大模型 大模型 大模型API 大模型应用 大语言模型 字节跳动 家居 小米 展台 建筑 开源 开源大模型 开源工具 开源框架 开源模型 强化学习 微软 教程 早报 智能体 智能体编程 智谱AI 月之暗面 本地AI 海报设计 生成式AI 科大讯飞 科幻 端侧AI 端侧大模型 网络安全 联想 腾讯混元 英伟达 苹果 视频生成模型 语音合成 谷歌 谷歌AI 赛博朋克 长上下文 阶跃星辰 阿里通义 阿里通义千问 风景
Prompt 语宙Prompt 语宙
Follow US
© 2009-2026 Prompt 语宙. Paooo.com. All Rights Reserved.