share_log

微软正式开源 Phi-4 语言模型

Tencent Stocks ·  Jan 9 14:18

编译/前方智能

微软于 2025 年 1 月 8 日正式宣布,将其 Phi-4 语言模型完整开源,并在 AI 代码共享平台 Hugging Face 上发布了包含模型权重在内的所有内容。该模型采用 MIT 许可,这意味着开发者可以将其用于商业应用。

Phi-4 是一个仅有 140 亿参数的小型语言模型,其训练数据包含 9.8 万亿个 tokens,涵盖经过严格筛选的公开文档、类似教科书的合成数据以及高质量的学术著作和问答数据集。尽管体量较小,但在多项基准测试中表现出色,特别是数学推理和编程。该模型在 MATH 和 MGSM 等具有挑战性的基准测试中得分超过 80%,超越了包括 Gemini Pro 和 GPT-4o-mini 在内的多个更大规模模型。

在 2024 年 11 月的美国数学竞赛测试中,Phi-4 取得了 91.8% 的平均得分,这一成绩出人意料地超过了所有参与测试的竞争对手。值得注意的是,这些测试题目是在模型训练完成后才出现的,这证明了模型具有真正的推理能力,而不仅仅是记忆训练数据。

The above content is for informational or educational purposes only and does not constitute any investment advice related to Futu. Although we strive to ensure the truthfulness, accuracy, and originality of all such content, we cannot guarantee it.
    Write a comment