辣妈3最强开源大模型来袭
Llama3:开源之光
Meta,作为真正的"OpenAI",一直是大模型生态的基石。而今,备受瞩目的Llama3,在长达9个月的期待之后,终于揭开了神秘的面纱。
长话短说:
Llama 3 8B :基本上比最大的 Llama 2 70B 还要强大。
Llama 3 70B : 第一档 AI 模型,媲美 Gemini 1.5 Pro、全面超越 Claude ,以上还只是 Meta 的开胃小菜,真正的大餐还在后头。在未来几个月,Meta 将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新模型。 其中,超 400B 的重量级选手更是有望与 Claude 3 一决雌雄

模型发布与开源
模型体验地址:https://llama.meta.com/llama3/
Llama3目前已在官网和huggingface上开放下载,遵循Meta一贯的开源精神,尽管有特定条件下的商业使用限制,实际上几乎等同于免费商用。此次开源的模型包括8B和70B两个版本。

性能评测:全线秒杀
Llama3在5个评测集上的表现令人震惊:MMLU、GPQA、HumanEval、GSM-8K和MATH。无论是8B还是70B版本,都展现出了压倒性的优势,甚至8B模型的性能超越了Llama2的70B版本。

知识库与上下文长度
然而,Llama3也存在一些局限性,如知识库时间截止到2023年12月,上下文长度仅为8K,这在当前动辄200k的AI时代中显得有些不足。
预训练数据与多语言支持
Llama3的预训练数据使用了超过15TB的词库,是Llama 2的七倍,代码数量是Llama 2的四倍。预训练数据集包含5%以上的非英语数据,覆盖30多种语言,但是中文还是有所欠缺。
社区与本地部署
Llama3的中文支持尚需改进,需要社区成员的微调才能更好地应用。使用Llama3时,必须遵守社区许可证和可接受使用政策。对于开源的大模型,最具价值的是可以down下来然后进行微调,相比于【closeAI】 Meta真的是跨越了历史性的一步。
代码能力的突破



共有 0 条评论