<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>MM1 | Yummy 😋</title><description>📰 本频道不定期推送科技数码类新资讯，欢迎关注！  ©️ 发布的内容不代表本频道立场，和你意见不一样的话欢迎在评论区留言表达，但请注意言辞，面斥不雅。  ‼️ 关联群组定期清理不活跃成员和僵尸号，误封请联系管理员。🔗 博客: https://yummy.best  💬 群组: @GodlyGroup  📬 投稿: @GodlyNewsBot  🪧 广告合作： @yummybest_bot.</description><link>https://broadcastchannel-1zj.pages.dev</link><item><title>苹果推出 300 亿参数 MM1 多模态 AI 大模型，可识别图像推理自然语言苹果公司旗下研究团队近日在 ArXiv 中公布了一篇名为《MM1：Methods， Analysis &amp; Insights from Multimodal LLM Pre-training》的论文，其中介绍了一款 “MM1”多模态大模型，该模型提供 30 亿、70 亿、300 亿三种参数规模，拥有图像识别和自然语推理能力</title><link>https://broadcastchannel-1zj.pages.dev/posts/7717</link><guid isPermaLink="true">https://broadcastchannel-1zj.pages.dev/posts/7717</guid><pubDate>Sun, 17 Mar 2024 08:17:31 GMT</pubDate><content:encoded>&lt;a href=&quot;https://www.ithome.com/0/756/154.htm&quot; target=&quot;_blank&quot;&gt;&lt;b&gt;苹果推出 300 亿参数 &lt;/b&gt;&lt;mark&gt;&lt;b&gt;MM1&lt;/b&gt;&lt;/mark&gt;&lt;b&gt; 多模态 AI 大模型，可识别图像推理自然语言&lt;/b&gt;&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;苹果公司旗下研究团队近日&lt;br /&gt;在 ArXiv 中公布了一篇名为《&lt;mark&gt;MM1&lt;/mark&gt;：Methods， Analysis &amp;amp; Insights from Multimodal LLM Pre-training》的论文，其中介绍了一款 “&lt;mark&gt;MM1&lt;/mark&gt;”多模态大模型，该模型提供 30 亿、70 亿、300 亿三种参数规模，拥有图像识别和自然语推理能力。&lt;br /&gt;&lt;br /&gt;苹果研究团队相关论文主要是利用 &lt;mark&gt;MM1&lt;/mark&gt; 模型做实验，通过控制各种变量，找出影响模型效果的关键因素。&lt;br /&gt;研究表明，图像分辨率和图像标记数量对模型性能影响较大，视觉语言连接器对模型的影响较小，不同类型的预训练数据对模型的性能有不同的影响。&lt;br /&gt;&lt;br /&gt;据介绍，研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家（Mixture of Experts）架构及一种名为 Top-2 Gating 的方法构建了 &lt;mark&gt;MM1&lt;/mark&gt; 模型，号称不仅在预训练指标中实现了最好的性能表现，在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。&lt;br /&gt;&lt;br /&gt;研究人员对“&lt;mark&gt;MM1&lt;/mark&gt;”模型进行了测试，号称 &lt;mark&gt;MM1&lt;/mark&gt;-3B-Chat 和 &lt;mark&gt;MM1&lt;/mark&gt;-7B-Chat 优于市面上绝大多数相同规模的模型。&lt;mark&gt;MM1&lt;/mark&gt;-3B-Chat 和 &lt;mark&gt;MM1&lt;/mark&gt;-7B-Chat 在 VQAv2、TextVQA、ScienceQA、MMBench、MMMU 和 MathVista 中表现尤为突出，但是整体表现不如谷歌的 Gemini 和 OpenAI 的 GPT-4V。&lt;br /&gt;&lt;br /&gt;ArXiv 论文地址：&lt;a href=&quot;https://arxiv.org/pdf/2403.09611.pdf&quot; target=&quot;_blank&quot;&gt;https://arxiv.org/pdf/2403.09611.pdf&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;i&gt;via&lt;/i&gt; 匿名&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🗒&lt;/b&gt;&lt;/i&gt; 标签: &lt;a href=&quot;/search/%23Apple&quot;&gt;#Apple&lt;/a&gt; &lt;a href=&quot;/search/%23AI&quot;&gt;#AI&lt;/a&gt; &lt;a href=&quot;/search/%23MM1&quot;&gt;#MM1&lt;/a&gt; &lt;br /&gt;&lt;i&gt;&lt;b&gt;📢&lt;/b&gt;&lt;/i&gt; 频道: &lt;a href=&quot;https://t.me/GodlyNews1&quot; target=&quot;_blank&quot;&gt;@GodlyNews1&lt;/a&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🤖&lt;/b&gt;&lt;/i&gt; 投稿: &lt;a href=&quot;https://t.me/GodlyNewsBot&quot; target=&quot;_blank&quot;&gt;@GodlyNewsBot&lt;/a&gt;</content:encoded></item></channel></rss>