每经记者文巧
|2024年3月18日周一|
NO.1 苹果推出MM1多模态大模型
最近,在一篇名为MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training的论文中,苹果正式公布MM1多模态大模型研究成果。该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。它由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现最优效果,在一系列已经有多模态基准上监督微调后也能保持有竞争力的性能。
点评:苹果的这一突破性技术展示了其在多模态AI领域的成果,有助于推动行业创新。
NO.2 英伟达GTC2024即将揭幕
3月18日至21日,英伟达GTC大会将在圣何塞会议中心和线上同时举行。这是英伟达每年最重要的技术发布平台之一,被业界公认为“AI风向标”。据了解,英伟达有望在大会上发布Blackwell架构及B100芯片。作为Hopper架构H200芯片的下一代产品,英伟达早已在全球超算大会上展示过B100芯片的强劲性能,在训练GPT-3 1750亿参数模型的比较中,B100芯片以喷射式的性能提升幅度碾压H100和H200芯片。另外,英伟达或将发布一系列生成式AI应用。
点评:英伟达即将发布的新技术可能会进一步巩固其在高性能计算和AI领域的市场主导地位。
NO.3 CAR-T疗法对实体瘤显示出效果
最近,两篇分别刊登于《自然-医学》和《新英格兰医学杂志》的研究结果表明,抗原嵌合受体T细胞(CAR-T)疗法在临床试验中表现出了针对实体恶性脑肿瘤——胶质母细胞瘤的治疗效果。据了解,胶质母细胞瘤是成人中最常见的脑部恶性肿瘤,即便是最好的治疗也收效甚微。过去利用免疫系统对抗该脑肿瘤的尝试均失败了,造成患者只能依靠传统药物、放疗和化疗,但平均生存率改善却不尽如人意。
点评:这一临床进展可能会开启实体瘤治疗的新篇章,对整个医疗行业发生长远影响。
NO.4 奔驰汽车工厂试点Apollo 机器人
最近,奔驰宣布和仿人 机器人 开发商Apptronik达成协议,双方将合作探索高科技 机器人 Apollo,主要从事搬运、装配零部件等繁重的低技能劳动。根据双方协议,奔驰将启动试点项目,在汽车制造进程中测试Apollo仿人 机器人 执行各种任务的能力。奔驰称,相比较全面升级汽车生产流水线,Apollo 机器人 的运用可以降低员工工伤情况,自动化复杂、重复和枯燥的任务,进一步释放生产力。
点评:奔驰的这一举措可能会提高生产效率,同时减少工人的劳动强度。
NO.5 ChatGPT参数规模或被破解
最近,南加州大学科研人员使用一种方法,仅花费不到1000美元就将最新版GPT-3.5-turbo模型的参数规模破解出来。据该研究报告,科研人员破解出了未公布的GPT-3.5-turbo嵌入向量维度为4096或4608。几乎所有已知的开源大模型如Llama和Mistral,在嵌入向量维度为4096时,参数规模均为7B(70亿)。南加大研究团队指出,可以推测GPT-3.5-turbo的参数规模也在7B左右。
点评:此发现可能会促使AI领域对模型透明度和安全性的进一步探讨和改进。
NO.6 Sora训练数据被疑问
最近,OpenAI CTO Murati在接受采访时对Sora训练数据支支吾吾,让Sora陷入版权争议。当记者问及Sora是用什么数据训练和是否用到YouTube、Facebook和Instagram上的视频时, Murati对此语焉不详,称不太确定,并表示不会详细透露关于使用数据的细节,但强调该公司使用的是公开可用的和经过许可的数据。此前,OpenAI已频繁陷入版权诉讼。去年年底,《纽约时报》已向OpenAI及微软提起侵犯版权诉讼,指控二者未经许可使用其数百万篇文章以训练模型。
点评:这可能影响OpenAI在AI领域的声誉,并加剧版权诉讼风险。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核对。据此操作,风险自担。