xAI发布支持视觉的多模态AI模型Grok-1.5V

2024-04-13 17:08:51

金色财经报道,马斯克旗下人工智能公司xAI宣布推出首个多模态AI模型Grok-1.5V。除了强大的文本处理能力,Grok还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。 在多个领域的基准测试中,Grok-1.5V的表现均可与现有的前沿多模态模型相媲美。尤其在xAI新推出的RealWorldQA基准测试中,Grok在现实世界空间理解能力上超越了同类模型。RealWorldQA数据集包含700多张图像,旨在评估多模态模型对物理世界的基本理解能力。Grok-1.5将很快向早期测试人员和现有用户开放。
211COIN发布此信息目的在于传播更多信息,与本网站立场无关,文章内容仅供参考,不代表任何确定性判断,且不构成投资建议,请谨慎对待,风险自担。
相关快讯
05:03
Meta不会在欧盟提供新的多模态AI模型
金色财经报道,Meta在一份声明中表示,他们将在未来几个月发布一款多模态的Llama模型,但由于欧洲监管环境的不可预测性,它不会在欧盟发布。此举为Meta与欧盟监管机构之间的摊牌埋下了伏笔,也凸显出美国科技巨头越来越多选择拒绝向欧洲客户提供产品。就在上月,苹果同样表示,出于监管方面的考虑,它不会在欧洲发布Apple Intelligence功能。据悉,Meta计划在包括智能手机和Meta Ray-Ban智能眼镜在内的多种产品中采用新的多模态模型,这些模型可以在视频、音频、图像和文本之间进行推理。Meta表示,这一决定意味着欧洲公司将无法使用多模态模型,尽管这些模型是以开放许可的形式发布的。
19:12
李开复:未来的大模型将拥有多模态和执行任务的功能
金色财经报道,今日中关村论坛上,创新工场董事长李开复对AI2.0中短期做了预测 ,威力强大的大模型将彻底变革人工智能,更多训练数据会带来更高的威力,但同时,高质量数据非常重要,未来的大模型将拥有多模态的功能,和执行任务的功能。AI2.0将成为许多人工智能大型挑战的第一推手,从对话助手和人工智能伴侣(~1年)到元宇宙(5年以上)。
13:05
马斯克:xAI的AI模型GROK系统刚刚发布
金色财经报道,马斯克称,xAI的AI模型GROK系统刚刚发布。
18:26
马斯克:xAI明天将向选定的群体发布其第一个AI模型
金色财经报道,马斯克:xAI明天将向选定的群体发布其第一个AI模型。在某些重要方面,它是目前存在的最好的(模型)。
20:07
Nvidia发布用于创建安全AI模型的工具
金色财经报道,Nvidia 推出 NeMo Guardrails 工具,以帮助开发人员确保生成 AI 的准确性、相关性和安全性。NeMo Guardrails 允许开发人员对其语言模型 (LLM) 应用三种不同类型的限制。据 Nvidia 称,NeMo Guardrails 适用于所有语言模型,包括 ChatGPT。该公司还声称几乎所有软件开发人员都可以使用该工具。
21:29
Elon Musk:xAI将与微软、谷歌、OpenAI竞争;将使用公共数据进行AI模型训练
金色财经报道,,Elon Musk表示,他的新公司肯定会与OpenAI竞争,在AGI领域提供比微软、谷歌、OpenAI产品更有竞争力的替代方案。xAI仍处于萌芽阶段(embryonic),要赶上OpenAI和谷歌还需要时间。同时,在AI模型训练方面,他们会使用公共数据而非私人数据。 xAI计划构建一个超级智能人工智能,帮助解决复杂的科学和数学问题,并“理解”宇宙。OpenAI最初的目标是开源和非营利,但因为“命运喜欢讽刺”,OpenAI是闭源的,“对利润很贪婪”。就AI算力方面,他们同样需要算力支持,但或许会略少于其他公司。
Copyright © 2018-2022 211COIN版权所有.