全能AI时代来临:谷歌推出新一代多模态模型Gemini 2.0

AI最新资讯5个月前发布 kzph
406 0

AI酷站排行,带你了解AI最新资讯。

北京时间12月12日,谷歌正式发布了全新升级的人工智能模型Gemini 2.0。这一新一代模型被设计为适配“智能体时代”,不仅性能大幅提升,还在多模态输入输出领域实现了突破性进展。

强化多模态能力,拓宽应用边界

Gemini 2.0的亮点在于其原生支持多模态交互的能力,能够轻松处理文本、图像、视频和音频等多种输入形式,并生成相应输出。这款模型还支持图像和多语言音频的直接输出,同时能够利用内置工具完成搜索查询、代码执行以及调用用户自定义函数等复杂任务。这一能力为其在多个领域的应用奠定了基础,从知识检索到智能生成,无所不及。

通用助理愿景的进一步实现

谷歌CEO桑达尔·皮查伊表示,Gemini 2.0的使命超越了信息的组织与理解,旨在让信息变得更具实用性。这标志着谷歌在通用人工智能助理的研发上迈出了重要一步。

开放测试与未来计划

目前,Gemini 2.0 Flash作为首发版本,已经面向开发者和部分测试用户开放,计划于2025年初进行更广泛的发布。谷歌还透露,这一新模型将逐步融入更多核心产品中,特别是在搜索和Gemini平台领域。

深度研究与空间理解的创新

与Gemini 2.0一同发布的还有全新的Deep Research功能,它能够自动生成复杂的研究规划,为用户提供高效的知识探索体验。此外,该模型的空间理解能力也大幅增强,为开发者探索多元应用场景提供了更多可能性。

Gemini 2.0的发布展示了人工智能技术发展的又一重要里程碑,为多模态交互与通用助理时代的到来铺平了道路。

© 版权声明

相关文章

暂无评论

暂无评论...