全能AI时代来临：谷歌推出新一代多模态模型Gemini 2.0

AI最新资讯2024-12-15 18:08 kzph

930 0 0

AI酷站排行，带你了解AI最新资讯。

北京时间12月12日，谷歌正式发布了全新升级的人工智能模型Gemini 2.0。这一新一代模型被设计为适配“智能体时代”，不仅性能大幅提升，还在多模态输入输出领域实现了突破性进展。

强化多模态能力，拓宽应用边界

Gemini 2.0的亮点在于其原生支持多模态交互的能力，能够轻松处理文本、图像、视频和音频等多种输入形式，并生成相应输出。这款模型还支持图像和多语言音频的直接输出，同时能够利用内置工具完成搜索查询、代码执行以及调用用户自定义函数等复杂任务。这一能力为其在多个领域的应用奠定了基础，从知识检索到智能生成，无所不及。

通用助理愿景的进一步实现

谷歌CEO桑达尔·皮查伊表示，Gemini 2.0的使命超越了信息的组织与理解，旨在让信息变得更具实用性。这标志着谷歌在通用人工智能助理的研发上迈出了重要一步。

开放测试与未来计划

目前，Gemini 2.0 Flash作为首发版本，已经面向开发者和部分测试用户开放，计划于2025年初进行更广泛的发布。谷歌还透露，这一新模型将逐步融入更多核心产品中，特别是在搜索和Gemini平台领域。

深度研究与空间理解的创新

与Gemini 2.0一同发布的还有全新的Deep Research功能，它能够自动生成复杂的研究规划，为用户提供高效的知识探索体验。此外，该模型的空间理解能力也大幅增强，为开发者探索多元应用场景提供了更多可能性。

Gemini 2.0的发布展示了人工智能技术发展的又一重要里程碑，为多模态交互与通用助理时代的到来铺平了道路。

# AI最新资讯