谷歌Gemini大模型视觉 支持阅读文档并解读空间信息

tamoadmin 10 0

  新浪科技讯 5月15日凌晨消息,谷歌Gemini大模型展示升级后的视觉识别功能,例如阅读拍摄到的文档内容并进行解读,同时,视觉识别还拥有“记忆力”,能够帮助用户找到“落下的眼镜”。(罗宁)

谷歌Gemini大模型视觉
支持阅读文档并解读空间信息
(图片来源网络,侵删)