谷歌Gemini大模型视觉支持阅读文档并解读空间信息

tamoadmin 2024年05月15日 03:31 10 0

　　新浪科技讯 5月15日凌晨消息，谷歌Gemini大模型展示升级后的视觉识别功能，例如阅读拍摄到的文档内容并进行解读，同时，视觉识别还拥有“记忆力”，能够帮助用户找到“落下的眼镜”。（罗宁）

（图片来源网络，侵删）

谷歌Gemini大模型视觉 支持阅读文档并解读空间信息