
项目简介
- 发布背景:2024 年 5 月 14 日,谷歌在 I/O 大会上发布了 Project Astra,该项目是谷歌在人工智能领域的重要进展之一,旨在探索和实现普适 AI 助手的未来能力。
- 技术基础:Astra 基于谷歌的 Gemini 模型开发,利用其 2.0 版本的多模式理解能力,通过连续编码视频帧并将语音和图像输入组合到时间线中,系统可以实时解释事件并有效地将其存储在内存中。
主要功能
- 多模态交互:Astra 不仅可以处理文本和语音输入,还能实时分析图像和视频。例如,用户可以通过语音命令让 Astra 识别并记住看到的物体。
- 实时响应与记忆:Astra 能够实时响应用户的请求,并在对话过程中记住最多 10 分钟的信息,从而提供更连贯、自然的交互。
- 工具调用与整合:Astra 能够调用谷歌搜索、地图、Gmail、日历等工具,为用户提供更全面的服务。例如,它可以帮助用户查询信息、规划路线或管理日程。
- 个性化服务:Astra 能够学习并保留用户的偏好,提供个性化的回答和建议。
应用场景
- 日常生活助理:Astra 可以帮助用户完成搜索、导航、计划安排等日常任务。例如,它可以帮助用户查找维修手册、管理训练计划或饮食方案。
- 智能眼镜应用:Astra 正在扩展到智能眼镜等新型设备,通过更多形式为用户提供支持。在智能眼镜上使用 Astra 时,用户可以实时获取周围环境的信息,如路线、物体识别或情境化帮助。
- 无障碍支持:Astra 的空间感知能力可帮助视障人士识别障碍物、物品位置,甚至“读懂”环境变化,为视障人士的出行和生活提供安全保障。
- 社交助手:Astra 具备“行动智能”,能够代替用户拨打电话、进行沟通,甚至充当社交助手,满足用户的日常社交需求。
体验方式
- 加入测试项目:谷歌提供了一个可信测试者项目,用户可以申请加入以优先体验 Project Astra 的功能。
- 通过支持的设备体验:Astra 已支持部分 Android 手机应用,可以通过指定的测试应用程序安装包进行体验。
未来展望
谷歌的最终目标是将 Project Astra 打造成一款真正的通用 AI 助手,并将其功能逐步整合到 Gemini Live 中,让更多用户享受到由 AI 驱动的智慧生活体验。
© 版权声明
文章版权归作者所有,未经允许请勿转载。