Project Jarvis 将接管网络浏览器以代表用户执行任务。
据The Information 报道,谷歌最早可能在十二月展示他们自己的大型动作模型(LAM)概念。
据悉,该项目代号为“Project Jarvis”,能够为用户执行各种任务,比如“收集研究资料、购买商品或预订航班”,这些信息来自三位对项目有直接了解的人士。
据报道,Jarvis 由未来版本的谷歌 Gemini驱动,仅能在网页浏览器上运行(专门为 Chrome 优化)。这个工具旨在帮助人们“自动化日常的网页任务”,通过截取和解释截图,然后点击按钮或输入文字。在目前的状态下,动作之间似乎需要“几秒钟”时间。
The Information警告说,谷歌计划在十二月展示 Jarvis 的计划可能会有变动。据报道,公司正在考虑向少数测试者发布 Jarvis,以寻找并帮助公司解决其中的问题。