Mobile-Agent 是一个通过多种技术手段,实现了对移动设备的自动化操作和视觉感知功能。
也就是让AI可以像你一样模拟点击、滑动、输入等操作,来操控你的手机,来帮你自动完成一些列任务。
例如:
-搜索和购买商品:在购物应用中自动搜索商品、添加到购物车并完成购买。
-邮件发送:在 Gmail 中自动填写和发送邮件。
-导航:在 Google Maps 中自动进行导航操作。
-视频观看:在 YouTube 中搜索并评论特定视频。
相比Mobile-Agent:依赖单一代理执行任务。
Mobile-Agent-v2:引入了多代理协作架构,通过多个代理协同工作,实现更高效的导航和任务执行。
实验结果表明,与单代理架构的Mobile-Agent相比,Mobile-Agent-v2在任务完成率上提高了30%以上。