查看原文
其他

AI+生活|MultiOn:帮用户定机票酒店,斯坦福的两位创业者让 RPA 真正赋能用户生活

SenseAI 深思SenseAI
2024-09-06

让 AI 帮忙定机票、酒店,看似是一个非常简单的问题,但背后可能会有各种无法意料的细致问题出现。1 月 10 日 MultiOn 正式发布,它是目前第一款个人向的 AI Agent,专注个人生活场景。创始人 Div 和 Omar 来自斯坦福大学,各自在 AI Agent 方向上探索了多年。投资了 Stripe、Canva 的 General Catalyst 和亚马逊 Alexa 基金投资了 MultiOn,在产品发布后著名投资人 Jason 在测评后表示经验并给出了少有的 A+ 评分。本篇来一起看看这家公司的故事,从 MultiOn 看 AI+RPA 类产品做个人助理的常见难点和解决方案。2C 产品该怎么做?好的痛点往往来源于生活。


Sense 思考

我们尝试基于文章内容,提出更多发散性的推演和深思,欢迎交流。


面对非标准情形的挑战:AI Agents 在实际应用中要应对的场景通常远比 Demo 中复杂。这种复杂不仅会来源于任务本身或 AI 的能力限制,也可能因为用户指令的不明确、非常规的交互逻辑等外部因素而产生。在遇到特殊情况时,虽然人类介入可能是一个临时解决方案,但长期来看,需要频繁指导的 Agent 可能比用户自己执行更加费力。


- 管理用户期望以提高产品可用性:摆脱了图形界面,应用的可能性也被解除了限制,但这也使用户更难以理解产品的能力边界。从 ChatGPT 上线时的情况看,许多用户期待它“全知”,而一旦 AI 被赋予了执行任务的“手脚”,用户的期望很可能会提高到“全能”。在真正的 AGI 实现之前,是引导用户在无限的可能性中总是作出有限的选择,还是追求一种能够应对无限可能性的无限机器,可能会是产品设计的重要问题。



本篇正文共 2889 字,仔细阅读约 9 分钟

AI Native 产品分析          

27

MultiOn


1. 产品:MultiOn


2. 产品上线时间:Beta 测试中


3. 创始人: 

Div Garg:Co-founder,在开始 MultiOn 之前在斯坦福攻读 AI 的 PhD 并且专注于研究 LLM 和强化学习

Omar Shaya:Co-founder,此前曾在 Meta 负责 Instagram 个性化和排名的产品管理


4. 产品简介:

帮助人类免除执行琐事的 AI Agents


5. 发展故事:

MultiOn 已经获得了来自行业主要参与者的支持,General Catalyst 领投,Amazon Alexa Fund、Samsung Next、Maven Ventures、一些来自 OpenAI 的个人以及 Deepmind 的早期支持者参投。


01.

MultiOn 是什么


MultiON 旨在开发帮助人们处理那些“世俗琐事”的 AI Agent,比如帮助用户在快速完成旅行规划,或者为用户快速在喜欢的餐厅预订一顿年夜饭并确认最适合的时间和日期,把诸如此类“费时不费脑”的事情在 AI 的帮助下几分钟内完成。


将人类从单调重复的琐事中解放,使人类能够专注于自己喜爱的事情,享受生活,是 MultiOn 的长期愿景和使命。具体地说,MultiOn 希望为人类解锁“并行化”的能力:想象一个人类像计算机一样,同时完成多个任务的世界,将让人类抽离时间的线性束缚,释放更大的潜力。




02.

从个人助理的通用痛点看 MultiOn 的解决方案


在最近几个月中,MultiOn 测试并展示了他的几个 Demo,在 Demo 中,MultiOn 可以预定航班、在 Doordash 上订餐或在 Amazon 上买书,这些 Demo 吸引了社区巨大的反响并得到了强烈的正反馈,数万人加入了 Waitlist 来争取早日使用产品。


General Catalyst 的合伙人 Max Rimpel 说,MultiOn 的早期消费端的产品 Demo 让他畅想一个人人都想成为其中一份子的未来,在那个未来中,大量繁琐的任务都高度自动化。


MultiOn 的第一个产品是以浏览器插件的形式推出,目前仍然在 Beta 测试中没有完全开放。


用户和 MultiOn 的交互模式非常简单,只需要用自然语言的方式对 MultiOn 下达指令,MultiOn 就会开始执行并则打开一个和用户的对话框弹窗,以实时对话的方式告知用户 MultiOn 下一步将进行的操作,在执行操作时,MultiOn 有两种模式,Step-by-Step 和 Auto。在 Step-by-Step 模式下,用户需要一步步批准 MultiOn 的操作。



MultiOn 官方给出了一些用户在上手时值得尝试的 Prompt 和使用技巧,如:


- 在 Twitter 上发一条 100 字的推文:“非常激动地使用 MULTION:您的 AI Web Co-Pilot!”

- 从亚马逊订购《How Google Works》这本书(对于演示版本,MultiOn 已禁用了亚马逊上的下单按钮)

- 在 LinkedIn 上给 Divyansh Garg 发送消息并打招呼

- 使用 Doordash 在 Palo Alto 的 Melt 订购一份汉堡

- 检查 Facebook 朋友的生日并发送生日祝福消息

- 今天旧金山的天气如何?

- 为明天下午 2 点至 3 点安排一个日历会议并邀请 divyansh199@gmail.com。从 Google 日历开始。


除了上面这些给出的使用场景,我们在 MultiOn 的 Discord 中看到了更多来自真实的 Beta 测试用户用例,各种各样的 Prompt 指令,尤其是许多 Bad Cases 或许可以反映目前 AI Agents 的真实困境和 MultiOn 团队的解决思路。


场景 1,有用户会让 MultiOn 去 Chase 定一趟从 YYZ 到 SFO 的单程机票,并提醒 MultiOn 在执行时记得要在下拉菜单中选中 YYZ 和 SFO 来加以确认。然而 MultiOn 却卡在了“确认出发地和目的地,确认出发时间”这一步。



场景 2,有用户会让 MultiOn 打开一份幼儿园英语测试题并完成,MultiOn 并不能很好地完成(但是如果孩子们拥有了一个 AI Agent,这种场景绝对会发生)。



场景 3,用户会让 MultiOn 去订一个披萨,MultiOn 正确打开了达美乐的网站,却因为 “Start Your Order”事实上并不是一个按钮,无法点击进行下一步而卡住。




场景 4,用户会希望 MultiOn 能在发推特的基础上,再按照条件从网上搜索一张对应的配图附在推文里。并尝试了各种各样详细的指令,告诉 MultiOn 如何一步步地完成这件事,如第一步用 Google 搜索搜图,第二步选择搜索结果的第一个,第三步复制图片的链接,第四步将其附在推特的内容中等。然而在执行时,MultiOn 有时无法正确地选择用户指定的搜索引擎和特定的某张图片,有时无法复制图片的链接,有时则无法将链接附在推文中。MultiOn 团队解释称,这是因为 MultiOn 当时的版本仍然无法处理涉及多个窗口和链接的指令。


场景 5,有的用户会希望 MultiOn 帮助在网络超市网购特定数量的食材,然而 MultiOn 总是会在数量的选择上出现问题。


还有的用户会希望 MultiOn 帮忙优化自己的 Twitter 关注列表,甚至会把 MultiOn 当搜索用,直接向 MultiOn 提问,今天是 8 月的第几天?Meta 新发布的 AI 产品是什么?


为了解决上述问题,MultiOn 除了不断优化自己的模型架构外,还从功能上进行了两个优化,分别是 Skill 和 Teach Mode。


Skill 功能可以让用户主动为不同的网站设定特定的规则,如在某个特定网站上订机票时默认选择经济舱。Teach Mode 则可以让用户在 MultiOn 自动执行任务时,中途介入,演示给 MultiOn Agent 看。



除了上述功能上的拓展外,MultiOn 还开放了 API,来让开发者能够主动将自己的 App 和平台接入 MultiOn。


03.

背后的故事


MultiOn 由来自斯坦福的 Div Garg 和 Omar Shaya 创建,最初的灵感来自他们两人自己的痛点。



在 Div 和 Omar 相遇前,Div 和 Omar 都各自在 AI Agent 方向上探索者。Div 在斯坦福攻读 AI 的 PhD 并且专注于研究 LLM 和强化学习,主要探索能够赢得游戏比赛大奖的 AI Agent、可以用自然语言控制的机器人和自动驾驶系统。与此同时,Omar 在斯坦福商学院就读,同时思考如何结合他之前在微软和 Meta 领导 C 端 AI 产品开发的经验,推出新的 AI Agents 产品。


Div 同时从事三份高要求的工作,他在斯坦福讲课,在一家机器人创业公司工作,同时还有一个他自己的副业。在忙于这些极其需要创造力工作的同时,他免不了还要处理各种生活中乏味重复的琐事,因此他希望能存在接管这些琐事的软件。


和 Div 相似,Omar 也总是面临重复性的琐事。Omar 是一个环球旅行者,他在环球旅行中不断追逐他创业和技术的目标,他的旅途经过了叙利亚首都大马士革、柏林、伦敦再到帕罗奥图,在旅行的过程中他总是在思考技术帮助他快速在一个新的环境安顿和适应的可能性,就像家乡的家人和朋友一样提供系统性的支持。


在这样共同的愿景和相似的痛点的驱使下,Omar 和 Div 于 2022 年在斯坦福的 AI 课上相遇,并决定联手来实现这一愿景,进而改变数十亿人的生活。


2C 产品最重要的是对大众需求的洞察和把握,当你自己有某个痛点,且这个痛点足够痛,是时候慢下来琢磨琢磨。


好的痛点往往来源于生活。



参考材料


https://www.multion.ai/blog/multion-building-a-brighter-future-for-humanity-with-ai-agents

https://discord.com/channels/1105298946319995040/1109637598235852830


转载请联系公众号后台




SenseAI 已经运营了有一段时间,相信大家可以从每篇文章开头的 Sense 思考和文章内容中感受到我们希望在海量的 AI 信息中蒸馏沉淀深思考。


欢迎进入「SenseAI 深度交流群」,提供对推文内容讨论、AI 产品探索交流、线下面基和认识新朋友的机会。为保证交流质量,我们采取问卷申请制,请先扫描下面二维码填写问卷并后台回复【已填写】入群。已填写问卷但未进群的朋友,也请后台回复【已填写】入群。


欢迎关注我们


关注全球 AI 前沿,走进科技创业公司,提供产业多维深思,我们是创业者/产品/投资人,这里是最有 AI-sense 的 SenseAI。


修改于
继续滑动看下一个
深思SenseAI
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存