“探索”还是“利用”?这是我们每天面临的隐藏决策

最重要的一点是你要将培养更大的探索空间当作是自己的目标所在。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:我们在生活中总是在跟不同的选项打交道,是应该继续当前的工作,还是扩展到新的工作领域?是继续从事相同类型的业务项目,还是尝试不同类型?是去你喜欢的度假胜地游玩,还是去探索一个新场所?其实,不同的选项就体现了不同的决策策略,一个是“利用”(exploit),一个是“探索”(explore)。现实生活之中是选择探索还是选择利用,这一问题非常普遍,但解决方案未知,那我们究竟应该怎么做呢?希望本文能带给你启发。原文作者Scott H. Young,文章标题“Explore or Exploit: The Hidden Decision that Guides Your Life”。

“探索”还是“利用”?这是我们每天面临的隐藏决策

有一个有趣的事实:当你多次去往同一家餐厅用餐时,对你来说菜单上最好的菜品往往是你在那首次用餐时点过的菜。为什么会这样说?因为如果你生活在一个大城市之中,并且有足够多的就餐地点选择,那你应该去过很多地方用餐。如果一家餐厅的饭菜一般,那你可能就不会再去那里,而如果你在某家餐厅享用了一顿美餐,那你很有可能会选择经常去那里用餐。

每当你走进一家新餐厅用餐时,你都会发现有些菜很棒,而有些菜则很一般。如果你认为自己这顿饭吃的不错,并决定再次光临这家餐厅,那你所点的菜大多数都是之前你品尝过并觉得不错的菜品。

在餐厅吃什么只是一个很简单的决定,但却能够体现出我们每天在生活中用以做决定的策略:是探索还是充分利用已有信息(explore/exploit)。

探索?充分利用?

我们每次去一家餐厅用餐时,总会面临这样一个选择:是点那些你之前品尝过、知道肯定不错的菜品(充分利用),还是尝试其他可能会更好的菜品(探索)?

就像我在文章开篇所说的那样,我认为按照常规逻辑来看,大多数人都倾向于选择之前在这家餐厅用餐时喜欢的那道菜。当然,这并不是说我们就不应该尝试新的菜品,只是根据以往用餐经历所选择的菜往往比随机选择的菜口感更好。

我们虽是以餐厅点菜为例来说明在做决定的时候,是选择探索还是充分利用已知信息的策略,但其实这一策略可以应用到我们日常生活中的方方面面:

  • 我们是应该继续当前的工作,还是扩展到新的工作领域?

  • 我们是继续从事相同类型的业务项目,还是尝试不同类型的项目?

  • 是与你从高中就认识的那个人约会,还是去认识新的人?

  • 是去你喜欢的度假胜地游玩,还是去探索一个具有异国情调的新场所?

  • 是继续阅读当前这本书,还是去读一本新书?

即便是像下班开车回家是走常规路线还是绕道而行这样的小事也是探索还是充分利用决策策略的一个体现。

如何选择?

如果能有一个简单的规则来帮助我们决定何时采取探索策略,何时采用充分利用策略,那就太好了。但事实证明,到目前为止并没有这样一个具有普适性的解决方案出现,并且即便在未来可能也并不存在这样的解决方案。多臂老虎机便是探索- 利用困境的一个典型代表,每一个拉杆的中奖几率不同,如何在有限的次数内,来让自己获得最大的收益呢?是坚持在你认为中奖概率高的拉杆上投入更多的次数,还是去探索新的拉杆?如何分配,这就是探索与利用的决策问题。

现实生活之中是选择探索还是选择利用,这一问题非常普遍,但解决方案未知,那我们究竟应该怎么做呢?

一种选择就是简单地根据已有给定的信息(利用已有信息)做出“最佳”决策,但同时也添加一些随机性元素,这样也就同时做了不同的尝试(探索)。例如,三分之二的时间点你喜欢的菜品,另外三分之一的时间随机挑选一个新的菜品。

另外一种选择就是在你有更多时间的时候有意选择探索。实验证明,在人们认为他们有更多的时间可以容忍他们试错的情况下,他们就会选择探索更多。而如果时间有限,他们就更有可能选择安全、已经尝试过并得到过证实的选项。举例说明,如果你在接下来几年的时间里都可以去这家餐厅吃饭,那你可能就会尝遍这家店所有的菜式。但如果你只是出差或旅游经过这样一个城市,逗留一周的时间,那你就更有可能采取利用已有信息的决策方式。

第三种选择就是对于我们个人经验以外的信息进行整合,来衡量我们当下的选择好坏。例如,你这次点的披萨口感一般,而你朋友对于自己点的意大利面却赞不绝口,那下次你很有可能就会选择尝试意大利面。

年龄与探索的关系

时间在探索/利用这两大决策策略的选择中起到了至关重要的作用。如果你认为自己还有很多时间可以去接受所遇到的一切,那你会更愿意去尝试新事物。但如果时间有限,你就会坚持那个自己所了解的选项。

也就是说,决策策略也是随着我们的年龄而发生变化。儿童是完全的探索型人群,他们会去尝试自己并不擅长的事情,会很容易就结交到新朋友,会带着好奇心去接触新事物、应对新状况。

但随着年龄的增长,我们的生活会更多地围绕已知的选择去进行。我们会更多地与家人和老朋友在一起,而不再那么容易去结交新朋友。我们会坚持现有的职业选择和爱好,而不再轻易去做更多新的尝试。值得说明的一点是,对于预期时间长度的评估更多的是与你认为自己有多年轻/年长有关,而不是单纯受你的实际年龄或身体状况所限。

“探索”还是“利用”?这是我们每天面临的隐藏决策

局部最高峰陷阱

局部最高峰说的通俗一点也就是大山旁边的一个小土丘。当你达到小土丘的顶部之后,如果你想让自己达到更高的水平就必须先从这座土丘下来,然后再攀登更高的山峰。选择一直待在土丘顶部,你就会错过更高的峰顶美景。

未能实现充分地探索就会导致这种局部最高峰陷阱的出现。我之前认识一名医科大学的学生,她很有天分,本来可以说是前途不可限量。但从刚上大学开始,她就开始做调酒工作兼职,这让她赚了很多钱。后来,兼顾两者就变得越来越困难,她的学业成绩受到了影响,并最终导致辍学。

让自己过早接触具有极高价值的机会,这可能会对我们的大脑产生欺骗性。我们看到这样一个比当下其他选择都好很多的机会出现,就很容易过早地选择利用,而所付出的代价便是牺牲了更好的长期职业发展。

也就是说在我们的生活中,很多情况下,充分利用这一决策模式很重要。我花了很多年的时间才能从写作这一技能中赚到足够多的钱,从而可以让我全职从事写作这一工作。但如果我还是一名学生,那赚钱的选择其实对我不应该有很大的吸引力,因为那不是我的“主业”。我另外一个朋友在写作生涯有了一个成功的开端,但与此同时他的全职工作是合同制程序员,并且这份工作报酬丰厚,一年之后,他还是毅然决然辞掉了这份工作。

简而言之,我们应该更加谨慎地对这种早期的“成功”或“失败”做出判断和权衡。有时候,早期的成功很有可能是一个陷阱,会让你错失更好的长期发展机会,将你的期望束缚在一个局部的峰值标准之中。

野心与探索的关系

乐于接受新体验,对新体验持开放心态显然是与乐于探索这一特质具有很强的相关性。有些人的性格特质会促使他们去进行更多地探索,而更外一些人的性格特点决定了他们会选择相对更加安全的利用策略。

但是,除此之外,我认为野心在这其中也扮演了一个重要的角色。野心是对自己可能实现的潜力的评估,也是对于自己会实现这些潜力的一种信心的展示。更有野心的人会有更多的可能性去探索更多,他们会因此而拒绝一些看上去很优秀的工作和赚钱机会,因为他们对于良好回报的期望基准值更高。如果我的朋友当初能够不只是将眼光局限在(相对)高收入的调酒收入上,如果她能够跨过这个“局部最高峰陷阱”,那她很有可能会完成医学院的所有学业。

我记得自己在最初即便是入不敷出的时候,也依然拒绝了一些自由撰稿的兼职和工作机会。虽然这些工作机会可以带给我不错的报酬,比我当时在做的事情所带来的收入要高得多,但我明确知道我想做的是创建起自己的业务,而不是去做别人的业务。这个决定让我在一段时间内付出了一定的代价,但它却让我有足够的空间去从事那些可以最终帮助我实现成功的项目。

在有些情况下,探索这一决定也并不是由你所认为应该获得更高回报的这一特定野心所促成的,而是由于你对于世俗眼中的回报敏感度较低。以我为例,迄今为止,对我职业生涯影响最大的项目就是我参加过的一个名叫“MIT Challenge”( 挑战的目标是在一年之内学习 MIT 计算机系本科学生四年的课程)的挑战。

但是在当时,我根本就没想过要从这一挑战中获利,当时我的一位好朋友还强烈劝阻我,让我不要参加,因为他觉得我有更好的机会可以选择。也就是说,我当时做出参加这一挑战的决定并不是由我对它所带来的预期回报期望所决定,而只是因为相比当时我所可以选择的其他事情来说,这个挑战赛是一个更大的未知数。

促成探索决策

在此之前,我曾提到时间在探索/利用决策的选择中起着非常重要的作用。所谓时间并不仅仅是指你生命中所剩下的生存时间,而且是指你认为自己需要多快获得回报才能继续下去的时间值。

海洛因依赖者就是一个极端的利用型决策案例,一个已知的选项(吸食海洛因)对于他们而言回报价值很高,他们当下就需要来一剂。这些上瘾者通常不会去选择具有未来不确定回报的其它选项。

抛开毒品不谈,我们的生活环境其实也决定了你的主观时间长度感,从而决定了你是采取探索还是利用型决策。如果你感到安全、舒适并且自信,那么你会更愿意辞掉当下工作,尝试一个新的职业,或是改变大学所读专业,或是尝试与不同的人约会,或是尝试一个可能会以失败告终的新业务。

进行更多的探索并不一定总是能为我们带来更好的结果,但具有更多的探索空间却会帮助我们实现更好的结果。我们对于何时该探索、何时该利用的直觉往往还不错,或者说比正式的分析之后决策的结果还要好一些。但是,如果决定具有强迫性,比如要应付得了当下就要求你牺牲尝试任何新事物的机会,那我们只会做出更糟糕的决定。

“探索”还是“利用”?这是我们每天面临的隐藏决策

探索空间

我认为,从心理层面来讲,我们至少有几种方式可以为自己创建更多的探索空间,可以让我们在生活中进行更多的探索:

  • 实现财务安全。这就意味着你要做到量入为出,避免铺张浪费、入不敷出,做到定期储蓄(包括应急基金储蓄)。

  • 避免忙碌状态。定期对生活进行“除杂”,对没那么重要的人和事说不,清除积累的垃圾和负担,因为疲倦的人通常不会进行很多的探索。

  • 留出专门的时间来接触新事物。如果你已有的日程安排都无法替换,那就在日程表中安排一个新的空白时间段。在这个时间段里,你可以去结识新朋友、学习新事物或是去新的地方。

  • 维系稳定的友谊和亲密关系。人生在世,需要的绝不仅仅只是金钱,孤单的处境或者是不健康的人际关系会导致我们做出与长期利益不符的短期决策。

  • 降低物质欲望。我认识有月入六位数但仍然感觉陷入困境的人,而与此同时也有在贫困线上下徘徊但拥有更多探索空间的人。我并不是说钱不重要,只是不要让钱成为你的束缚。

我认为,拥有更多的探索空间并不意味着探索就是必要。如果你找到了一位很好的伴侣,那你不会因为自己拥有离婚的空间就去离婚。相反,它可以促使你更好地做出最佳决策,而不是身陷在糟糕的选择之间。

培养这种空间并非易事。如果你感觉自己身处逼仄的探索空间之中,那并不是一两句话就能为你打开新的世界大门。你需要一点一点做出小的改变,逐渐扩大自己的探索空间,改善自己的财务状况、健康状况和时间管理状况,这样那些让你感到束缚的限制性因素会逐渐变得松弛,并最终消失。

无论如何,我认为最重要的一点是你要将培养更大的探索空间当作是自己的目标所在。对于很多人来说,生活的目标就是压缩当下的每一点空间,每一美元都安排清楚,每一秒钟都计划到位。但从探索空间来看,这种追求优化的态度实际上可能变成了一个弱点,因为它会阻止你去接触新的机会,而这些机会可能比你当下所看到的、所追求的都要好。

译者:aiko