多巴胺、贝叶斯与伯努利的谬误:我们如何被'可能性'欺骗

最近读完了《贪婪的多巴胺》,这本书从脑科学视角解释了人类行为背后的驱动力。而在阅读过程中,我不断联想到之前在《伯努利的谬误》中提到的贝叶斯推理,以及将认知科学和人工智能结合起来的《Bayesian Models of Cognition》。这三本书看似毫不相干——一本是讲多巴胺在大脑中的工作原理(为了面向大众读者,做了很多简化,语言比较通俗易懂)以及多巴胺跟社会现象的种种关系,一本讲概率统计,频率学派和贝叶斯学派的两三百年之争,以及如何利用贝叶斯定理去构建模型,去模拟人类的推理过程——但我发现它们指向了同一个深刻的问题:人类大脑的运转,一方面在面对很多的选择的时候,需要使用基于概率的推理框架来做因果推理;另一方面,还需要有一套感觉系统,该系统将视觉,听觉和触觉等原始信号综合起来,结合时间和空间信息,变为了感觉,感觉再经过某种结构,固化为了知觉或者叫经验,从输出动作的角度来看,知觉应该是上面的第一方面的部分,类似一个打分系统,这一部分更像一个行动系统,行动系统根据打分系统的输出去采取行动。因果推理会在不断学习过程中做抽象,学习到的知识会用于打分系统,最终都是服务于行动的输出。在这里,不得不提到杨立昆的世界模型,他提出的 JEPA(Joint Embedding Predictive Architecture)模型,正是试图还原大脑做推理和决策的机制,提出一种具有自主智能的模型结构。这个构想非常类似于人脑的工作流程,可以为机器智能提供非常好的架构指导。 多巴胺:一个"可能性"的信徒 《贪婪的多巴胺》最核心的观点是:多巴胺并非"快乐分子",而是"欲望分子"。它不负责让你享受当下,而是驱使你追逐未来。它最大的作用是将我们对未来的的想象这种偏图景化的东西,转化为去寻找或者实现的动力。 澳大利亚神经科学家约翰·佩蒂格鲁(John Douglas Pettigrew)发现了一个关键事实:大脑将外部世界分为两个独立的区域来管理——“近体的"和"远体的”。 “近体”体现在当下的体验或者触手可及的空间,“远体”体现在未来的可能性或者伸手无法到达的空间。 多巴胺专注于远体空间,专注于"还没有到手的东西"。 多巴胺有一个非常特殊的职责:最大化利用未来的资源,追求更好的事物。 这意味着什么?多巴胺本质上是在做一件事:对未来的可能性下注。 它不关心你已经拥有的,只关心你可能获得的。这就是为什么赌博让人上瘾,为什么热恋会让人疯狂,为什么艺术家永远不会对已完成的作品满足。 但问题在于,大脑对"可能性"的评估,往往是有偏差的。或者说,对未来可能性的评估,并不是多巴胺要做的事情,专门有系统负责评估,本书并没有提及该系统的细节。 多巴胺产生的原因:奖赏预测误差与TD误差 研究这个现象的科学家把这种从新奇事物中得到的快感命名为“奖赏预测误差”。我们每时每刻都在预测将要发生的事,从什么时候可以下班,到在自动取款机上看到卡里有多少余额。实际发生的事好于我们的预期,就表明我们对未来的预言存在误差:可能我们可以提前下班了,或者查看余额时发现比预期多了100元。正是这种让人快乐的误差触发多巴胺行动起来。这种快乐不是源于额外的时间或钱本身,而是预期之外的好消息带来的兴奋感。 这恰恰就是强化学习中时序差分误差(TD Error)的定义: $$\delta_t = r_t + \gamma V(s_{t+1}) - V(s_t)$$ 其中 $V(s_t)$ 是大脑对当前状态的预期价值,$r_t + \gamma V(s_{t+1})$ 被看作是实际获得的奖励加上对未来价值的估计($V(s_{t+1})$其实不一定准确)。当实际情况好于预期,$\delta_t > 0$,多巴胺爆发——这与神经科学实验中观察到的多巴胺神经元放电模式完全一致。如果某种信号用来指导行动的话,那就是更一般的形式,强化学习中的优势函数 $A(s,a) = Q(s,a) - V(s)$ 度量的是某个具体行动比"平均表现"好多少,它几乎是最低方差的策略梯度估计。多巴胺系统在做的事情,本质上是计算优势函数——将预期与现实的差距转化为行动的动力。 我自己的观点: 大脑中有一个区域负责预测未来的状态,这个区域会根据当前的状态、你采取的行动和过去的经验,生成一个对未来的预测,这个预测不仅仅是将来要发生的状态,还需要考虑达到该状态所可能采取的行动。另外一个区域负责对这个预测到的未来状态、行动对打分或者是做评估,在若干个评估结果中,选择出一个最优的结果,并且大脑认为该结果非常合理可行,这个时候,当该结果的评估价值远大于历史的平均水平时,多巴胺开始产生,并且急迫地驱动你去按照该行动去实现那个预期的未来。 伯努利的谬误:混淆似然与后验 在《伯努利的谬误》中,作者 Aubrey Clayton 指出了一个困扰了统计学三百年的根本错误,忽略基础概率或者叫做先验概率而直接使用基于频率的统计方法计算一件事情发生的可能性,是片面的,在很多行业当中,我们以为的基于频率的统计方法的客观性,其实会导致严重的错误。往往会造成的后果是:将似然概率(Likelihood)等同于后验概率(Posterior)。 而事实上,一件事情发生的可能性,本质上就是主观判断+客观数据共同决定的,只要提出可能性,这件事情就带进来主观色彩了,因为不同的人,给出的猜想集合本身就不一致,在数据到来之前,没办法确定谁的猜想集合是对的,谁的猜想是错的。 用数学语言来说,伯努利错误地认为: $$P(F=f \mid S=s) \approx P(S \text{ is close to } f \mid F=f)$$ ...

2026年4月3日 · 91 分钟 · Yang

《园丁与木匠》

关于作者:艾莉森·高普尼克(Alison Gopnik)是美国加州大学伯克利分校儿童发展心理学教授,也是该领域全世界最顶尖的学者之一。她不仅是一位实验心理学家,也是一位哲学家,一生致力于以跨学科的视角研究儿童的认知与成长。她养育了三个儿子,现有三个不到5岁的孙辈。 本书的框架 这本书我觉得最大的特点是将理论研究和实践结合起来,给父母一个很清晰的框架,在这个框架下,指导父母如何去爱孩子,如何去陪伴和引导孩子。在这个过程中,其实本质是提升父母的认知,为孩子的成长提供一个好的“花园”,而不是按照自己的想法去把孩子雕刻成一个心中的模样。作者在术中并没有特别细节地描述育儿方面需要采取的措施,而是结合儿童心理学,哲学,以及认知心理学的理论和最新的研究成果,将时间线拉长,到达原始人类,智人时候的生产生活,结合婴幼儿的大脑特点,分析了婴幼儿的行为产生的生物学原因以及从进化角度得出的原始动机。 脉络 本书首先强调了尽管成年人–包括了父母,祖父母等等参与照顾幼儿的所有人,可能会觉得照看幼儿是一件非常令人痛苦的事情,但是在每一个细节当中,照看者会感受到孩子的爱,以及孩子也会感受到照看者的爱和关怀,这种亲密关系是非常伟大和无私的,也是崇高的,在道德上深刻,在情感上强烈。所以对于照看孩子,作为成年人要把它当作一种修行,主动地去承担各种各样的非常琐碎的事情,因为这件事情本身就非常伟大。所以,作者最开始其实是要大家引起重视,不能掉以轻心。 然后,作者给出了本书的中心思想: 确切地说,爱孩子的意义就是为那些无助的幼儿提供一个丰富、稳定、安全的环境,这个环境充满变化、创新和新奇的元素,可供他们无限发展。无论是从生物学和进化的角度来看,还是从个人和政治的角度来看,都是如此。爱孩子并不是给他们一个目的地,而是为他们的旅程提供给养。 而后,更加具体地讲,作者提出: 好父母不一定会把孩子变成聪明、快乐或成功的成年人,但可以打造出强健、具有高适应性和韧性的新一代人,以更好地应对未来将要面临的不可避免、不可预测的变化。 然后,作者借用孩子大脑的生物学研究成果: 发育中的大脑就可以说明这一点。稚嫩的大脑比成熟的大脑更加可塑,它们会生成更多的神经连接,也更加灵活。事实上,一岁孩子大脑中的神经元连接数目是我们成人大脑的两倍。不止于此,年轻的大脑还拥有更多连接的可能。这些连接很弱,已有的连接可以根据新的经历更迅速、更容易地发生改变。因此,年轻的大脑可以毫不费力地随着环境的变化而改变。在成长过程中,21常用的神经连接会变得灵活高效,并能横跨更远的距离。不用的神经连接会被“修剪”掉,从而消失。成熟大脑的灵活性低,神经连接从曲折狭窄的小径变成了笔直的长途信息高速公路。成人的大脑仍能改变,但大多发生在压力之下,并且要付出努力和注意力。总之,年轻的大脑天生就要探索,成熟的大脑则负责运用。 来说明,孩子心智的健康发展,一定不是按照父母的意愿,持续地接受某些特定的信息来促进大脑对应的神经元产生高效连接,而是需要在漫长的幼儿阶段,持续不断地让孩子接触大范围的内容,从体育到植物,从动物到乐器,从新闻到工程学等等。让孩子接受不同的概念,领域及其之间的关联就是优秀的内容输入,用于神经元的连接提供丰富的素材。我的一个好友推荐的方法就是带着孩子跟不同领域的专家聊天,让孩子接受从未了解的概念甚至它们之间的逻辑关系,让孩子建立丰富的概念,当将来再次遇到这些概念的时候,就不会因为是第一次而感到恐惧和陌生,反而会激发他们的探索欲望,让孩子发自内心地主动寻求概念背后的基本逻辑。 接着作者作为一位母亲和祖母,从自己的亲身体会分析: 大约20年前,我写下了第一本书。在某一章的开头,我描绘了怀孕生子给我带来的如潮水般势不可当的经历:9个月的生理变化,与另一个生命共用身体的奇妙感受,以及生产时席卷一切如跑马拉松般的努力。我能感受到婴儿在产道中移动,这感受怪异又真实;我能感到大脑中涌动的狂喜,以及它释放出的种种化学物质。最终,我怀抱着温暖的小生命,他紧贴着我的身体。似乎,这种种唯有母亲才能体验的生理、情感与化学变化,塑造了舐犊之情。 毋庸置疑,母亲有照顾幼儿的原始冲动。有生理学和心理学的原因,显而易见。爱人双方,尤其是父亲,因为深爱着对方,所以也深爱着双方共同的孩子,祖父母因为爱着自己的孩子,而且忙碌的现代生活父母不能时时刻刻在幼儿身旁,祖父母将自己的爱延续到了孙辈。作者提到,所有这些人的爱,是对持续照看幼儿的基本保障,这些爱很难随着时间和环境而产生巨大变化,是发自内心深处并且是源源不断的。 接着,作者从边看边学,边听边学,边玩边学和边练边学四个维度分析了如何结合孩子的大脑特点去为他们提供成长的养料和提供稳定环境。在这里我列举一些我认为比较重要的内容。 孩子作为一张白纸,在出生之后是缺乏因果关系的逻辑分析能力的,那么,他们是如何学习到这一技能的呢? 有两种方法可以学习因果知识:一种是通过反复试错,另一种是观察其他人或事件。反复试错是所有动物学习的最基本方式,即使是最简单的生物,例如苍蝇、鼻涕虫和蜗牛,也会重复一些可以带来奖励的行为。试错的方式可以测试你的行为是如何导致事件发生的,并学习如何让新的事件发生。 update::2025-6-05 在写[[AI - RL Policy Gradient]]的时候,找到了这篇文章[intuitive understanding of Policy Gradient](RL — Policy Gradient Explained. Policy Gradient Methods (PG) are… | by Jonathan Hui | Medium) 孩子看到了周围环境的状态$S_t$。 孩子采取了行动$u_t$,根据他大脑中的instinct,我觉得是知觉,具体来说就是Agent当中的$\pi(u|s)$,采取的$u$应该是能够最大化一个价值函数$J$,这个函数和当前的状态$s$有紧密的关系。 行动之后,环境变化,得到新的状态$S_{t+1}$以及得到奖励$r_{t+1}$ 进一步地,采取下一个行动,该行动的选择是依据新的环境状态 因为孩子有漫长的学习期,并不会有太多的生存压力,所以要鼓励孩子尽量用“探索式”的学习方法来学习: 孩子和成人之间的这种差异反映了我之前谈到的关于“探索式”与“运用式”学习方法的对比。在“运用式”学习中,我们尝试快速找到最有可能当下就能解决问题的方案;而在“探索式”学习中,即使不能马上找到答案,我们也会尝试很多的可能性,甚至包括不太可能奏效的那些。如果我们想要在复杂的世界中茁壮成长,这两种学习方式都需要。 孩子不仅能够有选择性地吸收表面的知识,也能够看到隐藏在知识之下的可信度,或者说是一种程度,这种程度表示的是有多少可信任的成分。所以就像很多工程上采用的原理,例如卡尔曼滤波器,在获取到测量状态之后,需要根据可信度,加权到预测当中形成统计学意义上的最优值。当然,孩子的学习过程要比滤波复杂得多,是更高维度,更多层次的一种取舍行为。 随着孩子年龄的增长,他们开始对与他人交谈时的更多细微之处变得敏感。孩子可以感知到别人在说话时有多自信。如果两个人提出相互争论的观点,那么即使是3岁的孩子也会选择相信那位说话时更有自信的人。如果4岁的孩子听到一个有知识的人提出什么主张,相比那些无知的人,他们更有可能相信这位有知识的人。而5岁的孩子则会考虑到更具体的知识分类,他们更可能相信医生对医学的评价,或者工程师对机器的评价。 孩子有一种本能,就是努力归纳出来一种适用于可以解释很多现象的共同逻辑链条,也就是普遍规律。我的理解是在这个过程中,驱动孩子做这一件事情的原始动力是为了在将来的生活当中,在遇到问题的时候,能够快速产生解决问题的方法,而不是在遇到问题的时候才开始做多种尝试–可以说是惰性使然。 孩子不仅需要更多关于这个世界的信息,他们还需要理解因果关系,才可以从一个更深入、更广泛的角度理解这个世界,也就是说,这些信息可以促进他们未来学到更多的知识。 作者提到本质主义帮助孩子抽象他们所见到听到感受到的内容,可以让孩子更加深刻地理解他身边的世界: 孩子可以从语言的细微特征中学习。被心理学家称为本质主义的发展就是一个非常好的例子。苏珊·格尔曼3730年来一直在研究孩子的本质主义,并取得了令人瞩目的成就。所有有心智的生物把这个世界的事物区分成了不同的类别。而“本质主义”这个术语是心理学家用来描述我们倾向于认为这些类别是深刻的、先天的、永久的,这些都来自这个世界,而不是来自我们的心智。 孩子大脑中永远有一个猜测:从统计学的角度来看,猜测是一个或者多个随机变量的概率分布,当我们有了新的证据,就会利用贝叶斯理论去计算在当前证据下,猜测的新的分布,这是一个条件概率分布,也叫做后验分布。也是我们心中认为最合理的结果。作者做的科学研究应该会涉及到这方面的数学基础。 现在假设我们做一个新的实验或者进行一项新的观察。新的证据可能会让我们重新考量那个最好的猜测。也许有一个不同的假设能更好地解释新的证据。如果另一个假设成立,会发生什么呢?如果新的假设能更好地解释所有的证据,包括旧的和新的,那我们可能会认为它更有可能是真的。它将取代我们以前暂定为“真理”的想法。 作者提到了探索式学习和掌握式学习: 这两种学习方式似乎涉及不同的底层机制,甚至不同的大脑区域。孩子发展掌握式学习的时间要晚于探索式学习。婴儿和最聪明的成年人一样擅长探索式学习,甚至婴儿可以做得更好。但随着年龄的增长,人类似乎越来越擅长掌握式学习。 成年人和幼儿的学习过程,在生物学上面是有差异的: 我需要花很大的努力去适应让我无所适从的互联网。这是因为对成年人来说,学习一项新技术需要认真、细心、有意识的学习过程。而这种专注是成年人非常珍贵的资源。甚至在神经元的层面上也是如此。当我们集中注意力的时候,大脑中负责设定目标计划的前额叶皮层会释放胆碱类的神经递质。但这些能促使我们学习的化学物质只能传递到大脑的某些特定部位。前额叶皮层也会释放抑制性的化学物质,从而阻止大脑其他部位发生改变。因此成年人在学习一项新技术的时候,大脑只能进行一点点细微的改变。孩子大脑14的注意力和学习能力的运作方式则完全不同于成人。年轻的动物和人类有着分布更广的胆碱类神经递质,这让他们不需要专注和计划就能学习了。一切新鲜的事物,无论是多么令人惊讶的,还是看似无用的或杂乱无章的,年轻的大脑都能让孩子轻松地掌握这些庞杂的信息。 收获 当父母有意识地对孩子进行说教,可能不会对孩子产生多少影响,孩子此时并不能很好地吸收父母输出的观点或者是知识内容,相反地,孩子反而擅长通过父母微妙的肢体语言,说话的声音语调的变化,敏感地察觉出蕴含在里面的有效信息,从而吸收到孩子的大脑。 作者在接受采访的时候提到一个点:西方的哲学传统当中,很少有孩子的身影,因为很多的西方哲学家都是单身的男士,他们专心于和自然、社会进行沟通,很少有机会接触孩子,更不用说从孩子身上获取到什么哲学方面的灵感了。 “以人为鉴,可以明得失;以史为鉴,可以知兴替”,还需要再加一句,以儿为鉴,可以明己。当我们观察幼儿的时候,就是在提升对自我的认知:某种程度上,他们就是曾经的我们,当我们试图让自己“傻”得更像一张白纸的时候,可能我们会发现,其实那个我就是孩子。 当父母专注于如何提供幼儿一个安全丰富的环境的时候,往往父母就会从行动上提升自己本身的能力和认知水平,去争取更高的社会地位以及收入来使自己有能力提供如上的环境。 关于作者的学术研究 结合之前的卡尔曼滤波的文章,卡尔曼滤波器学习笔记(一):概率论和贝叶斯滤波 在儿童学习过程中,贝叶斯学习被作者重点提及。 ...

2024年9月6日 · 53 分钟 · Yang

《置身事内:中国政府与经济发展》

我作为一个经济和政府运作逻辑的小白,最近看到了一本很多人推荐的书《置身事内:中国政府与经济发展》。希望以此为切入点,了解中国政府在中国经济发展中发挥了什么作用。 我很喜欢两部国产电视剧,一部是《大明王朝1566》,一部是《走向共和》。这两部剧有个共同点:开场第一集中,那些历史上赫赫有名的大人物们,出场都没有半点慷慨激昂或阴险狡诈的样子,反倒都在做世上最乏味的事——算账。大明朝的阁老们在算国库的亏空和来年的预算,李鸿章、慈禧和光绪则在为建海军和修颐和园的费用伤脑筋。然而算着算着,观众就看到了刀光剑影,原来所有的政见冲突和人事谋略,都隐在这一两一两银子的账目之中。要真正理解政府行为,必然要了解财税。道理很朴素:办事要花钱,如果没钱,话说得再好听也难以落实。要想把握政府的真实意图和动向,不能光读文件,还要看政府资金的流向和数量,所以财政从来不是一个纯粹的经济问题。党的十八届三中全会通过了《中共中央关于全面深化改革若干重大问题的决定》,明确了财政的定位和功能:“财政是国家治理的基础和重要支柱,科学的财税体制是优化资源配置、维护市场统一、促进社会公平、实现国家长治久安的制度保障。” 政府想要集中力量办大事,必须手里有足够的资金来支持,制度再完善,武力再强大,没钱,就会崩溃。结合《显微镜下的大明》这本书,明朝建国初期,首先做的事情就是把全国的人口和当时最重要的生产资料–土地的情况搞清楚,然后根据这些资料制定对应的制度来收取赋税。中央对地方的实际情况了解得越清楚,政策制定和执行才可以越畅通,明末的乱世,就是中央对地方的信息不对称,很多财富都暗藏在地方豪强手里,国家知道的财富乘以日益提高的税收百分比并不足以支撑国家的正常运转,然后就没有然后了。 所以,本书研究的,或者是揭示出来的,是我们身处时代下,每天都在发生事情的背后逻辑,搞清楚这个逻辑对每一个人,都是有好处的。 财税与政府行为 分税制改革 1994年的分税制改革把税收分为三类:中央税(如关税)、地方税(如营业税)、共享税(如增值税)。同时分设国税、地税两套机构,与地方财政部门脱钩,省以下税务机关以垂直管理为主,由上级税务机构负责管理人员和工资。这种设置可以减少地方政府对税收的干扰,保障中央税收收入,但缺点也很明显:两套机构导致税务系统人员激增,提高了税收征管成本,而且企业需要应付两套人马和审查,纳税成本也高。2018年,分立了24年的国税与地税再次开始合并 经过分税制改革,中央对地方的税收收入大幅度提高,但是明显对地方的税收入是有很大影响的,所以地方的阻力很大。国家通过增值税、企业所得税等税种,大大提高了中央的预算收入占比GDP的比例,从原来的22%变为了55%并且之后稳定维持在这一水平。具有深远的意义:大大增强了中央政府的宏观调控能力,也保证了集中力量办大事的能力,例如过气改革和国防现代化建设,以及应对外部的金融危机和内部的重大冲击,例如汶川地震和1997,2008年的金融危机。 政府投融资与债务 土地资本化 再穷的国家也有土地,土地本身并不值钱,值钱的是土地上面的经济活动。 土地资本化的魔力,在于可以挣脱物理属性,在抽象的意义上交易承诺和希望,将过去的储蓄、现在的收入、未来的前途,统统汇聚和封存在一小片土地上,使其价值暴增。由此产生的能量不亚于科技进步,支撑起了工业化和城市化的巨大投资。经济发展的奥秘之一,正是把有形资产转变成为这种抽象资本,从而聚合跨越空间和时间的资源。 作者以成都的宽窄巷子为例,讲了成都文旅集团作为典型的政府融资平台类公司,持有从政府拿到的土地使用权,可以从政府获得各类补贴,而且有政府作为背景,可以融资。 虽然通过土地金融可以很快地搞投资建设,但是需要大量的资金,分税制改革后,地方政府的税收进一步减少,所以,如何为政府搞到钱,就是摆在眼前的一个最大问题。从而,国家开发银行和城投公司诞生了。政府有钱了,就可以大兴土木进行土地开发和基础设施建设,从而极大地刺激经济的增长,而经济的增长又可以带动土地的升值,然后利用土地升值偿还巨额的贷款。这样的循环前提条件是经济一直以较高的速度发展,一旦经济发展停滞不前,就会带来连锁反应,这套模式就会崩盘。国家为了避免政府债务出现问题,出台了四项举措: 第一项就是债务置换,从2015年新版《预算法》生效后开始,到2019年基本完成。简单来说,债务置换就是用地方政府发行的公债,替换一部分融资平台公司的银行贷款和城投债。第二项改革是推动融资平台转型,厘清与政府之间的关系,剥离其为政府融资的功能,同时破除政府对其形成的“隐性”担保。第三项改革是约束银行和各类金融机构,避免大量资金流入融资平台。这部分监管的难点不在银行本身,而在各类影子银行业务。第四项改革就是问责官员,对过度负债的行为终身追责。这项改革从2016年开始。2018年,中共中央办公厅和国务院办公厅正式下发《地方政府隐性债务问责办法》,要求官员树立正确的政绩观,严控地方政府债务增量,终身问责,倒查责任。 政府产业引导基金 作为科技行业的从业者,或多或少听说了政府的动作对于成千上万个企业的巨大影响力。政府的意志力和决定如何通过非常坚实的“抓手”去执行下去,就是非常值得研究和思考的。在这个商品经济时代,任何商业行为背后都是金钱在驱动着,我们看到的一切经济活动,都被金钱这只无形的大手推动着。 学习政府产业引导基金,正好能够理解最近十年来政府为了推动工业化的发展所采取的较为具体的举措。 私募基金,简单说来就是一群人把钱交给另一群人去管理和投资,分享投资收益。称其为“私募”,是为了和公众经常买卖的“公募”基金区别开。私募基金对投资人资格、募资和退出方式等都有特殊规定,不像公募基金的份额那样可以每天买卖。图4-1描绘了私募基金的基本运作方式。出钱的人叫“有限合伙人”(limited partner,以下简称LP),管钱和投资的人叫“普通合伙人”(general partner,以下简称GP)。LP把钱交给GP投资和运作,同时付给GP两种费用:一种是基本管理费。一般是投资总额的2%,无论亏赚,每年都要交。另一种是绩效提成,行话叫“carry”。若投资赚了钱,GP要先偿还LP的本金和事先约定的基本收益(一般为8%),若还有多余利润,GP可从中提成,一般为20%。 雷军–北京小米智造股权投资基金 这个案例正好可以帮助我学习私募基金和产业引导基金。小米私募股权基金管理有限公司的角色是GP, LP是小米智造的17位股东成员。小米募集的资金七成都来自于政府引导基金,其中,北京市政府引导基金投入了20亿元。 作者在后面还分析了兴起的制度条件,产业条件和金融条件。 政策条件 2005年,发改委和财政部等部门首次明确了国家与地方政府可以设立创业投资引导基金,通过参股和提供融资担保等方式扶持创投企业的设立与发展。自2015年起,财政部和发改委陆续出台了一系列针对政府引导基金的管理细则,为各地提供了行动指南。其中最重要的是两点。第一,再次明确“利益共享、风险共担”原则,允许使用财政资金的政府投资基金出现亏损。第二,明确了财政部门虽然出资,但“一般不参与基金日常管理事务”,并且明确要求各地财政部门配合,“积极营造政府投资基金支持产业发展的良好环境”,推动政府投资基金实现市场化运作。 产业条件 绝大多数政府引导基金最终都投向了战略性新兴产业(以下简称“战新产业”),这是由这类产业的三大特性决定的。首先,扶持和发展战新产业是国家战略,将财政预算资金形成的引导基金投向这些产业,符合政策要求,制度上有保障。从“十二五”规划到“十三五”规划,国务院都对发展战新产业做了专门的规划,将其视为产业政策的重中之重。要求2015年战新产业增加值占GDP的比重需达到8%(已实现);2020年达到15%;2030年,战新产业应该发展成推动我国经济持续健康发展的主导力量,使我国成为世界战新产业重要的制造中心和创新中心。在这两个五年规划中,都提出要加大和创新财税与金融政策对战新产业的支持,明确鼓励发挥财政资金引导作用,吸引社会资本,扩大投资规模,促进战新产业快速发展。 金融条件 引导基金大多采用“母基金”方式运行,与社会资本共同投资于市场化的私募基金,通过后者投资未上市公司的股权。这种模式的繁荣,需要三个条件:有大量的社会资本可以参与投资、有大量的私募基金管理人可以委托、有畅通的投资退出渠道。其中最重要的是畅通的资本市场退出渠道。 遇到的问题 因为是投资新兴的行业,这些行业还需要大量的研发工作,才能使得产品日趋成熟,所以未来是否可以盈利,是一个比较随机的事情,容易亏钱。 源自财政资金的地域属性与资本无边界之间的矛盾。内地的基金不容易吸引到产业,而且不希望到东部投资很有前景的产业。为他人做嫁衣。 资本市场的资金来源,有80%是社会资本,社会资本的动作对政策和金融情况很敏感,不容易筹集到足够的资金开展工作。 LP侧政府人员素质要求高,但是分配制度是随公务员的走,不容易配备足够优秀的人才。 城市化与不平衡 房价和居民债务 因为大城市拥有优质的工作机会,良好的教育环境和医疗条件,吸引了大量人口涌入,房价上涨开始于2008年。根据中国人民银行的这项调查,城镇居民2019年的负债中有76%是房贷。而从资产端看,城镇居民的主要财产也就是房子。房产占了家庭资产的近七成,其中六成是住房,一成是商铺。而在美国居民的财富中,72%是金融资产,房产占比不到28%。(15)中国人财富的压舱石是房子,美国人财富的压舱石是金融资产。这个重大差别可以帮助理解两国的一些基本政策,比如中国对房市的重视以及美国对股市的重视。当经济发展不景气的时候,很多买房者会面临债务危机,因为他们在之前的乐观的环境下,例如收入持续上涨,房价持续上涨,选择忽略了经济如果下行,收入难以按照预期的速度增长的情况,这种情况确实在2020年疫情之后发生,部分人选择提前偿还贷款,部分人为了还月供降低消费水平,消费水平降低会带来国内消费市场的低迷,影响了商品提供方的收益,而广大的职工又在这些企业当中工作,他们的收入可想而知地受到影响。 政府与经济发展 随着经济的持续发展,政府在整个国民经济当中占有的比重会越来越大,这是“瓦格纳法则”。从改革开放到今天,政府为了推动经济发展,主要是以强调生产力建设为主要手段,例如开发房地产,修公路,高铁,投资建设工业园区等等,这些举措极大地提升了我国的工业制造水平,全球的进口产品中,有很大的比例都是中国制造。但是,政府的重点关注目标应该从生产力建设转向服务型政府,也就是加大对民生的投入。从原来的重点投资物,变为重点投资人。 总结 经济学是对经济现象的解读。现象复杂多变,偶然因素非常重要,过往并非必然,未来也不能确定。但经济学研究依然是有意义的。它能从过往事件的来龙去脉中提取一些因素,思考这些因素的不同组合,形成对事件的多种解读,给人启发。但什么是相关因素?怎么组合?又如何解读?这些都与所研究事件的所在环境密不可分。任何合格的理论当然都能自圆其说,但应用理论要跳出理论本身,才能审视其适用性和实用性,这种应用因时、因地、因人而异。对相关因素的提取和组合,本质上是对“何谓重要”这一问题的反复考量,其判断标准只能在比较中产生。这一“比较”的视野,要在空间和时间两个维度展开,既包括跨地区、跨国家的比较,也包括跨时期的比较。研究者不仅要深入了解本国现状和历史,也要了解所比较国家的现状和历史。比较数据和表面现象容易,但要比较数据产生的过程和现象发生的机制就难了,而这些往往更加有用。发展经济学的核心就是理解发展过程,因此必须理解初始条件和路径依赖,对“历史”的延续性和强大力量心存敬畏,对简单套用外来理论心存疑虑。 整本书当中,每一个章节最后的推荐阅读材料也是十分有用的。作者把本章涉及到的问题,一一列举了参考资料,并且加以评论和推荐,值得继续深入阅读。 作者特别指出了,如何提出好的问题,是指定措施和思考解决方案的第一步,在很多时候,能够提出问题,就说明对整个事情或者状态有了很深入的了解,针对问题,已经有了答案。 摘录 当经济增速放缓、新创造的机会变少之后,年轻人间的竞争会更加激烈,而其父母的财富优势会变得更加重要。如果“拼爹”现象越来越严重的话,社会对不平等的容忍程度便会下降,不安定因素会增加。 这里的思考是:这一代年轻人的父母,曾经经历的时代是经济发展高速期,有头脑肯吃苦的那一代都获得了想要的财富。这一代人如果复刻上一代人的思路,会发现他们的收获可能无法匹配付出,会产生两种后果,一种是躺平,另外一种可能是调查为什么会这样,或者直接怨天尤人。美国上世纪的嬉皮士运动就是这样。发达资本主义国家,例如英国美国的过去,一定程度上非常具有参考意义,可能中国的现在就是他们的过去,美国20世纪60年代的年轻人为什么会发起嬉皮士运动,难道者的是他们想开辟新的文化风潮?还是他们对社会的不满,激发的种种行为最终固化了这样的文化?我们看到的最终的结果并不是内在驱动这些行为的目标,需要好好思考为什么他们要做这些事情,结合当下的我们,应该能够提供一些答案出来。 成功的政策背后是成功的协商和妥协,而不是机械的命令与执行,所以理解利益冲突,理解协调和解决机制,是理解政策的基础。 政策的制定,一定是通过实践反复修正和完善的结果。政府在出台新政之后,需要怀着敬畏的心态,从不同的维度来思考,因为政策某种程度就是对人行为方式的约束,既然要约束,就说明在广大的中国大地上,已经发生了很多类似的未受到约束的事情,他们为什么要做这些事情?值得思考背后的原因。这样,才可以深刻理解政策的意图,那么对于实际执行政策的官员,才可以在实际面临问题时候正确解读,做出正确的决策。

2024年7月25日 · 56 分钟 · Yang

《禅与摩托车维修艺术》

作为一部自传体小说,斐德洛的故事,其实正是本书作者罗伯特·M. 波西格的人生。在《柏拉图对话集》中,斐德洛是一个爱好哲学的普通雅典青年。而在本书中,斐德洛重返人间。他曾经是学哲学的学生,同时也是教修辞学的教师,但是由于哲学理念与文化的世界观冲突,他终于因精神崩溃而住院。出院后,他希望从狭窄而受限的自我解脱,于是开始了一场骑着摩托车横跨美国大陆的万里长旅,一路经过复杂经验与反省思考,终于暂时恢复了灵性的完整与清静。这一回归自己的过程,是通过不断寻求“良质”,即东方哲学里的禅思,并用摩托车维修之道对其进行阐释而实现的。这便是《禅与摩托车维修艺术》一名的由来。与此同时,书中还批评了西方世界的二分法或二元论,如人文与科技、精神与物质、神秘主义与机械论、艺术与工业、心灵与机械、东方与西方等相对意识。 总体 旅行分成两部分,前一部分是以博兹曼为终点,就是旅行轨迹2当中他们从黄石公园的高山下山到达山口的地点,作者和他的孩子还有朋友一起从Minneapolis出发,后半段旅程只有作者和他的儿子两个人。我通过作者在书中的描述,把他们经过的每一个地名都搜索了出来,在谷歌地图上面生成了他们的旅行轨迹。 科技与艺术 作者写书是上个世纪的60年代,科技工作者和艺术工作者对于摩托车的修理的看法截然不同,作者认真思考了这个问题,为什么搞艺术的人无法从理性的角度对摩托车修理分析,搞技术的人说出来的话让搞艺术的人觉得很枯燥无趣。从而上升到哲学高度,从古希腊开始,古典的形式主义占据了主导地位,人类文明的发展沿用了这一套方法论。浪漫主义的人试图打翻这种绝对的统治。作者在试图找到另外一种东西,这种东西一定可以统一二分法,这种东西就是“良质”。 其实读下来,作者是从一些具体的现象开始引发思考,一步一步抽象,作者想归纳出来背后到底是什么在发挥作用。 如果有人问“什么是良质呢”,这只不过是一个问题而已。但是如果由他来问,因为他有过去的经验,这个问题就会像向四面八方散开的波浪,并不是一层一层的结构,而是像一个同心圆,在中间激起波浪的,是良质。当这些思想的波浪向四面八方散开的时候,我确信他衷心期望它们能够到达某些思想的彼岸,这样他就能与这些思想结构连接在一起。但是如果真的有任何彼岸存在,那么一直到最终,他也未能到达彼岸。对他来说,只有不断向四面八方结晶的波浪。我现在就是要尽力追随这些结晶的波浪,也就是他研究良质的第二个阶段。 良质 上面这段话是很棒的比喻!在中间的刺激我们并不能描述,这个刺激从哪里来的也说不清楚。但是可以描述或者定义激起来的波浪,通过研究波浪来间接研究中心的刺激,也就是良质。 作者认为通过良质,可以从更高的维度将浪漫和古典进行统一,也就是情感一方的浪漫的良质和更加理性和客观的古典的良质。 感性和理性并不是对立的,而是统一的。 作者分析老子的《道德经》里面的那段,我认为是比较有突破的地方:斐德洛认为的良质就是道,两千四百年前的老子其实已经对这个问题进行了思考。 道可道,非常道。名可名,非常名。无名,天地之始;有名,万物之母。故常无欲,以观其妙;常有欲,以观其徼。此两者,同出而异名,同谓之玄。玄之又玄,众妙之门。 这段里面的道就是书中的良质。是一个整体,但是又可以根据时间序列将它划分为可以描述的常识和不可描述的玄妙,这里的玄妙应该是尚未发现的规律,可以描述的常识是可被定义的科学概念或者是事物。常无欲和常有欲,就是说内心是否怀着动机或者说是欲望,如果动机很微弱,就是无,很多人无法做到的无我状态,如果能够进入无的状态,就可以感受到道的玄妙,这里我认为是某种参考系统,能够看到类似于坐标轴一样的外观,而且它们相互正交,非常容易通过组合来实现对主观和客观的准确描述;如果目的性很强,引申一下其实就是为了某个目标想办法,付出努力,就可以感受到道带给我们的无穷力量。 无欲的时候,是培养我们发现道的能力,让我们认清楚主观世界和客观世界里面,底层都有哪些基本组成单元,以及它们之间的运转逻辑是什么样子; 有欲的时候,是利用道的超能力帮助我们解决具体问题的时候。 道沖,而用之或不盈。渊兮,似万物之宗。挫其锐,解其纷,和其光,同其尘。湛兮,似或存。吾不知谁之子,象帝之先。 这段说的是道的来源以及它具有什么样的特性。道是空虚的,但是作用非常巨大或者是无限大,意义深远,就像所有一切的根源。挫掉道的锐利,去掉结根,遮挡道的光亮,和尘埃混合在一起。道似乎消失了,但是又似乎存在着。不知道道从何而来,似乎是比第一个神的出现还要早。 执古之道,以御今之有。能知古始,是谓道纪。 利用之前的道,来解决当前的问题,更进一步,还需要通过当前问题提出如何完善道,从以前到现在和未来,需要清楚道的规律是不变的,但是道本身一直在变化。或者换个说法就是道本身是一直随着时代进步也在进步,但是人类文明一定是朝着进步的方向发展的。 实质与方法 实质是不会改变的,而方法则没有所谓的永久。实质和原子的形态有关,方法则和原子的功能有关。在科技的写作上,也有相似的划分:物理描述和功能描述。如果想把很复杂的机械结构描述清楚,最好先描述它的实质层面;它的次级组件和零件。然后再描述它的方法层面:按照次序执行的各项功能。如果你把实质和方法混淆了,那么读者就不可能了解你说的是什么。然而要把这种划分的方法应用在各种知识领域,比如英语作文当中,似乎并不实际。因为所有的学院科目都包含这两种层面。而良质似乎与这两者都无关。良质没有实质,也不是一种方法,它超越这两个范畴。如果一个人盖房子的时候会用到铅垂线和水平仪,那是因为垂直的墙壁比弯曲的墙壁品质要好,不容易坍塌。所以良质不是方法,而是方法所追求的目标。 良质是引领方法向前进步的火车头,或者是作者说得火车轨道。每个人心中的良质都是不同的,这就造成不同的人对于同一件事情的处理方法是不同的,他们在心中对方法的取舍就是依靠良质完成的。 儒勒·昂利·庞加莱 那么如何去选出那个一再出现的有趣事实呢?科学方法就是对事实进行选择的过程。首先,集中精力想出一个方法是必需的,因为方法并不唯一,所以有很多方法被想了出来。以有规律的事实开始是合适的,但是在一个超越所有疑问的规则被建立后,跟它相符的事实便变得枯燥乏味,因为它们不能再教给我们任何新东西了。于是例外就变得很重要。我们找寻的不是相同处而是歧异处,我们要选择最引人注意的歧异,因为它们最震撼人心,而且也最具指导意义。我们首先去找这个规则最可能失败的那些情况。通过在空间中走得更远,在时间中走得更久,我们也许会发现我们通常的规则完全被推翻,而这些重大的翻转使我们能更清楚地看到那些也许会发生在我们周遭的小变化。但是我们的目标不是再次确认相同或是歧异,而是要在表面的不一致中识别出深层的一致性。特别的规则似乎在一开始总是不一致,但是看得更仔细一点的话,我们将看到,大体上来说它们都很相似:虽然问题不同,但是形式相似,各部分的次序也相似。当我们带着这种偏见去注视它们,就会看见它们逐渐变大而且有可能涵盖一切事物。正是这一点造就了某些事实的价值,这些事实构成了一个集合,而且告诉我们它可靠地反映了所有同类集合。 第21章节讲述的是如何一步步把良质搞清楚的过程。这一章节很实用,尤其这段话:从现象抽象出一种对现象的描述语言或者方法,就是作者说的在表面的不一致中识别出深层的一致性,然后,基于这一套描述方法,对待研究的对象进行调控或者变换,得到的新的表述方法再remap回到当前的现实去验证。 其他的碎片感悟 由于多年来感官累积的资料,我们已经在心目中建立起这样一部直觉的摩托车。随着新的讯息进来,这部摩托车会不断改变。就拿我所骑的这部车子来说,由于路况的关系,它的变化非常迅速而短暂。这一路上,我一直都在注意而且不断修正,一旦所得的资料没有价值,我就会把它忘掉,因为还有更多新的讯息要进来。这部先验摩托车的其他变化则比较缓慢(比如说,油箱的油逐渐减少,轮胎的橡胶逐渐磨损,螺栓和螺母逐渐松脱,制动蹄和制动鼓的间距逐渐改变)。这部摩托车还有一些方面变化极其缓慢,看起来几乎像是永远不变一样——比如说,油漆、轮子的轴承、控制的线缆——而这些其实也一直在改变。如果我们从足够长的时间段来看,由于路面的震动、温度的改变,以及内部零件的耗损,车子的整个骨架都会改变。 这部分特别像贝叶斯滤波的原理,我们每个人都对摩托车的样子,比如材质,反光系数,质量等等具有先验的估计,这个估计是呈现某种随机变量分布的,然后当感知系统感受到外界客观的摩托车,对应的某个参数会和先验参数进行后验估计得到新的参数分布,然后存储到大脑永久记忆区域。在这个后验估计的过程中,不同的人采用不同的方法 这名像驴子一样、假设出来的学生会继续游荡一阵子,他可能得到另外一个像他抛弃的教育一样珍贵的学习机会,就是所谓的“社会大学”,不再浪费时间和金钱去做一头高级的驴子。他可能找到一份工作,安然地做一头低级的驴子,比如,一名技工。然而事实上他真正的地位会提高,因为这样才可能有所贡献而带来改变。可能他终身就做这份工作,也可能他达到一定的水平,然而并不满足于此。 短则六个月,长则五年,很可能会发生变化,他对自己每天机械化的工作越来越不感兴趣,过去被学校的理论和分数所压抑的创造本能,现在很可能因为工作的无聊而被唤醒了。他花了数千个钟头去解决机械方面的问题,因而对机械设计越来越有兴趣。他可能想要自己设计机器,因为他相信自己会做得更好,于是尝试改造一些发动机。成功之后,就想要更大的成功。然而这个时候,他可能会遇到瓶颈,因为他没有理论基础。于是,他就会发现以前自己丝毫不感兴趣并觉得一无是处的理论,现在变得有了一些值得敬重之处。 于是他就会回到没有分数也没有学位的学校里,这时他变了,不再为分数而来,而是为了追求真正的知识。他不需要别人强迫他去学习,他的动力来自于内在。这个时候,他就是一个自由的人,他不需要许多规章制度的督促。事实上,如果老师上课的态度松懈,他倒可能会唐突地问许多问题去督促老师。他来这儿是要学东西的,并且付了钱,那么老师们最好也不要懈怠。 一旦转变成这种学习动机,就会产生强大的爆发力,在没有分数和学位的教育机构里,学生找到了自己。他不会止步于工程学浅层的操作知识,物理和数学自然会成为他的兴趣,因为他清楚自己需要这些深层的知识。而冶金和电子工程也会得到他的青睐。他对这些抽象的学问熟悉后,就去研究其他的理论,虽然和机械不直接相关,但是也会成为他更大的目标的一部分。这个更大的目标可不是今天的大学所鼓吹的教育目标,在那里,虽然你得到了分数和学位,让人以为你有很高深的知识,然而事实上,只有你自己知道内在空空如也。 这段有切身体会,高等学校在教育fresh man之前,首先需要把为什么要学习这门课程的why讲清楚,包括但不限于讲清楚行业痛点,带领学生去实习,把一线的痛点理清楚,然后再通过学习去解决这些痛点。这样学生在学习的时候非常具有使命感,会主动寻找知识的内在联系,融合贯通地提出自己的思考。这段话跟家人讨论之后,他们都觉得我对这件事情的看法非常理想化,在实际操作中是不可能的事情。 他一直都没有爬到山顶,到了第三天晚上他就放弃了,因为他已经筋疲力尽,于是其他人继续前行,而他留下了。他知道自己还有些体力,但这些体力不够。他也有动力,但是也不够。他并不认为自己有傲慢轻视的心,但是他想通过这一趟朝圣来拓展自己的生活经验,以进一步地了解自己。 参加不同的活动,把自己放在舒适区之外的地方,得到的感受可以有助于更深刻地了解自己。对生活的指导意义就是:不断尝试和接触新的领域,或者在自己的领域不断提出新的挑战,然后尽最大努力去完成或者实现出来。 所以不应逃避被卡住的情形,它是达到真正了解之前的心灵状态。要想了解良质,不论是在技术工作上还是其他方面,放下自我,接纳这种被卡住的现象是个关键。无师自通的技术人员就是因为常常被卡住,才比接受过学院训练的人员更了解良质。因为他们懂得如何处理突发的状况。 这个说到了点子上。把自己融入到卡住的情形当中,先不要想解决方案,先假设自己卡在了那里,看看自己的周围都有啥,充分了解之后,再让良质发动去寻求解决的动作。 “卓越”暗示着对生活的完整或唯一性的尊重,因而不喜欢专门化。它还暗示着对所谓的效率的轻视——它具有更高等级的效率,这种效率并不存在于生命的某一种才能中,而是存在于生命本身。 作者在这一部分说的“卓越”我其实是没看懂的。说一下我的理解:就是说生活是一个内容非常丰富的集合,在这个集合当中有很多的领域,卓越追求的是在各个领域做出超过常人的水平,但是单独去考量每一个领域的时候,就会陷入如何评估你做的比别人好的问题,这个问题的解决方法其实还是需要一个参考系统来评判,这个系统的建立往往还是苏格拉底式的唯物的,清晰、可定义的具体的概念。所以思考哲学问题是不是需要先极端化地不顾一切地异常狠毒地走很远,然后再回头温柔地回望身后的场景,这样得到不一样的体会。 后续 作者在书的后半段用了很大的篇幅来说古希腊的先贤们为了掌握更接近本真的道理,创建和很多的学派和涌现了许多代表人物。回想一下,至今仍然有很多的人在研究古希腊的文明,作者也提到,从那个时期到现在其实人类并没有实质性的认知进步。所以,研究古希腊的文明的发端,演进和消亡对于未来和当下具有指导意义。 没有太想好,过去的经验是不是应该合并到良质里面。场是临时性的任何人对话时维系的一种图像或者场景,在这个场中,两人脑子中的印象相似程度最大化。 最近的生活 最近是北京最热的三伏天,周末的活动我们选择了门头沟的大山,因为那里海拔高,气温低,非常适合避暑乘凉。京蔚高速的通车极大地方便了北京到灵山的通行,开车走在桥隧比相当高的京蔚高速上面,让我有种错觉在穿越时空,回到了另外一个宇宙。

2024年7月15日 · 56 分钟 · Yang

《思考,快与慢》

第6章 意料之外与情理之中 讲系统1如何对发生的事件做判断的,分析了它的工作机理和存在的缺陷 讲了心理学家乔恩的故事,从第一次的惊喜到第二次的习以为常,因果关系的推导在系统1看来,会因为之前发生了一次小概率事件而把之后再次发生类似事件认为习以为常,我个人认为就是条件概率在第二次采样的时候被系统1无意识地调高了。 第16章 因果关系比统计学更有说服力 在16章节当中,列举了出租车逃逸的事例。这个问题是要求我们回答出租车是蓝色而不是绿色的概率是多少。 我们通过贝叶斯的思想来分析这个问题: 事件B:出租车是蓝色的; 事件G: 出租车是绿色的;事件S:那个目击证人指认出出租车的颜色是蓝色的。 因为$P(B)=0.15$, $P(G)=0.85$,这两个概率是先验的,假如现场没有目击证人的任何证词,我们只能根据先验信息来判断肇事出租车是蓝色的概率是0.15。但是现场有目击证人,目击证人的观察也具有一定的不确定性,他能够正确辨认出租车颜色的概率是0.8。其实,作者想要读者思考的是如何根据目击证人的证词和先验概率分布来计算出租车是蓝色的后验概率,这个后验概率是$P(B|S)$,我们可以通过贝叶斯公式来计算: $$ P(B|S)=\frac{P(S|B)P(B)}{P(S)} $$ 上面的公式当中,比较容易得到概率数据的项: $P(S|B)=0.8$->当出租车为蓝色时目击证人指认出租车是蓝色的概率,是一个条件概率; $P(B)=0.15$->现场的出租车颜色是蓝色的概率; 分母的$P(S)$是目击证人指认出租车是蓝色的概率,是一个边缘概率,在之前的卡尔曼滤波器学习笔记(一)当中提到过。如何确定这个概率的数值呢?我们可以通过全概率公式来计算: $$ P(S)=P(S|B)P(B)+P(S|G)P(G)=0.8\times 0.15+0.2\times 0.85=0.29 $$ 这样,我们就可以计算出$P(B|S)=0.41$。 得到这个结果的反思:单纯依靠先验概率得到答案0.15,单纯依靠目击证人得到0.8都不是最合理的结果,需要综合两者的信息来判断,当我们依靠贝叶斯公式计算得到后验概率是0.41之后,我们会更信服这样的概率结果。 在这个问题的讨论中,我和妻子产生了分歧,分歧点在于条件概率的计算是一个除法,除法的分子部分她选择了$P(B)$而不是$P(B)\times P(S|B)$,她认为分母部分已经把这个目击者看到的信息包含进去了,分子是这个城市蓝色汽车出现的概率。 我的想法是$P(B)$和$P(G)$在这个问题中只是假设(Hypothesis),这个问题的核心仍然是那个目击者,目击者说他看到蓝车是一个证据(evidence),他看到蓝车并且假设是蓝车概率是$P(S,B)$,但是也有可能是绿车他说成蓝车,他看到蓝车但是假设是绿车概率是$P(S,G)$, 那么他看到蓝车并且假设也是蓝车的概率是$\frac{P(S,B)}{P(S,B)+P(S,G)}=0.41$ ,也就是这个问题的答案。全程考虑问题的重点是他提出他看到蓝车这个证据的事件需要在所有可能的假设上面做两个事件同时发生的概率求解,然后看看证据所描述的假设占据所有假设上的比率。隐藏的统计学基础比率(Statistical Base Rates)起到的作用就是计算提出证据这个事件和假设真的发生的概率。 像是线性代数当中的基向量,我们在讨论问题的时候,并不会过度关心那些个基向量,我们关心的是基向量的线性组合,或者说是坐标,例如,飞机在飞行中的位置就是一个大地坐标系统下的向量,在飞机着陆过程中,地面控制系统关心的是飞机的z坐标(代表了当前的高度),如果高度不对会发生坠机事件,和x、y方向的联合速度,代表了水平飞行的朝向,如果朝向不对无法降落到飞机场。这些变量是飞机位置这个总体变量在某些方向上的投影。从概率的角度看,就是证据的提出向基础事件们投影,得到的投影作为新的样本,从样本中选择我们关心的子样本。 从独立做100次实验的角度来看,让目击者独立重复看100次现场,实验设计85次是绿色出租车,15次是蓝色出租车,他看到蓝色出租车并且汇报是蓝车有12次,他看到绿色出租车并且汇报是蓝色出租车有17次,他总共汇报了29次是蓝车,但是这29次当中真正是蓝车只有12次,那么最终的概率就是12/29。 作者在这一章节最想强调的事情是:在特殊场景发生的事情,即使是你亲眼看到的,也并不能把这个事件发生的概率提高到1,人们很容易忽略统计学的基础比例,但是如果统计学的基础比例换汤不换药地被描述为因果关系当中的原因,比如还是那个出租车肇事逃逸的问题,**描述为两家公司拥有相同数量的出租车,但是在造成事故的出租车当中,绿色出租车占比为85%。**那么,人们就更容易地接受这样的事实,就会觉得是绿色出租车的可能性变大,降低是蓝色出租车肇事的预期。从而改变了对这个事件的看法。但是从数学的角度,这两种描述都是贝叶斯公式当中的计算素材。作者提到的两个重要的概念分别是: 统计学基础比率(Statistical Base Rates):在一个特定的群体当中,某个特定的属性的比例,例如,某个城市的出租车当中,蓝色出租车的比例是15%,绿色出租车的比例是85%。普遍受到轻视,当人们手头有和该事件相关的具体信息时,有时候还会完全忘记或者忽略这个比率。 因果关系基础比率(Causal Base Rates):在一个特定的群体当中,某个特定的属性的比例,例如,某个城市的出租车当中,蓝色出租车肇事的比例是15%,绿色出租车肇事的比例是85%。因果关系往往被看作是个别事件的信息,人们很容易把这个信息和其他的具体事件结合起来考虑问题。 文章讲到的思维定式,对于大脑中的系统1来说,它的特征之一就是代表了范畴规范和原型范例,这样的规范和范例决定了我们如何看待身边的事物,比如电冰箱,电动车和交通警察,在我们的记忆当中会存储所有这些范畴的事物或者个人相关的一个或者多个“规范的”典型形象,当这些规范具有了社会性的时候,这些典型形象就被称为思维定式。注意,这里是范式的式。 我们应该如何做? 我认为,在需要做出判断的时候,尽量能够把和当前所遇到的问题相关的名词列举出来,然后把他们做一些组合形成一些描述,然后再思考这些描述是否有普遍的统计学规律,如果有,把这些规律转化为因果关系的基础比率,帮助我们分析当前的这个具体问题。 任何我们看到听到的事情,都是值得怀疑的,因为从数学的角度来看,这件事情发生都是概率性的,我们看到听到感受到的,只是该事件的某种观测,只要是观测,就会存在偏差,就会不准,即使我们主观感受觉得自己判断得很准。 不能忽略基础比率,但是更不能忽略观测。 第17章 所有表现都会回归平均值 成功=天赋+运气 从飞行员特技表演到高尔夫球手前后两天的比赛水平,都说明了,如果某一次表现优秀,并不能下定论这个选手一直会如此的优秀,反而,他的表现会回归平均值,但是如果某个选手的表现一直显著超过平均值,那么,说明他是一位优秀的选手。 回归效应是普遍存在的现象,上过《体育画报》封面的运动员都会在之后的比赛中表现欠佳。 作者强调了相关性和因果性是不同的概念: 相关系数:两个值共有因素的相对比重,在0到1之间浮动。我理解的是,两个值是随机变量,有联合概率分布函数和联合概率密度函数,也有某个变量的边缘概率分布和边缘密度函数。查阅卯诗松概率统计的书籍,描述两个变量之间的统计关系可以采用协方差或者相关系数,但是因为协方差是带有量纲的,就是某种单位,无法归一化,所以有了相关系数这个无量纲的系数。 $X$和$Y$两个随机变量的协方差,或者叫做相关矩(中心矩) $$ COV(X,Y)=E(X-E(X))E(Y-E(Y)) $$ 当$COV(X,Y)>0$时候,说明两个随机变量是正相关的,当$COV(X,Y)<0$时候,说明两个随机变量是负相关的,当$COV(X,Y)=0$时候,说明两个随机变量是不相关的。 两个随机变量不相关不代表相互独立。 相关系数的计算公式。 变量之间的回归关系 – 英国生物学家兼统计学家高尔顿 自变量$x$的取值是如何影响因变量$y$期望值的,该模型并不会给出$y$的具体取值,只是表明了$y$的平均水平会随$x$发生什么样的变化。 如何在实践中利用这个效应? 在做预测分析的时候,可以根据历史数据得到回归分析的结果,然后,根据个例的最近情况,比如最近三年的走势,结合回归分析结果进行加权平均,得到的加权平均更具有说服力。作者举例的连锁百货公司的下一年的门店销售额增长情况,需要在平均增长情况的基础上,对业绩较差的门店赋予大于10%的增长率,对于业绩较好的门店赋予小于10%的增长率。 个人认为,这只是一种思维方式,需要我们使用更精确的数学模型来刻画这种变化情况。 ...

2023年12月24日 · 35 分钟 · Yang