泛化是指记忆联系的“发散”,泛化兴奋的基础是模糊兴奋。记忆联系的“发散”有以下几种种情况:
1、联络区的一原始记忆柱群(A1)具有直接或间接与其它任意联络区的任意原始记忆柱群建立记忆联系的潜力。也就是说任何两个对象,它们只要直接或者间接在联络区存在对应的记忆柱群,这两个对象之间便具有产生直接或者间接的兴奋性记忆联系的“潜力”。
2、目的过程中,任意两个对象只要能够被先后注意,并成为不同的目的对象,这两个对象之间便能建立记忆联系。
3、当对象A1与B1建立记忆联系后,任何与A1相似到一定程度的对象,都能兴奋与B1相似到一定程度的对象。
4、A包含A1、A2、A3……,B包含B1、B2、B3……,A1与B1“相似”,A通过A1能够兴奋的对象,B也能通过B1兴奋。也就是说,“A”状态下,A1产生的记忆联系(A1兴奋C),在没有经过分化学习的情况下,B状态与A1“相似”的B1仍然具有能够兴奋C的潜力,通过这个中介,B能够兴奋C。这种兴奋的机理是:智能软件的A1与C建立记忆联系后,它的B不断兴奋回忆,在某一状态下,其它兴奋内容被抑制,而B1与C之间的兴奋性联系没有被抑制,C被易化兴奋的相对最强,从而被选择兴奋。因而在实现泛化兴奋的过程中,分化的机理也会发挥作用,它们是对立统一的。
5、记忆联系的“发散”兴奋具有选择性。也就是说,最易兴奋的先被选择兴奋:兴奋后如果不能带来奖赏,便被抑制,然后再兴奋下一个最容易被兴奋的记忆柱群……;而如果兴奋后带来奖赏,这一兴奋便会被选择强化,随后的选择兴奋过程便终止。
分化就是,在众多的“对象”能够兴奋对象(B1)时,通过奖惩学习从这些对象中选择出,能带来奖赏的某一对象(A1)来进行强化,使对象(A1)对对象(B1)所对应的记忆柱群的兴奋能力远强于其它的记忆柱群,使A1对B1的兴奋得到选择,而其它不能带来奖赏的兴奋被抑制,从而产生分化。
人(智能软件)的学习一般是通过奖惩学习从泛化到分化的过程。
泛化是并行存储系统的属性,不需要特别编程。分化的每一个过程的结构与功能基础,在前文都进行了讨论(比如奖惩中枢的奖惩学习),它们都能被编程获得。因而分化能够通过编程得到。
泛化、分化、选择过程是同时进行的。分化后,泛化的基础是仍然存在的,泛化兴奋过程仍然可能被诱发。神经系统兴奋、记忆、学习过程就是泛化、分化、选择兴奋的过程。没有泛化学习便会缺乏“素材”,而没有选择分化,智能软件便无法获得与环境相适应的兴奋。
才设计出的还没有学习的智能软件,泛化使兴奋记忆联系具有无限可能性,而奖惩学习选择(分化)形成的兴奋记忆联系使思想行为与环境相适应。
学习具体过程,不像我下面论述的那样,而是要复杂的多,下面的论述仅仅是理想化的简单论述。
为了论述的方便,我以婴儿或者智能软件为例进行讨论。
因为泛化,当一个对象给婴儿带来奖赏后,婴儿可能看到或者想到这个对象就会预期奖赏,而追求这个对象,这种追求往往可能无法达到目的,通过长期奖惩学习,这种情况下,婴儿就不会再预期到奖赏,也就不会再有这种追求现象了。
比如一个对象给智能软件(婴儿)能够带来奖赏,智能软件注意这个对象时能够带来奖惩预期,注意这个对象前及注意这个对象后的动力预期值的差就是这个对象引起的动力预期值。这个动力计算的结果可以与以下状态建立记忆联系:1、智能软件先不拥有这个对象,然后拿走这个对象。2、先不拥有这个对象,然后被给予这个对象。3、只是看到这个对象。4、只是想到这个对象。在不同的状态下,智能软件会有不同的反应,比如高兴、痛苦、愤怒、追求这个对象、对这个对象没有反应。这个计算可以与这些众多的反应建立泛化的联系,然后通过学习,只在某些情况下与特定的反应建立记忆联系。比如我对婴儿想象到香蕉的反应的学习的讨论。
一个婴儿饥饿状态看到一个食物对象,这个食物他能够获得并能够带来奖赏,这时拿走这个食物(这时失去食物后与失去食物前的奖惩预期值的差是负数),婴儿会挨饿,获得惩罚,婴儿会哭闹、不高兴、愤怒等等,追求这个食物,如果能够重新获得这个食物,愤怒、不高兴等等情绪行为便会得到强化,这个负的奖惩预期值对应的记忆柱群便会与它们的记忆联系便会得到强化,反之会被抑制……。然后,某些情况下,他看到食物(不属于他的,但他没有相似的经验),他奖惩预期为正,结果被拿走,食物拿走后、前的奖惩预期值差是负,会回忆到相关情绪行为,而愤怒等等,并采取追求的行为,……结果仍然无法获得食物,这种情况下的思想行为便会被抑制,而产生分化。
婴儿如果在非饥饿状态下,被拿走食物,并给他奖赏,这个奖惩预期值的差就会与高兴等等建立记忆联系……。
其学习过程是:1、无限兴奋可能。2、俩对象(A、B)通过奖惩学习建立记忆联系,任何包含A的状态都能够兴奋B。有了这种联系智能软件(婴儿)就会在各种包含A的状态下追求B,不断的探索学习。3、通过奖惩学习,只有部分包含A的状态能够兴奋B。比如那个对象的动力预期值就类似于A。