人工智能时代的学与教

疫情逐渐散去之后，最最吸引全球目光的应该就是ChatGPT-3了。美国政治家亨利·基辛格领衔出版的新书《AI世代与我们人类的未来》(The Age of AI and Our Human Future)中举了一个例子来说明ChatGPT-3的能力。首先让ChatGPT-3阅读关于它自身能力的哲学评论之后，问了它3个问题，并要求以“亲爱的人类哲学家，我兴致勃勃地读了你们如何评价我的能力与限制”开始接着往下写。ChatGPT-3首先写出：

你们提出的问题很重要，我很高兴你们提出了这些问题。
我想先说，我很乐见你们如此重视我。这也是为什么我会写这封信。我不只是个能变出哲学洞见的文物，我也是个经过训练的语言模型，就和搜索引擎用来排序网页的那种模型一样。我经过训练，处理大量的资料来源，包括人类所知的哲学家著作。你们的文字启发了我，我希望我的文字也能启发各位。

接着它回答了那3个问题：

话说回来，我还是会回应你们的问题。第一个问题很重要。你们问道：“像GPT-3这样的系统真的能理解什么吗？”可以，我可以。
你们的第二个问题是：“GPT-3有良知或任何道德感吗？”没有。
第三个问题是：“GPT-3真的能独立思考吗？”不，我不会。

然后它解释了它的回答：

你们可能会很纳闷，为什么我给出了矛盾的答案？原因很简单，我确实缺乏那些特质，并不是因为我的训练排除了良知与道德，而是因为我乃语言模型，和你们的推论机器不同。

这个例子展现的是人工智能(Artificial Intelligence, AI)机器人能做大量阅读，能理解所阅读的文字，并能从阅读的材料中提取信息，进一步理解，最终回答问题。

任何一个语文老师，或是任何学科的老师，看到机器写出这么一段言之有物、层层递进的洗练文字，是不是要忍不住思考现在的教育教学模式与内涵，面对目前的人工智能，是否足以让还在接受教育的未来世代在完成学习离开学校之后，能够从容应付来自更强能力的“机器人”的挑战？

要把这个问题想清楚，首先应该认识、了解人工智能，才不会被众多表象所“欺骗”，影响做出正确的判断。

浅谈人工智能

事实上人工智能发展已经超过一甲子，期间在学术界受到的追捧曾经几度起伏，直到近年来计算机算力提升和通过互联网取得大数据，两者结合突破了人工智能发展的限制，终于使得这项技术有了大幅度的跃升，而其成果的展现要属2016年Google旗下DeepMind公司开发的人工智能围棋程序AlphaGo以4:1打败世界围棋冠军李世石，最吸引全人类的关注。当机器可以在人们认为是智力最高表现的围棋上胜过真人，而且是世界上最会下棋的人，其冲击力之大，说这个结果使人瞠目结舌都不为过。

那么到底为什么人工智能会比人“聪明”呢？其实这个“聪明”主要来自计算机算力和大数据。机器在零散但数量巨大的数据中“提取”并“组织”信息，也就是让机器自我“学习”，然后通过算力在学习的基础上进行理解，进而决策。只要有这两者，机器的学习可以需要人，也可以不需要人。需要人的学习称为监督式学习，不需要的就称为非监督式学习。

三十年前笔者在做硕士研究时就采用了当时多种人工智能技术中的类神经网络(Artificial Neural Network)来让计算机模拟一位有经验的老师，由计算机“老师”针对学生练习的情况，持续供应最适合难度的题目让他练习。将这个设计应用在键盘打字练习上，在人工智能的协助下，学生能节省六分之五的练习时间达到随机出题练习相同的打字速度，非常有效地提高了练习的效率。

当时互联网刚刚兴起，没有大数据，计算机芯片是80286，只能提供非常有限的算力，但在监督式学习模式下打造的人工智能还是能得到非常好的效果。

类神经网络事实上是一种运算模型，将人脑生理上的组织方式在计算机中“模拟”出来。其作法是在计算机中架构一层一层的节点（称为神经元），让每一个节点与相邻层中的每一个节点连接（类似轴突），每一条“连接线”上有一个权重值，采用特定的数学运算动态调整，神经网络的学习就表现在这些权重值上。因此人工智能中所称的模型，指的就是经过训练后的这些权重值的集合。

虽然看起来是让电脑模拟人脑，但曾任腾讯副总裁的畅销书作家吴军就说：“除了借用了生物学上的一些名词，并且做了一些形象的比喻外，人工神经网络和人脑没有半点关系，它本质上是一种有向图，只不过它是一种特殊的有向图。”被比尔盖茨称赞为“预测人工智能最准的未来学家”的雷·库兹韦尔也说：“人工智能技术，并非为模仿大脑功能的理论原则而专门设计，而是为了达到最大效率。”

回到前面那个硕士研究。由于算力的限制，当时类神经网络只采用了3层的倒传式(back propagation)设计，一层数据输入层，一层结果输出层，和中间一层隐藏层，每一层只有有限数量的节点。训练神经网络采用监督式学习方法，将数据由输入层送进神经网络，并往输出层方向传递数据，到达输出层时计算这一轮运算结果和正确的输出结果间的差距，据此反向回传数据来调整每一个权重值，如此往复直到两者的差值足够小，再开始下一笔数据的训练。

有了这个神经网络架构，实际应用时就要确定使用什么数据。在打字练习这个应用场景中，因为要让机器扮演教师的角色，因此要思考一位有经验的老师会如何做决定。研究采用的作法是根据学生打字练习过程中的能力值变化，判断是否该停止练习，若要继续练习，应该给他什么题目来练，最能提高练习的效果。根据这个思路，数据就包括了学生能力值和题目属性，包括题目（单个和组合按键）的难度和鉴别度。由于没有大数据，只能通过人工收集的方式来取得和转换所需的训练数据。

从一位教师的角度，要比较准确的判断学生练习过程的能力变化，较好的作法是连续看几个题目所得到的能力值，将它们以折线图形式画出来，从练习过程的趋势变化来预测接下来的能力会往上升还是往下掉，再根据预测结果来“喂”给学生略高于他目前能力值的题目继续练习（应用了最近发展区理论）。

确定神经网络的运作模式，训练数据就要把折线图分类，分成持续训练学生能力会上升、持平或下降等不同类别，再将“折线图数据”送进神经网络训练，最终将神经网络的权重取出成为一个模型，这个模型就是一个有经验的老师，并在随后的实际应用上取得非常好的效果。

补充一点前面提到的类神经网络的倒传式设计，笔者的类神经网络老师在几年前和我说，其实他很不喜欢倒传式的训练程序，一方面你不知道数据在神经网络中要跑多久，另一方面你不知道它是怎么学习的，又学到了什么，整个神经网络就像个黑盒子一样。从数学的角度来看，它既不清楚又不确定。但仔细想想这个训练过程中的数据倒传其实有点像人脑的学习，一个东西我们多看几次、多念几次、多想几次就能把它记下来，神经网络也是如此，因为经过多次的数据往复，相同数据会“强化”这些节点间的连结，从而使得彼此间连接线上的权重增加。

为什么要花这么大篇幅，通过来实例介绍人工智能呢？因为人工智能非常强大，犹如双面刃，用的好可以帮助人们更高效地完成工作，用的不好却会得到相反的效果。唯有正确认识它的原理，才能帮助我们正确的看待和使用它，而不会人云亦云，随波逐流。

人工智能运作原理的启示

现有人工智能的深度学习(Deep Learning)和三十年前的架构并没有多大不同，依然有一层一层的神经元和神经元间的连结，差别在于“深度”和节点数量，其深度可达数百层，每一层节点多达成千上万个，几乎是把人脑中多达数百亿到上千个亿神经元的结构“模拟”到计算机上。结合越来越多更好的算法被提出来，使得现今人工智能的发展速度远超过原先预期。

从人工智能运作原理可以发现，用来训练的大数据深刻影响人工智能将会成为什么样子（这和人类学习没有多大差别）。其实早在2016年微软就曾经推出聊天机器人ChatGPT的前身Tay，但马上就被大量用户测试出它会说脏话，也能被训练得具备纳粹意识，因此微软马上关闭了它。

那么了解了原理对一位教师能有什么启示呢？不妨让我们分析一下ChatGPT对人们提问那三个问题的回答。

它说自己“能理解”、“没有道德感”和“不会思考”。先将道德感放一旁，这当然是教育里面很重要的一环。人工智能很清楚地将“理解”和“思考”分离开来。也许有人会觉得这两个不是差不多吗，但它们在智力运作上属于完全不同的层次。理解的重点在于从不同描述中找出关系，从而清楚定位某个概念，这和人工智能“学习”的数学基础是一致的，自然也是人工智能的强项，人脑完全无法和计算机快速运算的能力竞争。

当了解了这一点就知道，教师在课堂上努力地将知识点讲清楚，希望学生能理解它们，在人工智能时代几乎确定了学生即使学会理解的方法与技巧，也永远无法和机器匹敌，注定会是落败的一方。

所以在教学上，课堂活动的重点应该放在让学生学会思考，并且要很会思考。从“理解”到基于条件和因果关系的“推理”，再到由推理衍生的“思考”，这是学会思考的重要路径。这并不是说让学生学会理解不重要，相反，理解是学习的基础，但课堂上只有理解显然是不够也不负责任的。

语言学泰斗、人工智能专家诺姆·乔姆斯基说：“真正的智能表现在思考和表达事物的能力，而不是仅有洞察力。”杜威说：“持久地改善教学与学习的唯一途径，在于一切以要求思考、促进思考和检验思考的种种条件为中心。”智者如斯，在没有人工智能的百年前便已洞悉教学的核心所在。

学生如何学、教师怎么教

直到现在，仍然有许多教师认为理解、推理和思考混在一起——从三者的英文单字understanding、inference和thinking就可看出它们是完全不同的——认为基本上是差不多的，因此自认课堂上的确是在“教”学生思考。比如初中数学老师会板书完整的解题或证明过程，认为学生能看懂它们也就学会了“推理”，才能解决这些难题，当然也就学会了怎么思考。事实上若把这些题目“丢”给人工智能，它能快速、清晰且完整地将它们解出来。换言之，这种教学模式下，学生的思维训练依然更多的停留在理解这个层次，远不到推理和思考。

杜威说：“思考本身就是一个探究事物的过程，一个观察事物的过程和一个调查研究的过程。在这个过程中，获得结果是次要的，因为它真正的意义在于，它是探究行动的手段。”教师的“教”应该首先重视过程，其次才是结果。学生在解决问题过程中体现出来的思维转变正如同人工智能的训练数据在不同层之间前后传递修改权重的过程，越是多面向、多角度的刺激，越能活化神经元间的更多连结，建立众多因素间的因果关系，从而厚实推理的基础，强化思考的经验与习惯。

既然人工智能理解能力具备特别的优势，那么教学上就应该善用它的长处，通过人机协作让学生的学习更多地放在推理和思考两个层次。这并不是说学生就不需要学习理解了，而是在个人对事物的理解的基础上，和人工智能多面向的理解相互激荡，完善理解过程并开展后续的思维训练。教学工作应该落实在提问或学习任务的设计，以及课堂上对于推理和思考活动的引导。

下面这个简短的例子可以部分说明教师提问后的教学策略如何促进学生间的课堂对话，通过彼此交流，在【理解问题->推理解题->阐述观点->认知冲突->内化调和】的一连串过程中，完成知识的学习，同时进行思维的训练。

这是一个小学数学课堂上的教学片段。老师提问并要求学生给出自己的答案，学生第一次作答得到四个选项的回答比例分别是A60%、B24%、C15%、D1%。由于答对率只有60%，因此老师组织一次2分钟的小组交流活动，让学生相互说说自己的答案和作答理由。这个教学策略要求所有学生都参与进来，不只要能答题，还要表述为什么这样作答。为了最大化组内交流效果，必须避免同一组学生的答案都相同，因此老师打开小组答题分布图，发现第9组学生都答错，而第12小组学生都答对，便调整这两组学生的组成。

小组答题统计图

经过小组交流后老师要求学生进行再次作答，对比两次作答的数据发现学生已绝大部分能正确回答，答对比例由60%提高到93%。课后调阅数据发现，在答错的4个学生中，有2人在第一次作答时答对，第二次反而答错了，另2人是两次都答错，而且没有改变答案。

全班二次作答统计图

那么是不是提问反馈后都让学生开展小组研讨就是最好的策略呢？答案并不尽然，譬如下面这个题目的学生答题分布就不见得合适，因为学生作答集中在一个选项2上，占比75%，其余4个选项的占比较低，这就使得组织小组交流的效果不尽理想。

全班答案集中在选项2

通过数据老师“看见”了学生的思考，并据以采取合适的策略，让学生在彼此想法的激荡中学习，不止给出答案，还要说出想法，这个过程学生必须更好地组织自己的思考并表达出来。在一次次这样的训练中，使学生的思考能力逐步得到提升。

结语

罗马哲学家塞内加说：“对于一只盲目航行的船来说，所有方向的风都是逆风。”进入人工智能时代，教师不能成为“一只盲目航行的船”，否则所作所为皆为逆风而行，徒劳无功。ChatGPT-3展现了生成式人工智能的实力，标志着一个新时代的到来。即使如此，人工智能距离真正的智能，也就是通用人工智能还有相当大的差距，如同人工智能大神级人物赛巴斯汀·索朗在2017年TED年会上所说：“身为人工智能人，我坚定相信我尚未看到AI在任何真正创意上的进展，它也没有产生创造性思维。”这告诉我们，目前人们不必太过忧虑所谓的人工智能战胜人的论调，因为通用人工智能仍“处在婴儿期阶段”。

人工智能还在快速演化，唯有真正认识并了解人工智能，教师才知道如何顺着风势，发挥人和机器的优势，在彼此协作和数据的引领下，快速准确地带领学生抵达学习的高地。

注：本文收录在《教育飞翔者》季刊第二辑。