2024年的第一个月,看了一下计算机书籍的榜单,本周有这样几本新书上榜。
1、GPT图解 大模型是怎样构建的
带你从0到1构建大模型,突破语言奥秘,开启智能未来!深入探索自然语言处理技术的核心原理,结合实战,让你成为AI领域的语言模型构建达人!
这 一 本小书,希望从纯技术的角度,为你梳理生成式语言模型的发展脉络,对 从 N-Gram、Bag-of-Word、Word2Vec、NPLM、RNN、S2S、Attention、 Transformer、BERT 到 GPT 的技术一一进行解码,厘清它们的传承关系。
本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2S),注意力机制,Transformer,从初代GPT到ChatGPT再到GPT-4等一系列突破性技术的诞生与演进。
本书将以生动活泼的笔触,将枯燥的技术细节化作轻松幽默的故事和缤纷多彩的图画,引领读者穿梭于不同技术的时空,见证自然语言处理技术的传承、演进与蜕变。在这场不断攀登技术新峰的奇妙之旅中,读者不仅能深入理解自然语言处理技术的核心原理,还能自己动手,从零开始搭建起一个又一个语言模型。
无论你是在校学生还是人工智能从业者,这本书都将成为一盏明灯,照亮你探索人工智能无限奥秘的道路。
2、互联网大厂推荐算法实战
快手公司算法专家10余年的实战经验总结。涵盖一线互联网公司当前采用的主流推荐算法,凸显可用性、实用性提供从算法基本原理,到技术框架再到核心源码的解决方案。
正如本书的书名所述,“实战”是本书最大的特点,具体体现在如下3个方面。
■本书所讲的都是各互联网大厂当下主流的推荐算法。本书不会讲述协调过滤、矩阵分解这 类“经典但过时”的算法,尽管它们当下仍可能有用武之地,但绝非互联网大厂的主力算 法,也不是面试时的考察重点。另外,针对一些著名的前沿算法,由于其实现相当复杂, 复现效果也比较有争议,且不是业界主流算法,因此本书也没有在它们身上浪费笔墨。
■本书除了讲解最基本的算法原理,还聚焦于算法工程师的工作实际,关注他们日常遇到 的实际难题。比如,新用户与新物料怎么冷启动?如何打开模型的黑盒,以排查问题或 找到下一步升级改进的方向?线下AUC 涨了,但是线上AB 实验的指标却不涨!这到底 是什么原因造成的? ……
由于算法工程师也属于广义上的程序员,所以源代码才是最清晰直接的说明文档。为此, 本书针对核心算法都提供了相应的源代码。同时,限于篇幅,书中仅对核心代码进行了 展示,而且给出了相应的注释,以帮助读者彻底理解算法的重要细节。
《互联网大厂推荐算法实战》总计10章,内容涵盖了推荐系统的基础知识、推荐系统中的特征工程、推荐系统中的Embedding、推荐系统的各组成模块(包括召回、粗排、精排与重排)所使用的算法技术、推荐算法实践中经常会遇到的难题以及应对之道(其中涉及多任务推荐、多场景推荐、新用户冷启动、新物料冷启动、评估模型效果、定位并解决问题等),最后还用一章的篇幅介绍了推荐算法工程师在工作、学习、面试时应该采取的做法。
《互联网大厂推荐算法实战》既适合推荐系统、计算广告、个性化搜索领域的从业人员阅读,也适合希望从事互联网算法工作的在校学生阅读。
3、AIGC自动化编程:基于ChatGPT和GitHub Copilot
基于ChatGPT、GitHubCopilot、Claude2、AmazonCodeWhisperer等,介绍如何实现自动化编程,提升工作效率。
本书为读者提供了一次深入探索人工智能和自动化编程的奇妙之旅。全书从AI(Artificial Intelligence,人工智能)的基本概念和背景入手,逐渐深入到如何使用具有代表性的AIGC工具—ChatGPT、GitHub Copilot和Claude2等进行自动化编程。此外,本书还详细介绍了其他多种AI代码生成解决方案。针对桌面应用、Web应用、游戏、办公自动化等场景,本书还提供了丰富的实例。
本书适合对AI和自动化编程感兴趣的初学者阅读,也适合有一定基础并且想要提高开发技能的程序员阅读。同时,本书也可以作为高校或培训机构的参考书。
4、高级算法和数据结构
一本关于"高级/进阶"算法和数据结构的书,主要介绍了用于Web应用程序、系统编程和数据处理领域的各种算法。
这是一本关于“高级 进阶”算法和数据结构的图书,主要介绍了用于Web应用程序、系统编程和数据处理领域的各种算法,旨在让读者了解如何用这些算法应对各种棘手的编码挑战,以及如何将其应用于具体问题,以应对新技术浪潮下的“棘手”问题。
本书对一些广为人知的基本算法进行了扩展,还介绍了用于改善优先队列、有效缓存、对数据进行集群等的技术,以期读者能针对不同编程问题选出更好的解决方案。书中示例大多辅以图解,并以不囿于特定语言的伪代码以及多种语言的代码样本加以闸释。
学完本书,读者可以了解高级算法和数据结构的相关内容,并能运用这些知识让代码具备更优性能,甚至能够独立设计数据结构,应对需要自定义解决方案的情况。
本书可作为高等院校计算机相关专业本科高年级学生以及研究生的学习用书,也可供从事与算法相关工作的开发者参考。
5、C++ Templates(第2版)中文版
C++领域热门图书新升级,详细介绍模板技术,针对新标准更新内容,帮助读者深入理解C++模板技术,掌握简洁、易维护的软件开发之道。
本书是一本全面介绍C++模板技术的图书,主要内容涵盖C++模板的基础概念、语言细节、编程技巧、高级应用以及实用示例等。本书针对C++11、C++14、C++17标准进行了内容更新,并对很多新语言特性(包括变量模板、泛型lambda、类模板参数推导等)给出详细解释。通过阅读本书,读者可以深入理解C++模板技术,掌握开发有效、简洁且易维护的软件的原因、时机和方法。
本书内容丰富,架构清晰,讲解翔实,适合对C++模板技术感兴趣的开发人员或爱好者阅读。
6、人工智能(第3版)
美国经典人工智能教材第3版,人工智能的百科全书,新增深度学习及人工智能编程等内容,理论阐释结合动手实践,附赠PPT课件、配套视频及代码文件。
本书包括引言、基础知识、基于知识的系统、人工智能高级专题、人工智能的现在和未来以及安全与编程六部分内容。第一部分从人工智能的定义讲起,对人工智能的早期历史、思维和智能的内涵、图灵测试、启发式方法、新千年人工智能的发展进行了简要论述。第二部分详细讲述了人工智能中的盲目搜索、知情搜索、博弈中的搜索、人工智能中的逻辑、知识表示和产生式系统等基础知识。第三部分介绍并探究了人工智能领域的成功案例,如DENDRAL、MYCIN、EMYCIN 等经典的专家系统,振动故障诊断、自动牙科识别等新的专家系统,也介绍了机器学习、深度学习以及受到自然启发的搜索算法等。第四部分介绍了自然语言处理和自动规划等高级专题。第五部分对人工智能的历史和现状进行了梳理,回顾了几十年来人工智能所取得的诸多成就,并对其未来进行了展望。第六部分主要介绍人工智能的安全以及编程问题。
7、深入理解软件性能——一种动态视角
基于作者在软件性能优化领域丰富的经验,系统介绍了适用于多种环境的软件性能优化原则和技术,有助于读者理解复杂软件的动态,提高软件的可靠性,解决棘手的性能问题。
本书不仅介绍了如何测量CPU、内存、磁盘/SSD、网络的性能,如何观察、记录、跟踪、汇总性能指标,还讨论了如何设计和创建性能测试工具KUtrace,以及如何对观察结果进行推理。
本书不仅适合软件开发人员阅读,还适合计算机相关专业的师生参考。