数学、计算机科学与人工智能纲要¶

在线阅读: henryndubuaku.github.io/maths-cs-ai-compendium
概述¶
大多数教科书将好的思想埋没在密集的符号之下,跳过直觉,假设你已经掌握了一半的内容,并且在人工智能等快速发展的领域很快过时。这是一本开放、非传统的教科书,从零开始涵盖数学、计算机科学和人工智能。为那些希望深入理解知识、而不仅仅是为了通过考试或面试的好奇实践者而编写。
背景¶
在过去几年从事AI/ML工作的过程中,我用笔记本记录了数学、计算机科学和人工智能概念的直觉优先、结合实际、不打马虎眼的解释。2025年,几位朋友用这些笔记准备DeepMind、OpenAI、Nvidia等公司的面试。他们全部被录用,目前在工作中表现出色。而我去年也进入了Y Combinator。所以现在我把这些分享给所有人。
MCP 服务器¶
本仓库包含一个MCP服务器,允许任何AI助手(Claude Code、Cursor、VS Code等)将这本纲要作为知识库使用。它需要本地克隆该仓库。内置教育用途的工具和示例实现。
内容大纲¶
| # | 章节 | 简介 | 状态 |
|---|---|---|---|
| 01 | 向量 | 空间、模长、方向、范数、度量、点积/叉积/外积、基、对偶性 | 已完成 |
| 02 | 矩阵 | 性质、特殊类型、运算、线性变换、分解(LU、QR、SVD) | 已完成 |
| 03 | 微积分 | 导数、积分、多元微积分、泰勒近似、优化与梯度下降 | 已完成 |
| 04 | 统计学 | 描述性度量、抽样、中心极限定理、假设检验、置信区间 | 已完成 |
| 05 | 概率论 | 计数、条件概率、分布、贝叶斯方法、信息论 | 已完成 |
| 06 | 机器学习 | 经典机器学习、梯度方法、深度学习、强化学习、分布式训练 | 已完成 |
| 07 | 计算语言学 | 句法学、语义学、语用学、自然语言处理、语言模型、RNN、CNN、注意力机制、Transformer、文本扩散、文本OCR、MoE、SSM、现代LLM架构、自然语言处理评估 | 已完成 |
| 08 | 计算机视觉 | 图像处理、目标检测、分割、视频处理、SLAM、CNN、视觉Transformer、扩散模型、流匹配、VR/AR | 已完成 |
| 09 | 音频与语音 | 数字信号处理、自动语音识别、文本转语音、语音与声学活动检测、说话人分离、源分离、主动降噪、WaveNet、Conformer | 已完成 |
| 10 | 多模态学习 | 融合策略、对比学习、CLIP、视觉语言模型、图像/视频分词、跨模态生成、统一架构、世界模型 | 已完成 |
| 11 | 自主系统 | 感知、机器人学习、视觉-语言-动作模型、自动驾驶、太空机器人 | 已完成 |
| 12 | 图神经网络 | 几何深度学习、图论、GNN、图注意力机制、图Transformer、三维等变网络 | 已完成 |
| 13 | 计算与操作系统 | 离散数学、计算机体系结构、操作系统、并发、并行、编程语言 | 已完成 |
| 14 | 数据结构与算法 | 大O表示法、递归、回溯、动态规划、数组、哈希、链表、栈、树、图、排序、二分查找 | 已完成 |
| 15 | 生产级软件工程 | Linux、Git、代码库设计、测试、CI/CD、Docker、模型服务、MLOps、监控、使用编码代理的最佳实践 | 已完成 |
| 16 | SIMD与GPU编程 | 面向机器学习的C++、框架工作原理、硬件基础、ARM NEON/I8MM/SME2、x86 AVX、GPU/CUDA、Triton、TPU、RISC-V、Vulkan、WebGPU | 已完成 |
| 17 | AI推理 | 量化、高效架构、服务与批处理、边缘推理、推测解码、成本优化 | 已完成 |
| 18 | ML系统设计 | 系统基础、云计算、分布式系统、ML生命周期、特征存储、A/B测试、推荐/搜索/广告/欺诈设计实例 | 已完成 |
| 19 | 应用人工智能 | 金融、医疗健康、蛋白质、药物发现中的人工智能 | 待完成 |
| 20 | 前沿人工智能 | 量子机器学习、神经形态机器学习、去中心化人工智能、太空数据中心、脑机接口 | 待完成 |
前言¶
新生婴儿的大脑是一个新初始化的神经网络,通过现实世界的数据和经验训练直至成年……直至永远。能够用法语流利交流并拥有完美口音,意味着接触到了优秀的法语和完美口音。同样,优秀的人工智能研究员和工程师具备出色的问题解决能力,意味着他们吸收了高质量的知识并拥有丰富的经验。
科瓦舍夫实验是一项长期的塞尔维亚研究,表明为期三年的高强度创造性问题解决训练可以显著提高智力,尤其是流体智力,提升10-15个IQ点。当然,天生高IQ是真实存在的,就像优质的权重初始化能带来更好的训练效果一样——先天与后天之争的实验结果也证明了这一点。
然而,高IQ个体的真正优势仅在于能更快地学习和识别模式。但重复使用一种模式可以使任何概念都变得绝对可学。查尔斯·达尔文被他的老师和父亲认为是一个非常普通、甚至低于平均水平的学生。他自称并不机智,感觉自己像一个"慢处理器",需要时间来吸收数据。
在3到10岁之间,我的学习成绩很好,自然而然地理解概念,从不做笔记或复习。11到13岁之间我有点自大,用这种方式在一个80人的班级中跌到了下半部分。14到15岁之间,我开始像普通学生一样读书,在中学最后一个学期取得了第一名。早期学校课程与自然IQ配合得很好,但现实世界的才华源于高质量的知识摄入和执行力度。
事实上,大多数学习成绩好的学生只是更勤奋,但学术系统是为快速学习者设计的。这本纲要提供了一个全面且相互关联的知识流,以帮助世界上那些"达尔文们"更好地学习。你只需要初等数学基础和基本的Python编程知识,其他一切都会逐步掌握——只需阅读并相信这个过程!
如何更好地学习¶
大学第一学期,我同时选了17门课,成绩并不理想,于是我采用了一个技巧:
第一阶段:课后累积阅读 只阅读每张幻灯片/笔记的标题/大标题,合上书,然后在脑海中可视化并写出对该概念的解释。只重读你遗漏的部分,类似于机器学习中的掩码语言建模。重读之后,最终将概念用代码实现。这样你就能对每个概念形成肌肉记忆。
第二阶段:考前影子阅读 阅读每张幻灯片/笔记的副标题,合上书,然后在脑海中可视化并写出对该概念的解释。只重读你遗漏的部分,类似于机器学习中的掩码语言建模。重读之后,最终将概念用代码实现。这样你就能对每个概念形成肌肉记忆。
这个方法对我不太自信的朋友们非常有效。事实上,其中一位朋友在高等工程数学(涵盖海森矩阵和优化)这门课上超过了我。她现在在一家大型石油天然气公司工作。灵魂的意愿比我们与之工作的身体更重要(罗森塔尔实验)。
关于作者¶
查看GitHub个人资料!