跳转至

数学、计算机科学与人工智能纲要

Logo

在线阅读: henryndubuaku.github.io/maths-cs-ai-compendium

概述

大多数教科书将好的思想埋没在密集的符号之下,跳过直觉,假设你已经掌握了一半的内容,并且在人工智能等快速发展的领域很快过时。这是一本开放、非传统的教科书,从零开始涵盖数学、计算机科学和人工智能。为那些希望深入理解知识、而不仅仅是为了通过考试或面试的好奇实践者而编写。

背景

在过去几年从事AI/ML工作的过程中,我用笔记本记录了数学、计算机科学和人工智能概念的直觉优先、结合实际、不打马虎眼的解释。2025年,几位朋友用这些笔记准备DeepMind、OpenAI、Nvidia等公司的面试。他们全部被录用,目前在工作中表现出色。而我去年也进入了Y Combinator。所以现在我把这些分享给所有人。

MCP 服务器

本仓库包含一个MCP服务器,允许任何AI助手(Claude Code、Cursor、VS Code等)将这本纲要作为知识库使用。它需要本地克隆该仓库。内置教育用途的工具和示例实现。

内容大纲

# 章节 简介 状态
01 向量 空间、模长、方向、范数、度量、点积/叉积/外积、基、对偶性 已完成
02 矩阵 性质、特殊类型、运算、线性变换、分解(LU、QR、SVD) 已完成
03 微积分 导数、积分、多元微积分、泰勒近似、优化与梯度下降 已完成
04 统计学 描述性度量、抽样、中心极限定理、假设检验、置信区间 已完成
05 概率论 计数、条件概率、分布、贝叶斯方法、信息论 已完成
06 机器学习 经典机器学习、梯度方法、深度学习、强化学习、分布式训练 已完成
07 计算语言学 句法学、语义学、语用学、自然语言处理、语言模型、RNN、CNN、注意力机制、Transformer、文本扩散、文本OCR、MoE、SSM、现代LLM架构、自然语言处理评估 已完成
08 计算机视觉 图像处理、目标检测、分割、视频处理、SLAM、CNN、视觉Transformer、扩散模型、流匹配、VR/AR 已完成
09 音频与语音 数字信号处理、自动语音识别、文本转语音、语音与声学活动检测、说话人分离、源分离、主动降噪、WaveNet、Conformer 已完成
10 多模态学习 融合策略、对比学习、CLIP、视觉语言模型、图像/视频分词、跨模态生成、统一架构、世界模型 已完成
11 自主系统 感知、机器人学习、视觉-语言-动作模型、自动驾驶、太空机器人 已完成
12 图神经网络 几何深度学习、图论、GNN、图注意力机制、图Transformer、三维等变网络 已完成
13 计算与操作系统 离散数学、计算机体系结构、操作系统、并发、并行、编程语言 已完成
14 数据结构与算法 大O表示法、递归、回溯、动态规划、数组、哈希、链表、栈、树、图、排序、二分查找 已完成
15 生产级软件工程 Linux、Git、代码库设计、测试、CI/CD、Docker、模型服务、MLOps、监控、使用编码代理的最佳实践 已完成
16 SIMD与GPU编程 面向机器学习的C++、框架工作原理、硬件基础、ARM NEON/I8MM/SME2、x86 AVX、GPU/CUDA、Triton、TPU、RISC-V、Vulkan、WebGPU 已完成
17 AI推理 量化、高效架构、服务与批处理、边缘推理、推测解码、成本优化 已完成
18 ML系统设计 系统基础、云计算、分布式系统、ML生命周期、特征存储、A/B测试、推荐/搜索/广告/欺诈设计实例 已完成
19 应用人工智能 金融、医疗健康、蛋白质、药物发现中的人工智能 待完成
20 前沿人工智能 量子机器学习、神经形态机器学习、去中心化人工智能、太空数据中心、脑机接口 待完成

前言

新生婴儿的大脑是一个新初始化的神经网络,通过现实世界的数据和经验训练直至成年……直至永远。能够用法语流利交流并拥有完美口音,意味着接触到了优秀的法语和完美口音。同样,优秀的人工智能研究员和工程师具备出色的问题解决能力,意味着他们吸收了高质量的知识并拥有丰富的经验。

科瓦舍夫实验是一项长期的塞尔维亚研究,表明为期三年的高强度创造性问题解决训练可以显著提高智力,尤其是流体智力,提升10-15个IQ点。当然,天生高IQ是真实存在的,就像优质的权重初始化能带来更好的训练效果一样——先天与后天之争的实验结果也证明了这一点。

然而,高IQ个体的真正优势仅在于能更快地学习和识别模式。但重复使用一种模式可以使任何概念都变得绝对可学。查尔斯·达尔文被他的老师和父亲认为是一个非常普通、甚至低于平均水平的学生。他自称并不机智,感觉自己像一个"慢处理器",需要时间来吸收数据。

在3到10岁之间,我的学习成绩很好,自然而然地理解概念,从不做笔记或复习。11到13岁之间我有点自大,用这种方式在一个80人的班级中跌到了下半部分。14到15岁之间,我开始像普通学生一样读书,在中学最后一个学期取得了第一名。早期学校课程与自然IQ配合得很好,但现实世界的才华源于高质量的知识摄入和执行力度。

事实上,大多数学习成绩好的学生只是更勤奋,但学术系统是为快速学习者设计的。这本纲要提供了一个全面且相互关联的知识流,以帮助世界上那些"达尔文们"更好地学习。你只需要初等数学基础和基本的Python编程知识,其他一切都会逐步掌握——只需阅读并相信这个过程!

如何更好地学习

大学第一学期,我同时选了17门课,成绩并不理想,于是我采用了一个技巧:

第一阶段:课后累积阅读 只阅读每张幻灯片/笔记的标题/大标题,合上书,然后在脑海中可视化并写出对该概念的解释。只重读你遗漏的部分,类似于机器学习中的掩码语言建模。重读之后,最终将概念用代码实现。这样你就能对每个概念形成肌肉记忆。

第二阶段:考前影子阅读 阅读每张幻灯片/笔记的副标题,合上书,然后在脑海中可视化并写出对该概念的解释。只重读你遗漏的部分,类似于机器学习中的掩码语言建模。重读之后,最终将概念用代码实现。这样你就能对每个概念形成肌肉记忆。

这个方法对我不太自信的朋友们非常有效。事实上,其中一位朋友在高等工程数学(涵盖海森矩阵和优化)这门课上超过了我。她现在在一家大型石油天然气公司工作。灵魂的意愿比我们与之工作的身体更重要(罗森塔尔实验)。

关于作者

查看GitHub个人资料!

引用

@book{ndubuaku2025compendium,
  title     = {Maths, CS & AI Compendium},
  author    = {Henry Ndubuaku},
  year      = {2026},
  publisher = {GitHub},
  url       = {https://github.com/HenryNdubuaku/maths-cs-ai-compendium}
}