强化学习

强化学习入门笔记,主要整理 MDP、价值函数、Bellman 方程、Q-learning、Policy Gradient、Actor-Critic 以及强化学习训练中常见的问题。

2026-04-06 · 804 words · 强化学习 · MDP · Q-learning · PPO | AI笔记

深度学习

深度学习入门笔记,主要整理神经网络、损失函数、反向传播、常见网络结构以及 PyTorch 的基本训练流程。

2026-04-04 · 689 words · 深度学习 · 神经网络 · PyTorch | AI笔记