Colby豆布斯

107 subscribers

10 videos

View on YouTube

Hi, I’m Colby. I study how machines learn to make decisions—from Reinforcement Learning to LLMs and RAG systems. On this channel, I break down complex AI ide...

Latest Videos

RL106 World Models for LLM Agents (RWML Explained)

RL106 World Models for LLM Agents (RWML Explained)

Colby豆布斯

27 views·2 days ago

Diffusion Transformers (DiT) Explained Replacing U-Nets with Transformers

Diffusion Transformers (DiT) Explained Replacing U-Nets with Transformers

Colby豆布斯

12 views·1 week ago

Reinforcement Learning 105 RLHF & Reinforcement Fine-Tuning Explained

Reinforcement Learning 105 RLHF & Reinforcement Fine-Tuning Explained

Colby豆布斯

19 views·2 weeks ago

Reinforcement Learning 104 Scaling RL (PPO, CISPO & Agent Systems)

Reinforcement Learning 104 Scaling RL (PPO, CISPO & Agent Systems)

Colby豆布斯

16 views·3 weeks ago

Reinforcement Learning 103 Actor-Critic Explained (Why PPO Works)

Reinforcement Learning 103 Actor-Critic Explained (Why PPO Works)

Colby豆布斯

12 views·1 month ago

RL 102 Two Ways to Learn — Value Functions & Policies

RL 102 Two Ways to Learn — Value Functions & Policies

Colby豆布斯

28 views·1 month ago

Reinforcement Learning Explained (RL 101 Intuition, MDP, Policy, Value)

Reinforcement Learning Explained (RL 101 Intuition, MDP, Policy, Value)

Colby豆布斯

54 views·1 month ago

Hackathon Brief Demo

Hackathon Brief Demo

Colby豆布斯

17 views·1 year ago

Recommendation For Uber Eats Lecture

Recommendation For Uber Eats Lecture

Colby豆布斯

72 views·1 year ago

Full Lecture 3

Full Lecture 3

Colby豆布斯

3.4K views·2 years ago

Colby豆布斯 - NatokHD | NatokHD