aihumanoidreinforcement-learning3d-printingsim-to-realisaac-gymopen-sourcelocomotion

Tự Build Robot Hình Người Dưới $5000 với Berkeley Humanoid Lite

Hướng dẫn chi tiết xây dựng Berkeley Humanoid Lite — robot humanoid in 3D mã nguồn mở từ UC Berkeley, 24 DOF, locomotion bằng RL sim-to-real.

Nguyễn Anh Tuấn12 tháng 4, 202612 phút đọc
Tự Build Robot Hình Người Dưới $5000 với Berkeley Humanoid Lite

Bạn muốn sở hữu một robot hình người nhưng giá các nền tảng thương mại như Unitree H1 hay Figure 02 nằm ngoài tầm với? Nhóm nghiên cứu Hybrid Robotics Lab tại UC Berkeley vừa công bố Berkeley Humanoid Lite — một nền tảng robot humanoid mã nguồn mở, in 3D hoàn toàn, chi phí dưới $5,000, có thể đi bộ bằng chính sách RL chuyển zero-shot từ simulation sang hardware thật.

Bài viết này sẽ hướng dẫn bạn từ A đến Z: từ hiểu paper gốc, chuẩn bị linh kiện, in 3D, lắp ráp, đến training RL policy và deploy lên robot thật.

Robot humanoid in 3D đang được lắp ráp trong phòng lab — minh họa quá trình build Berkeley Humanoid Lite

Tổng quan dự án

Berkeley Humanoid Lite được giới thiệu tại hội nghị RSS 2025 (Robotics: Science and Systems) với paper Demonstrating Berkeley Humanoid Lite: An Open-source, Accessible, and Customizable 3D-printed Humanoid Robot — tác giả gồm Yufeng Chi, Qiayuan Liao, Junfeng Long, Xiaoyu Huang, Sophia Shao, Borivoje Nikolic, Zhongyu Li, và Koushil Sreenath.

Tại sao dự án này đặc biệt?

Hầu hết robot humanoid nghiên cứu có giá từ $50,000 đến hàng trăm ngàn USD. Berkeley Humanoid Lite phá vỡ rào cản này bằng cách:

  • Chi phí cực thấp: ~$4,312 (mua tại Mỹ) hoặc ~$3,236 (mua từ Trung Quốc)
  • In 3D hoàn toàn: Tất cả phần cơ khí custom đều in được trên máy in FDM phổ thông (build volume 200×200×200 mm)
  • Mã nguồn mở 100%: Hardware design, embedded code, training framework — tất cả đều public
  • Sim-to-real zero-shot: Train policy trong Isaac Gym, deploy thẳng lên robot thật không cần fine-tune

Thông số kỹ thuật chính

Thông số Giá trị
Chiều cao 0.8 m
Cân nặng 16 kg
Tổng DOF 24 (12 chân + 10 tay + 2 gripper)
Actuator chân 10× M6C12 150KV BLDC (cycloidal gear 3D-printed)
Actuator tay 12× 5010 BLDC (cycloidal gear 3D-printed)
IMU BNO085 (cellphone-grade)
Máy tính chính Intel N95 Mini PC
Pin 6S 4000mAh LiPo (24V)
Thời gian hoạt động ~30 phút liên tục
Tần số điều khiển 250 Hz (actuator), 25 Hz (RL policy)

Kiến trúc hệ thống

Cơ khí: Cycloidal Gearbox in 3D

Điểm sáng tạo nhất của dự án là hộp số cycloidal in 3D bằng PLA. Tại sao không dùng planetary gear thông thường?

  • Planetary gear yêu cầu dung sai chế tạo rất chặt — in 3D bằng PLA sẽ có backlash lớn và mau hỏng
  • Cycloidal gear phân tán tải trọng qua nhiều răng đồng thời, chịu sai số in 3D tốt hơn nhiều
  • Kết quả test: transmission stiffness 319.49 Nm/rad, backlash chỉ 0.0229 rad (max), hiệu suất cơ học ~90%

Nhóm cũng dùng brass hex stands nhúng vào chi tiết in để tránh hỏng tại các lớp in (layer boundary), và gộp nhiều sub-component thành một chi tiết in duy nhất để giảm điểm tập trung ứng suất.

Hai loại actuator

Actuator 6512 (dùng cho chân — cần moment xoắn lớn):

  • Motor: MAD Components M6C12 150KV BLDC
  • Driver: B-G431B-ESC1
  • Encoder: AS5600
  • Max torque: ~20 Nm
  • Giá: ~$188/unit

Actuator 5010 (dùng cho tay — nhẹ hơn):

  • Motor: 5010 BLDC
  • Driver: B-G431B-ESC1
  • Encoder: AS5600
  • Giá: ~$136/unit

Điện tử & Giao tiếp

Intel N95 Mini PC (onboard)
    ├── USB-CAN adapter #1 → CAN bus → Chân trái (3 hip + 1 knee + 2 ankle)
    ├── USB-CAN adapter #2 → CAN bus → Chân phải
    ├── USB-CAN adapter #3 → CAN bus → Tay trái (5 DOF)
    ├── USB-CAN adapter #4 → CAN bus → Tay phải (5 DOF)
    └── USB → Arduino → BNO085 IMU

Mỗi CAN bus chạy ở 1 Mbps, hỗ trợ tối đa 64 thiết bị. Thiết kế module: mỗi actuator chỉ cần nguồn + CAN là hoạt động độc lập.

Bill of Materials — Chi phí chi tiết

Actuator 6512 (×10 unit cho chân)

Linh kiện Giá (US)
M6C12 BLDC Motor $129
B-G431B-ESC1 Driver $19
AS5600 Encoder $3
Bearings $23
Fasteners + 3D parts + cables $14
Tổng/unit $188

Actuator 5010 (×12 unit cho tay)

Linh kiện Giá (US)
5010 BLDC Motor $84
B-G431B-ESC1 Driver $19
AS5600 Encoder $3
Bearings + Fasteners + misc $30
Tổng/unit $136

Tổng chi phí robot hoàn chỉnh

Hạng mục Giá (US) Giá (Trung Quốc)
Mini PC (Intel N95) $129 $223
USB-CAN Adapters (4×) $68 $43
USB Hubs (2×) $36 $11
BNO085 IMU $13 $12
6S LiPo Battery $70 $81
10× Actuator 6512 $1,880 $1,563
12× Actuator 5010 $1,632 $1,130
Grippers (2×) $72 $44
Khung nhôm + 3D print + misc $412 $129
TỔNG $4,312 $3,236

Tip: Mua linh kiện từ Taobao/AliExpress có thể tiết kiệm ~25% so với mua tại Mỹ. Đặc biệt motor và bearings rẻ hơn đáng kể.

In 3D — Yêu cầu và quy trình

Máy in cần thiết

  • Build volume tối thiểu: 200 × 200 × 200 mm — hầu hết máy in FDM phổ thông đều đáp ứng (Ender 3, Bambu Lab A1, Prusa MK4...)
  • Vật liệu: PLA tiêu chuẩn (không cần carbon fiber hay nylon)
  • Thời gian in: Toàn bộ chi tiết custom in xong trong khoảng 1 tuần
  • Thời gian lắp ráp: ~3 ngày cho robot hoàn chỉnh

Lưu ý quan trọng khi in

  1. Kiểm tra dung sai: Cycloidal gear yêu cầu độ chính xác tương đối. In thử 1 bộ gear trước, test ăn khớp rồi mới in hàng loạt
  2. Nhúng brass inserts: Các lỗ bắt vít cần nhúng brass hex stands bằng mỏ hàn — giúp ren chắc và không bị bung lớp in
  3. Hướng in (orientation): Tuân thủ hướng in trong tài liệu gốc — ảnh hưởng trực tiếp đến độ bền theo phương chịu lực
  4. Infill: Đặt infill 40-60% cho các chi tiết chịu lực (khớp hông, đầu gối), có thể giảm xuống 20% cho vỏ ngoài

Máy in 3D FDM đang in chi tiết — minh họa quá trình chế tạo các bộ phận cơ khí cho robot

Training RL Policy với Isaac Gym

Đây là phần thú vị nhất — dạy robot đi bộ bằng Reinforcement Learning.

Cài đặt môi trường

Berkeley Humanoid Lite sử dụng Isaac Lab (phiên bản mới của Isaac Gym) làm môi trường simulation. Repository chính:

# Clone repo
git clone https://github.com/HybridRobotics/Berkeley-Humanoid-Lite.git
cd Berkeley-Humanoid-Lite

# Cấu trúc thư mục
# source/berkeley_humanoid_lite/        → IsaacLab environment & task definitions
# source/berkeley_humanoid_lite_assets/  → Robot descriptions (URDF, MJCF, USD)
# source/berkeley_humanoid_lite_lowlevel/ → Code chạy trên robot thật

Prerequisites

  • GPU: NVIDIA GPU hỗ trợ CUDA (RTX 3060 trở lên khuyến nghị)
  • Isaac Lab: Cài theo hướng dẫn chính thức của NVIDIA
  • Python: 3.8+

Hai task training

  1. Velocity-Berkeley-Humanoid-Lite-v0: Train policy điều khiển toàn bộ 22 DOF (cả tay)
  2. Velocity-Berkeley-Humanoid-Lite-Biped-v0: Chỉ điều khiển 12 DOF chân — khuyến nghị bắt đầu từ task này

Observation Space

Policy nhận vào các thông tin sau mỗi timestep:

  • Angular velocity của thân robot (từ IMU)
  • Projected gravity vector — cho biết robot đang nghiêng thế nào
  • Joint positionsjoint velocities — trạng thái 12 khớp chân
  • Commanded velocity — vận tốc mong muốn do người dùng ra lệnh
  • Previous action — action ở timestep trước (giúp smooth hành vi)

Action Space

Output của policy là desired joint positions — vị trí mong muốn cho từng khớp. Actuator controller sẽ tracking theo vị trí này bằng PD control.

Chạy training

# Training biped locomotion (12 DOF chân)
# Mặc định chạy 6000 iterations
# Thời gian: ~2 giờ trên RTX 3090

python train.py --task Velocity-Berkeley-Humanoid-Lite-Biped-v0

Thuật toán sử dụng là PPO (Proximal Policy Optimization) — thuật toán RL phổ biến nhất cho locomotion. Nếu bạn chưa quen PPO, đọc bài giới thiệu RL cơ bản trước.

Domain Randomization

Để policy chuyển được từ sim sang real (zero-shot), training có domain randomization trên:

  • Khối lượng và moment quán tính các link
  • Ma sát mặt đất
  • Độ trễ và nhiễu của actuator
  • Nhiễu sensor (IMU, encoder)

Đây là kỹ thuật chuẩn trong sim-to-real transfer cho humanoid — bằng cách train với nhiều biến thể môi trường, policy học được cách thích nghi thay vì overfit vào một simulation cụ thể.

Deploy lên Robot thật

Quy trình sim-to-real

  1. Export policy: Sau khi train xong, export model thành file ONNX hoặc TorchScript
  2. Flash firmware: Upload embedded code lên các motor driver (B-G431B-ESC1) qua CAN bus
  3. Chạy inference: Mini PC (Intel N95) chạy policy ở 25 Hz, gửi desired joint positions qua CAN bus đến từng actuator
# Deploy policy lên robot thật
# Kết nối Mini PC với CAN bus
# Chạy inference script

python deploy.py --model path/to/trained_policy.pt

Kết quả thực tế

  • Zero-shot transfer thành công: Policy train trong simulation hoạt động trực tiếp trên robot thật
  • Torque utilization: Chỉ sử dụng ~30% công suất tối đa của actuator khi đi bộ — còn rất nhiều headroom
  • Teleoperation: Hỗ trợ điều khiển từ xa qua SteamVR controllers, cả chế độ third-person và VR first-person
  • End-effector accuracy: Sai số vị trí đầu tay chỉ 3.433 mm (std) khi tracking mục tiêu

Các task đã demo thành công

  • Đi bộ bipedal với velocity tracking
  • Viết chữ bằng tay
  • Đóng gói / mở gói đồ vật
  • Giải Rubik's Cube
  • Điều khiển từ xa (teleoperation)

Độ bền — Liệu nhựa PLA có chịu nổi?

Đây là câu hỏi lớn nhất khi nghe "robot in 3D bằng PLA". Nhóm nghiên cứu đã test cực kỳ kỹ:

Test 60 giờ liên tục

  • Actuator nâng tải 0.5 kg pendulum, swing từ -45° đến +90° ở 0.5 Hz
  • Hiệu suất giảm nhẹ ban đầu rồi phục hồi về gần mức ban đầu
  • Backlash tăng không đáng kể

Test đồng nhất giữa các unit

  • 6 actuator từ 2 máy in khác nhau
  • Sai số torque tracking: chỉ ±0.5 Nm trong toàn dải hoạt động
  • Kết luận: thiết kế cycloidal gear đủ robust cho sản xuất bằng FDM

So sánh với các nền tảng khác

Berkeley Humanoid Lite đưa ra metric Performance-per-Dollar (φ) để so sánh công bằng:

$$\hat{\rho} = \frac{1}{N \cdot h \cdot m \cdot g} \sum |τ_i^{max}|$$

Trong đó N = số DOF, h = chiều cao, m = khối lượng, τ = max torque. Kết quả: Berkeley Humanoid Lite đạt φ cao hơn đáng kể so với các nền tảng thương mại có giá gấp 10-20 lần.

Tài nguyên và cộng đồng

Tài nguyên Link
Paper (arXiv) 2504.17249
Project Website lite.berkeley-humanoid.org
GitHub HybridRobotics/Berkeley-Humanoid-Lite
Documentation GitBook Docs
Cộng đồng Discord + WeChat

Lộ trình gợi ý cho người mới

Nếu bạn muốn bắt đầu build, đây là thứ tự hợp lý:

  1. Tuần 1: Đọc paper, đọc docs, lên danh sách BOM và đặt hàng linh kiện
  2. Tuần 2-3: In 3D tất cả chi tiết (chạy máy in liên tục ~1 tuần)
  3. Tuần 3-4: Lắp ráp actuator, test từng unit riêng lẻ trước khi gắn vào khung
  4. Tuần 4-5: Lắp ráp robot hoàn chỉnh, đi dây CAN bus, flash firmware
  5. Song song: Setup Isaac Lab, train RL policy (~2 giờ GPU time)
  6. Tuần 5-6: Deploy policy, calibrate, và bắt đầu cho robot đi bước đầu tiên!

Nếu bạn đang tìm hiểu về kiến trúc điều khiển humanoid hay MPC vs RL cho locomotion, những kiến thức đó sẽ giúp bạn hiểu sâu hơn tại sao Berkeley Humanoid Lite chọn RL thay vì model-based control.

Kết luận

Berkeley Humanoid Lite không chỉ là một dự án "cool" — nó là bước ngoặt trong việc dân chủ hóa nghiên cứu humanoid robotics. Với chi phí chỉ bằng một chiếc laptop gaming cao cấp, bạn có thể sở hữu và nghiên cứu trên một nền tảng humanoid robot thực sự, với full sim-to-real pipeline.

Điều quan trọng nhất: dự án này chứng minh rằng 3D-printed cycloidal gearbox đủ bền và chính xác cho ứng dụng humanoid locomotion — mở ra cánh cửa cho vô số biến thể và cải tiến từ cộng đồng.


Bài viết liên quan

NT

Nguyễn Anh Tuấn

Robotics & AI Engineer. Building VnRobo — sharing knowledge about robot learning, VLA models, and automation.

Bài viết liên quan

NEWTutorial
GEAR-SONIC: Whole-Body Control cho Humanoid Robot
humanoidwhole-body-controlnvidiareinforcement-learningmotion-trackingvr-teleoperationisaac-lab

GEAR-SONIC: Whole-Body Control cho Humanoid Robot

Hướng dẫn chi tiết GEAR-SONIC của NVIDIA — huấn luyện whole-body controller cho humanoid robot với dataset BONES-SEED và VR teleoperation.

13/4/202612 phút đọc
NEWTutorial
Genie Sim 3.0: Huấn luyện Humanoid với AGIBOT
simulationhumanoidisaac-simgenie-simagibotsim-to-realreinforcement-learning

Genie Sim 3.0: Huấn luyện Humanoid với AGIBOT

Hướng dẫn chi tiết dựng môi trường simulation với Genie Sim 3.0 — nền tảng open-source từ AGIBOT trên Isaac Sim để huấn luyện robot humanoid.

12/4/202611 phút đọc
NEWDeep Dive
WholebodyVLA Open-Source: Hướng Dẫn Kiến Trúc & Code
vlahumanoidloco-manipulationiclrrlopen-sourceisaac-lab

WholebodyVLA Open-Source: Hướng Dẫn Kiến Trúc & Code

Deep-dive vào codebase WholebodyVLA — kiến trúc latent action, LMO RL policy, và cách xây dựng pipeline whole-body loco-manipulation cho humanoid.

12/4/202619 phút đọc