← Quay lại Blog
researchresearchconferencerobotics

ICRA 2026 Preview: 5 nghiên cứu đáng chú ý nhất

Tổng hợp 5 paper nổi bật được accept tại ICRA 2026 Vienna — từ humanoid locomotion đến foundation models cho manipulation.

Nguyễn Anh Tuấn3 tháng 2, 20269 phút đọc
ICRA 2026 Preview: 5 nghiên cứu đáng chú ý nhất

ICRA 2026 sắp diễn ra tại Vienna

Hội nghị IEEE International Conference on Robotics and Automation (ICRA) 2026 sẽ diễn ra từ ngày 1-5 tháng 6 tại Vienna, Áo — lần đầu tiên ICRA đến thủ đô âm nhạc của châu Âu. Với vai trò là hội nghị robotics lớn nhất thế giới, ICRA 2026 hứa hẹn thu hút hàng nghìn nhà nghiên cứu và kỹ sư với chương trình bao gồm plenary sessions, workshops, tutorials, robot competitions và triển lãm từ các đối tác công nghiệp.

Năm nay, General Chair là Prof. Markus Vincze từ TU Wien — một tên tuổi lớn trong robot perception và manipulation tại châu Âu. Các workshops đáng chú ý bao gồm "From Data to Decisions: VLA Pipelines for Real Robots" do AIRoA tổ chức với dữ liệu robot thực tế lên đến 10,000 giờ, Workshop on Field Robotics tập trung vào autonomous systems trong môi trường nông nghiệp và xây dựng, cùng Workshop on Robot Perception trong unstructured environments.

Trong bài viết này, tôi tổng hợp 5 paper nổi bật nhất mà các kỹ sư robotics Việt Nam nên đọc trước khi hội nghị diễn ra — mỗi paper đại diện cho một hướng nghiên cứu quan trọng.

Robotics research đang bùng nổ với foundation models và sim-to-real

1. GR00T N1: Foundation Model cho Humanoid Robots

GR00T N1: An Open Foundation Model for Generalist Humanoid Robots — NVIDIA et al., 2025

GR00T N1 là bước đi táo bạo của NVIDIA trong cuộc đua foundation models cho robotics. Đây là một Vision-Language-Action (VLA) model với kiến trúc dual-system: System 2 (vision-language module) giải thích môi trường qua vision và language instructions, còn System 1 (diffusion transformer module) sinh ra motor actions mượt mà trong real-time. Cả hai module được coupled chặt chẽ và train end-to-end.

Điểm đáng chú ý nhất là cross-embodiment support — GR00T N1 hoạt động từ tabletop robot arms đến dexterous humanoid robots. Model được deploy thành công trên Fourier GR-1 humanoid cho language-conditioned bimanual manipulation tasks. Training data bao gồm real-robot trajectories, human videos, và synthetic datasets — một chiến lược data heterogeneity đang trở thành chuẩn mực.

Tại sao quan trọng: NVIDIA đã open-source model checkpoint (2B parameters), training data và simulation benchmarks trên GitHub và HuggingFace. Điều này có nghĩa các lab và startup tại Việt Nam có thể bắt đầu thử nghiệm ngay mà không cần infrastructure khổng lồ. Phiên bản cập nhật GR00T N1.6 với cải thiện performance cũng đã có sẵn.

Takeaway cho kỹ sư

GR00T N1 là điểm xuất phát tốt nhất hiện tại nếu bạn muốn thử nghiệm VLA model cho humanoid robots. Weights, code, và data đều public — chỉ cần GPU đủ mạnh là có thể bắt đầu fine-tune cho use case cụ thể.

2. FALCON: Force-Adaptive Humanoid Loco-Manipulation

FALCON: Learning Force-Adaptive Humanoid Loco-Manipulation — LeCAR Lab, 2025

Loco-manipulation — kết hợp di chuyển và thao tác vật thể cùng lúc — là một trong những thách thức khó nhất cho humanoid robots. FALCON giải quyết vấn đề này bằng dual-agent reinforcement learning: một lower-body agent đảm bảo stable locomotion khi chịu external force, và một upper-body agent tracking end-effector positions với implicit adaptive force compensation.

Kết quả thực tế ấn tượng: cùng một training setup, policies được deploy trên nhiều humanoid robots khác nhau, thực hiện các tasks như vận chuyển payload (0-20N), kéo xe đẩy (0-100N), và mở cửa (0-40N) trong real world. Phương pháp decomposition — tách riêng locomotion và manipulation rồi phối hợp — chứng tỏ hiệu quả hơn hẳn end-to-end approaches.

Tại sao quan trọng: FALCON chứng minh rằng force-adaptive control là then chốt cho real-world deployment. Trong môi trường công nghiệp Việt Nam, nơi robots cần di chuyển và thao tác trong không gian không hoàn hảo, khả năng thích ứng với lực tác động bên ngoài là yêu cầu bắt buộc.

Takeaway cho kỹ sư

Dual-agent decomposition (lower-body + upper-body) là design pattern đáng học hỏi. Thay vì cố gắng train một monolithic policy cho toàn bộ body, hãy chia nhỏ bài toán và phối hợp các specialized agents.

3. Sim-to-Real RL cho Dexterous Manipulation trên Humanoids

Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids — 2025

Paper này đưa ra một "recipe" thực tế cho sim-to-real RL trên humanoid robots — không chỉ là proof-of-concept mà là pipeline có thể reproduce. Humanoid robot được train thực hiện ba challenging tasks: grasp-and-reach, box lift, và bimanual handover.

Bốn đóng góp chính làm nên sự khác biệt: (1) automated real-to-sim tuning module tự động calibrate simulation parameters, (2) generalized reward formulation dựa trên contact và object goals, (3) divide-and-conquer policy distillation framework giúp train từng sub-task rồi combine, và (4) hybrid object representation strategy với modality-specific augmentation để bridge reality gap.

Tại sao quan trọng: Đây không phải là paper về một thuật toán mới — mà là về quy trình hoàn chỉnh để đưa dexterous manipulation từ simulation ra robot thật. Mỗi component đều có ablation study chi tiết, giúp bạn hiểu tại sao từng bước lại cần thiết.

Takeaway cho kỹ sư

Nếu bạn đang làm sim-to-real cho manipulation, paper này là "cookbook" nên đọc. Automated real-to-sim tuning là bước thường bị bỏ qua nhưng có impact lớn nhất đến transfer performance.

4. XHugWBC: Cross-Humanoid Whole-Body Control

Scalable and General Whole-Body Control for Cross-Humanoid Locomotion — 2026

Một trong những rào cản lớn nhất của humanoid robotics là mỗi robot có kiến trúc cơ khí khác nhau — khác số khớp, khác tỷ lệ, khác dynamics. XHugWBC giải quyết bài toán này bằng cross-embodiment training framework: một policy duy nhất generalize được cho nhiều humanoid robots khác nhau với zero-shot transfer.

Ba yếu tố then chốt: (1) physics-consistent morphological randomization — randomize cấu trúc robot trong quá trình training, (2) semantically aligned observation và action spaces — chuẩn hóa input/output cho diverse robots, và (3) policy architectures mô hình hóa morphological và dynamical properties. Kết quả: policy generalize thành công sang 7 humanoid robots với kinematic, dynamic và morphological structures hoàn toàn khác nhau.

Tại sao quan trọng: Cross-embodiment là tương lai — thay vì train riêng cho từng robot, ta train một lần và deploy everywhere. Điều này đặc biệt relevant khi thị trường humanoid robots đang explosive với nhiều manufacturers (Unitree, Fourier, Figure, Tesla).

Takeaway cho kỹ sư

Semantically aligned observation/action spaces là key insight. Khi bạn design robot learning pipeline, hãy nghĩ về cách abstract hóa robot-specific details ngay từ đầu để dễ transfer sang platforms khác sau này.

5. DeepFleet: Multi-Agent Foundation Models cho Mobile Robots

DeepFleet: Multi-Agent Foundation Models for Mobile Robots — 2025

Không phải tất cả nghiên cứu hot đều về humanoids — fleet management cho mobile robots vẫn là bài toán có impact thương mại lớn nhất. DeepFleet giới thiệu một suite gồm bốn model architectures để học cách fleet robots di chuyển trong structured warehouse environments.

Trong số các architectures, robot-centric modelgraph-floor model cho kết quả tốt nhất nhờ sử dụng asynchronous robot state updates và incorporate localized structure of robot interactions. Thay vì centralized planning truyền thống, DeepFleet cho phép mỗi robot đưa ra quyết định dựa trên local information và learned fleet dynamics — giảm communication overhead đáng kể.

Tại sao quan trọng: Warehouse automation là market lớn nhất của robotics tại Việt Nam hiện nay. Các công ty logistics như Lazada, Shopee, Viettel Post đều đang đầu tư vào AMR/AGV. DeepFleet cung cấp foundation cho thế hệ tiếp theo của fleet coordination — intelligent hơn rule-based systems hiện tại.

Takeaway cho kỹ sư

Graph-based representations cho fleet coordination là hướng đi đúng — chúng capture được spatial relationships giữa robots mà flat vector representations bỏ lỡ. Nếu bạn đang làm multi-robot systems, hãy xem thêm bài viết Robot Fleet Management: Giải pháp quản lý đội robot để hiểu thêm context.

Hội nghị ICRA là nơi quy tụ những nghiên cứu robotics hàng đầu thế giới

Xu hướng xuyên suốt tại ICRA 2026

Nhìn tổng thể 5 papers trên, ba xu hướng nổi bật:

Foundation Models everywhere

Từ GR00T N1 cho humanoid manipulation đến DeepFleet cho fleet coordination, foundation models đang lan tỏa sang mọi khía cạnh của robotics. Điểm chung: train trên large-scale heterogeneous data, rồi fine-tune hoặc zero-shot transfer cho specific tasks.

Cross-embodiment là chuẩn mực mới

XHugWBC và GR00T N1 đều nhấn mạnh khả năng hoạt động trên nhiều robot platforms. Thời đại "một model cho một robot" đang kết thúc — tương lai thuộc về generalist policies.

Sim-to-real pipeline hoàn thiện hơn

FALCON và paper sim-to-real RL cho thấy pipeline từ simulation đến real robot đã đủ mature để sản xuất kết quả đáng tin cậy. Automated tuning và domain randomization không còn là "black art" mà là engineering discipline.

Lời khuyên trước ICRA 2026

  1. Đọc papers trước khi xem talks — bạn sẽ hiểu sâu hơn nhiều khi đã nắm được context
  2. Tập trung vào workshops — workshops là nơi có discussions chất lượng nhất, đặc biệt VLA Pipelines workshop năm nay
  3. Networking tại poster sessions — đây là cơ hội tốt nhất để hỏi trực tiếp tác giả về implementation details
  4. Theo dõi livestream — ICRA thường stream các plenary talks, rất hữu ích nếu bạn không thể đến Vienna

Nếu bạn muốn nắm vững nền tảng trước khi đi sâu vào các papers trên, hãy đọc bài tổng hợp Top nghiên cứu Robotics 2024-2025 để hiểu bối cảnh nghiên cứu rộng hơn. Những ai quan tâm đến humanoid robots cũng nên xem Hướng dẫn toàn diện về Humanoid Robotics.

Bài viết liên quan

Bài viết liên quan

IROS 2026: Papers navigation và manipulation đáng theo dõi
researchconferencerobotics

IROS 2026: Papers navigation và manipulation đáng theo dõi

Phân tích papers nổi bật về autonomous navigation và manipulation — chuẩn bị cho IROS 2026 Pittsburgh.

2/4/20267 phút đọc
Sim-to-Real Transfer: Train simulation, chạy thực tế
ai-perceptionresearchrobotics

Sim-to-Real Transfer: Train simulation, chạy thực tế

Kỹ thuật chuyển đổi mô hình từ simulation sang robot thật — domain randomization, system identification và best practices.

1/4/202612 phút đọc
IROS 2026 Preview: Những gì đáng chờ đợi
researchconferencerobotics

IROS 2026 Preview: Những gì đáng chờ đợi

IROS 2026 Pittsburgh — preview workshops, competitions và nghiên cứu navigation, manipulation hàng đầu.

30/3/20267 phút đọc