RSS 2026: Hội nghị robotics chất lượng nhất đến Sydney
Robotics: Science and Systems (RSS) 2026 — phiên bản thứ 22 — sẽ diễn ra từ ngày 13-17 tháng 7 tại University of Technology Sydney, Australia. Nếu ICRA là hội nghị lớn nhất, thì RSS là hội nghị chất lượng nhất trong robotics: single-track format đảm bảo mọi attendee đều nghe cùng presentations, acceptance rate thấp hơn nhiều so với ICRA, và mỗi paper đều qua peer review nghiêm ngặt.
Năm nay, RSS đến khu vực Asia-Pacific lần đầu tiên sau nhiều năm — cơ hội tuyệt vời cho cộng đồng robotics Việt Nam tiếp cận hội nghị top-tier mà không cần bay sang Mỹ hay châu Âu. Workshops diễn ra vào thứ Hai 13/7 (buổi sáng half-day) và thứ Sáu 17/7 (hai half-day events), với phần chính hội nghị từ thứ Ba đến thứ Năm.
Bài viết này preview các hướng nghiên cứu đáng chú ý nhất mà bạn có thể mong đợi tại RSS 2026, dựa trên xu hướng từ ICRA 2026 và các papers gần đây trên arXiv.
Hướng nghiên cứu 1: Vision-Language-Action Models thế hệ mới
RSS luôn là nơi ra mắt những breakthroughs lớn nhất trong robot learning. Năm 2024, Octo ra mắt tại RSS và trở thành baseline cho mọi VLA research sau đó. Năm nay, thế hệ tiếp theo của VLA models sẽ chiếm sóng.
Từ pi-0 đến pi-0.5: Open-World Generalization
pi-0 từ Physical Intelligence đã là game-changer khi chứng minh một model có thể control nhiều robot configurations cho 68 tasks khác nhau. Nhưng pi-0.5 đưa mọi thứ lên tầm cao mới: robot có thể dọn dẹp bếp và phòng ngủ trong nhà hoàn toàn mới, chưa từng thấy.
Key innovation là co-training trên heterogeneous data sources: multiple robots, semantic predictions, web data, và object detections. RSS 2026 sẽ có nhiều papers follow-up theo hướng này — đặc biệt về data scaling laws và transfer efficiency.
GR00T N1: NVIDIA's Open-Source Push
GR00T N1 với dual-system architecture (vision-language reasoning + diffusion transformer actions) đã được open-source hoàn toàn. RSS community, vốn thiên về reproducibility và open science, sẽ có nhiều papers building on top of GR00T — từ fine-tuning cho specific tasks đến scaling lên embodiments mới.
Dự đoán: RSS 2026 sẽ có ít nhất 5-10 papers sử dụng GR00T N1 hoặc pi-0 làm baseline, cho thấy sự consolidation của VLA research quanh một số foundation models chính.
Hướng nghiên cứu 2: Sim-to-Real Transfer tinh vi hơn
RSS đã chứng kiến nhiều milestones trong sim-to-real, từ DrEureka (LLM-guided reward design) đến Humanoid-Gym (zero-shot locomotion transfer). Năm 2026, research chuyển sang hai hướng mới.
World Models cho Sim-to-Real
World Models Can Leverage Human Videos for Dexterous Manipulation — DexWM — là paper đặc biệt thú vị. Thay vì chỉ dùng simulation data, DexWM train world model từ human videos rồi optimize actions qua MPC framework. Kết quả: 83% success rate cho object grasping trên real Franka Panda + Allegro gripper — zero-shot từ human video data.
Hướng này rất promising vì human video data gần như unlimited trên Internet, trong khi robot demonstration data vẫn expensive và scarce. RSS 2026 sẽ có nhiều papers exploring human-to-robot transfer via world models.
Automated Real-to-Sim Calibration
Paper Sim-to-Real RL for Vision-Based Dexterous Manipulation on Humanoids đã giới thiệu automated real-to-sim tuning module — tự động calibrate simulation parameters để khớp với real world. Đây là shift quan trọng: thay vì hand-tune domain randomization ranges, ta tự động hóa quá trình này.
Dự đoán: "Automated sim gap reduction" sẽ là keyword tại nhiều presentations. Các tools như NVIDIA Isaac Lab sẽ tích hợp sẵn automated calibration, biến sim-to-real từ art thành engineering.
Hướng nghiên cứu 3: Dexterous Manipulation nâng cao
RSS đặc biệt mạnh về manipulation research — từ DexGraspNet đến AnyRotate, nhiều breakthroughs trong lĩnh vực này đều debut tại RSS. Năm nay, ba hướng sẽ nổi bật.
In-Hand Manipulation với Tactile Feedback
In-Hand Manipulation of Articulated Tools with Dexterous Robot Hands with Sim-to-Real Transfer đưa manipulation lên tầm mới: không chỉ grasp objects mà còn manipulate articulated tools — like scissors, pliers — bằng tay robot. Pipeline kết hợp simulation-trained base policy với sensor-driven refinement từ hardware demonstrations, sử dụng cross-attention cho tactile và force feedback.
Đây là research direction rất relevant cho manufacturing tại Việt Nam — nơi robot cần handle nhiều loại tools khác nhau trong assembly lines.
Zero-Shot Grasping với Tactile Simulation
Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping là lần đầu tiên controllable grasping trên multi-finger hand được train hoàn toàn trong simulation rồi transfer zero-shot sang real hardware. Key contribution là computationally fast tactile simulation tính toán distances giữa dense virtual tactile units và object qua parallel forward kinematics — cung cấp high-rate, high-resolution touch signals cho RL.
3D World Models cho Multi-Material Manipulation
ParticleFormer: A 3D Point Cloud World Model for Multi-Object, Multi-Material Robotic Manipulation giải quyết bài toán cực khó: manipulation với nhiều vật liệu khác nhau (rigid, deformable, flexible) trong cùng một scene. Transformer-based world model train trực tiếp từ real-world perception data, capture fine-grained interactions giữa materials.
Dự đoán: Tactile-aware manipulation sẽ là major theme tại RSS 2026. Giá tactile sensors đang giảm (GelSight Mini ~$300), làm cho research direction này accessible hơn.
Hướng nghiên cứu 4: Navigation với Foundation Models
Embodied Navigation Foundation Model
NavFoM: Embodied Navigation Foundation Model là paper đáng chú ý: một navigation model đạt SOTA trên diverse benchmarks cho multiple embodiments (humanoids, quadrupeds, drones, wheeled robots) mà không cần task-specific fine-tuning. Real-world experiments thành công trên nhiều platforms.
Vision-Language Navigation cải tiến
VL-Nav: Neuro-Symbolic Vision-Language Navigation kết hợp symbolic 3D scene graph với VLM reasoning — một hybrid approach giữa classical planning và neural reasoning. Kết quả robust hơn pure neural approaches nhờ khả năng explicit spatial reasoning.
Insight cho kỹ sư Việt Nam: Nếu bạn làm delivery robots hay service robots, navigation + natural language understanding là combo quyết định. Đọc thêm SLAM và Navigation cho Robot tự hành để nắm fundamentals.
Workshops đáng chú ý
Semantic Reasoning and Goal Understanding (SemRob)
Workshop SemRob lần thứ 3 tập trung vào semantic-level understanding cho robot task planning — kết hợp knowledge representation với learning-based approaches. Relevant cho AI-powered robotics applications.
RSS Pioneers
RSS Pioneers program dành cho young researchers (PhD students, early postdocs) — một networking opportunity tuyệt vời. Nếu bạn đang làm PhD về robotics tại Việt Nam hoặc nước ngoài, đây là program nên apply.
Chuẩn bị cho RSS 2026
Nếu bạn attend trực tiếp
- Book sớm: Sydney tháng 7 là mùa đông nhưng vẫn dễ chịu (10-17 độ C). Accommodation gần UTS nên book 2-3 tháng trước
- Workshop registration riêng: Workshops thường full sớm, register ngay khi mở
- Poster sessions là gold: RSS poster sessions chất lượng cao — chuẩn bị câu hỏi trước cho papers bạn quan tâm
Nếu bạn follow từ xa
- Theo dõi Twitter/X: @RoboticsSciSys sẽ post highlights real-time
- Đọc proceedings sau hội nghị: RSS papers open-access, download free từ roboticsconference.org
- Watch recorded talks: RSS thường upload talk recordings sau hội nghị
RSS vs ICRA: Khác biệt nào quan trọng?
| ICRA | RSS | |
|---|---|---|
| Format | Multi-track (parallel sessions) | Single-track (everyone sees everything) |
| Papers | 3000-4000 submissions, ~40% acceptance | 500-700 submissions, ~25% acceptance |
| Strengths | Coverage rộng, industrial presence | Depth, theoretical rigor |
| Workshops | 80-100 workshops | 15-20 workshops (chọn lọc hơn) |
RSS acceptance rate thấp hơn đáng kể, nghĩa là mỗi paper đều qua review nghiêm ngặt. Nếu bạn chỉ có thời gian đọc papers từ một hội nghị, RSS papers cho ROI cao nhất.