Refactoring Policy for Compositional Generalizability using Self-Supervised Object Proposals

doi:10.48550/arXiv.2011.00971

Refactoring Policy for Compositional Generalizability using Self-Supervised Object Proposals

We study how to learn a policy with compositional generalizability. We propose a two-stage framework, which refactorizes a high-reward teacher policy into a generalizable student policy with strong inductive bias. Particularly, we implement an object-centric GNN-based student policy, whose input objects are learned from images through self-supervised learning. Empirically, we evaluate our approach on four difficult tasks that require compositional generalizability, and achieve superior performance compared to baselines.

Publication:

arXiv e-prints

Pub Date:

October 2020

DOI:

10.48550/arXiv.2011.00971

arXiv:

arXiv:2011.00971

Bibcode:

2020arXiv201100971M

Keywords:

Computer Science - Computer Vision and Pattern Recognition;
Computer Science - Artificial Intelligence;
Computer Science - Machine Learning

E-Print:

34th Conference on Neural Information Processing Systems (NeurIPS 2020), Vancouver, Canada

NASA/ADS

Refactoring Policy for Compositional Generalizability using Self-Supervised Object Proposals

Abstract