Simultaneous Translation with Flexible Policy via Restricted Imitation Learning

doi:10.48550/arXiv.1906.01135

Simultaneous Translation with Flexible Policy via Restricted Imitation Learning

Simultaneous translation is widely useful but remains one of the most difficult tasks in NLP. Previous work either uses fixed-latency policies, or train a complicated two-staged model using reinforcement learning. We propose a much simpler single model that adds a `delay' token to the target vocabulary, and design a restricted dynamic oracle to greatly simplify training. Experiments on Chinese<->English simultaneous translation show that our work leads to flexible policies that achieve better BLEU scores and lower latencies compared to both fixed and RL-learned policies.

Publication:

arXiv e-prints

Pub Date:

June 2019

DOI:

10.48550/arXiv.1906.01135

arXiv:

arXiv:1906.01135

Bibcode:

2019arXiv190601135Z

Keywords:

Computer Science - Computation and Language

E-Print:

ACL 2019

NASA/ADS

Simultaneous Translation with Flexible Policy via Restricted Imitation Learning

Abstract