1 2 3 4 5
_target_: text_recognizer.models.transformer.TransformerLitModel max_output_len: 451 start_token: <s> end_token: <e> pad_token: <p>