Раф решил пройтись по одной из самых хайповых тем современности - машинному переводу с помощью нейросетей и выяснить её эмпирическую устойчивость к ошибкам в корпусе. Seq2seq - SoTA модель на тот момент. Результат - почти линейное падение точности (BLEU) с ростом процента опечаток в корпусе для смешанных ошибок. В то же время, модель показала заметную устойчивость к посимвольным ошибкам.