attr bug fix, properly loading network

author: Gustaf Rydholm <gustaf.rydholm@gmail.com> 2021-07-30 23:15:03 +0200
committer: Gustaf Rydholm <gustaf.rydholm@gmail.com> 2021-07-30 23:15:03 +0200
commit: 7268035fb9e57342612a8cc50a1fe04e8841ca2f (patch)
tree: 8d4cf3743975bd25f2c04d6a56ff3d4608a7e8d9 /text_recognizer/data/iam_preprocessor.py
parent: 92fc1c7ed2f9f64552be8f71d9b8ab0d5a0a88d4 (diff)
1 files changed, 3 insertions, 5 deletions
diff --git a/text_recognizer/data/iam_preprocessor.py b/text_recognizer/data/iam_preprocessor.py
index f7457e4..93a13bb 100644
--- a/text_recognizer/data/iam_preprocessor.py
+++ b/text_recognizer/data/iam_preprocessor.py
@@ -9,7 +9,7 @@ import collections
 import itertools
 from pathlib import Path
 import re
-from typing import List, Optional, Union
+from typing import List, Optional, Union, Sequence
 
 import click
 from loguru import logger
@@ -57,15 +57,13 @@ class Preprocessor:
         lexicon_path: Optional[Union[str, Path]] = None,
         use_words: bool = False,
         prepend_wordsep: bool = False,
-        special_tokens: Optional[List[str]] = None,
+        special_tokens: Optional[Sequence[str]] = None,
     ) -> None:
         self.wordsep = "▁"
         self._use_word = use_words
         self._prepend_wordsep = prepend_wordsep
         self.special_tokens = special_tokens if special_tokens is not None else None
-
         self.data_dir = Path(data_dir)
-
         self.forms = load_metadata(self.data_dir, self.wordsep, use_words=use_words)
 
         # Load the set of graphemes:
@@ -123,7 +121,7 @@ class Preprocessor:
                 self.text.append(example["text"].lower())
 
     def _to_index(self, line: str) -> torch.LongTensor:
-        if line in self.special_tokens:
+        if self.special_tokens is not None and line in self.special_tokens:
             return torch.LongTensor([self.tokens_to_index[line]])
         token_to_index = self.graphemes_to_index
         if self.lexicon is not None:
author	Gustaf Rydholm <gustaf.rydholm@gmail.com>	2021-07-30 23:15:03 +0200
committer	Gustaf Rydholm <gustaf.rydholm@gmail.com>	2021-07-30 23:15:03 +0200
commit	7268035fb9e57342612a8cc50a1fe04e8841ca2f (patch)
tree	8d4cf3743975bd25f2c04d6a56ff3d4608a7e8d9 /text_recognizer/data/iam_preprocessor.py
parent	92fc1c7ed2f9f64552be8f71d9b8ab0d5a0a88d4 (diff)