Replace C with acute accent as well
authorDan Scott <dan@coffeecode.net>
Fri, 29 Jul 2011 21:54:08 +0000 (17:54 -0400)
committerDan Scott <dscott@laurentian.ca>
Tue, 7 May 2013 18:37:06 +0000 (14:37 -0400)
Signed-off-by: Dan Scott <dscott@laurentian.ca>
tools/ebooks/prep_ebook_records.py

index 5c0af4d..43d756e 100644 (file)
@@ -363,12 +363,21 @@ def clean_diacritics(field):
         # Let the substitutions commence - maybe move to a map table?
 
         # COMBINING MACRON
-        tmpsf = subfield[1].replace(u'\xd5a', u'a\u0304')
+        tmpsf = subfield[1].replace(u'\xd5A', u'A\u0304')
+        tmpsf = tmpsf.replace(u'\xd5a', u'a\u0304')
+        tmpsf = tmpsf.replace(u'\xd5E', u'E\u0304')
         tmpsf = tmpsf.replace(u'\xd5e', u'e\u0304')
+        tmpsf = tmpsf.replace(u'\xd5I', u'I\u0304')
         tmpsf = tmpsf.replace(u'\xd5i', u'i\u0304')
+        tmpsf = tmpsf.replace(u'\xd5O', u'O\u0304')
         tmpsf = tmpsf.replace(u'\xd5o', u'o\u0304')
+        tmpsf = tmpsf.replace(u'\xd5U', u'U\u0304')
         tmpsf = tmpsf.replace(u'\xd5u', u'u\u0304')
 
+        # LATIN LETTER C WITH ACUTE
+        tmpsf = tmpsf.replace(u'\xd4C', u'\u0106')
+        tmpsf = tmpsf.replace(u'\xd4c', u'\u0107')
+
         # COMBINING MODIFIER LETTER HALF RING
         tmpsf = tmpsf.replace(u'\xb1', u'\u02be')