查看“crazyones”的cmap:
pdftk crazyones.pdf output crazyones-uncomp.pdf uncompress
你可以看到這個(gè):
begincmap /CMapName /T1Encoding-UTF16 def /CMapType 2 def /CIDSystemInfo << /Registry (Adobe) /Ordering (UCS) /Supplement 0 >> def 1 begincodespacerange <00> <FF> endcodespacerange 1 beginbfchar <1B> <FB00> endbfchar endcmap CMapName currentdict /CMap defineresource pop
codespacerange 將完整的字節(jié)序列映射到一系列 unicode 字形。它定義了一個(gè)起點(diǎn):
1 beginbfchar <1B> <FB00>
這意味著1B
(Hex for 27) 映射到 unicode 字符FB00
- 連字 ?(兩個(gè)小寫的 f)。
這兩個(gè)數(shù)字begincodespacerange
意味著它以 0 的偏移量(因此從)開始到 FF 的偏移量(dec:255),因此 1B+FF = 282 ? FBFF。1B ? FB00
在文本流中,有
(The)-342(mis\034ts.)
\034
是八進(jìn)制的 28 十進(jìn)制。
更多建議: