結論
PDF翻訳後に二重テキスト層が現れるのは、主に元の文書がスキャン処理後に表面に不可視のテキスト層を形成したためです。
発生原因
一部のPDFファイルはスキャン処理後、表面に不可視のテキスト層を形成します。このようなスキャン済みPDFを翻訳に提出すると、二重テキスト層が現れたり、原文のみが表示される(翻訳テキストが透明で上層にある)問題が発生します。
一般的な症状
- 01翻訳後の文書で原文と訳文が重なって表示される
- 02原文のみが表示され、訳文は存在するが不可視
- 03テキスト層の重なりにより読みにくい
解決策
- 01スキャンされていない元のPDF文書をアップロード
- 02PDFツールを使用して問題のある文書を単層文書に変換してから翻訳
- 03アップロードするPDFファイルに隠しテキスト層が含まれていないことを確認
最終判断
二重テキスト層の問題はスキャンPDFの特殊な構造に起因します。元のPDFを使用するか、単層文書に変換することでこの問題を回避できます。
二重テキスト層の問題はスキャンPDFの特殊な構造に起因します。元のPDFを使用するか、単層文書に変換することでこの問題を回避できます。