Belin Doc IconBelin Doc

AI翻訳の用語集(Glossary)完全ガイド:PDF翻訳でカスタム用語を確実に反映させる方法(2026年版)

BelinDoc Team2026/05/18

用語集をアップロードしたのに、AIに無視されていませんか?本記事では、AI翻訳の用語集が機能しない主な原因を解説し、主要ツールの用語ヒット精度を比較。BelinDocがPDF/Word/Excel翻訳でカスタム用語・ブランド名・専門用語を確実に反映させる仕組みを、4ステップの導入手順と業界別の運用ノウハウとともに紹介します。

AI翻訳で専門文書を扱っているなら、こんな経験は一度や二度ではないはずです:

  • 用語集をアップロードしたのに、ブランド名・製品コード・業界の定訳がまるで使われていない——同じ Service Level Agreement が、ある段落では「サービスレベル合意書」、別の段落では「サービスレベル契約」、また別の段落では「SLA」のまま放置される。
  • 同じ契約書の中で、同じ法律用語が前後で3通りの訳語になっている。
  • ページや行をまたいだ複数語の用語(PDF抽出時に改行が入る)が、用語集に登録してあるのに全く一致しない

これはAIの賢さの問題ではありません。ほとんどの翻訳ツールの用語集は「アップロードした、でも本当に効くかは運次第」——どこでヒットし、どこで漏れるか、誰も明確には答えられないのです。

BelinDoc は2026年5月、用語集エンジンを大幅にアップデート。用語ヒットを「確率の問題」から「ほぼ確実」へと引き上げました。本記事ではまず用語集がうまく機能しない理由を整理し、次にBelinDocで何ができるようになったかを示し、最後に4ステップの導入手順と、法律・エンジニアリング・ブランドの3業界別ノウハウを紹介します。


1. なぜ9割のAI翻訳ツールで用語集が機能しないのか

用語集をアップロードしてもAIが独自解釈で訳してしまう場合、たいてい以下の3つのいずれかが原因です:

問題1:長文書では、後ろのページほど用語が漏れる

用語集を正しく読み込んでいても、AIは長い文書の30ページ目を訳す頃には冒頭の用語ルールを「忘れて」しまいがちです。最初の5ページは正確でも、残りの50ページで同じ用語が3〜4通りに訳されてしまう——これが典型的な失敗パターンです。

つまり:用語集をアップロードした≠実際に使われている

問題2:PDFの改行で複数語の用語がヒットしない

PDFの文字抽出は視覚的なレイアウトに合わせて改行を挿入します。用語集にこう登録していても:

Service Level Agreement

実際にPDFから抽出されるのはこうなります:

Service Level
Agreement

間に改行が入ってしまうのです。文字どおりに厳密マッチするツールでは、この用語は原文中で永久にヒットしません——登録されているのに、実行時には完全に死んでいる状態です。

問題3:原文の用語の形が少しでも変わるとヒットしない

用語集に Service Level Agreement(半角スペース1つ)と登録していても、PDFから抽出された原文ではスペース2つ、タブ、または改行になっていることがあります。これも同じ理由で漏れます。

この3つが重なって、ユーザーが感じる「用語集はオカルト」現象が生まれます——効く時と効かない時があり、ルールが誰にも説明できない


2. 主要ツールの比較

ツール用語集機能複数語用語のヒット率PDF改行された用語推奨用途
Google翻訳一部エンタープライズ版のみ対応、無料版はなし弱い漏れる単発の簡易翻訳
DeepL辞書機能あり、単語レベル中心単語は強い、複数語は弱い漏れる短文・単語の置換
従来のCAT(Trados / MemoQ)翻訳メモリ+用語ベース、強力だが設定が複雑強い(手動アラインメント)抽出層次第プロのローカライズチーム
BelinDoc(2026.5以降)アップロードしてすぐ使える、複雑な設定不要安定してヒット正しく認識PDF/Word/Excelの長文書、ブランド統一、専門用語の強制適用

上記の3つの問題をユーザー視点の体験に置き換えると、今回のアップデートでBelinDocは次のことを実現します:

  1. 長文書全体で用語が統一される——50ページの契約書で、同じ用語が冒頭から末尾まで単一の訳語を保つ
  2. 改行・複数スペース・タブのいずれにも対応——PDFの抽出形態がどう変形しても、用語は漏れない
  3. 設定が極めてシンプル——Excelテンプレートに用語を入力してアップロード、翻訳時にチェックを入れるだけ。CATツールの学習コストは不要

3. BelinDocの用語集を使う4ステップ

ステップ1:「用語集の管理」を開く

BelinDoc にログイン後、サイドバーまたは翻訳ページから 「用語集の管理」 に入ります。

個人アカウントと組織アカウントの両方に対応。組織アカウントの用語集はチームメンバー全員で共有でき、部署横断のブランド用語や業界用語の統一に最適です。

ステップ2:用語集を作成して用語を登録する

「用語集を作成」 をクリックし、識別しやすい名前を付けます(「分野+クライアント」形式の命名を推奨。例:「アパレル-クライアントA」「医療-臨床試験」)。後で切り替えやすくなります。

登録方法は2通り:

  • 手動入力:1件ずつ「原文用語 → 訳語」を入力
  • 一括インポート「用語集テンプレート.xlsx」 をダウンロード、Excelで整理してから一括取り込み。数十〜数百件の用語を扱う場合に便利

💡 用語登録のコツ:原文用語は原文書の表記をそのまま転記してください(大文字小文字・ハイフン・引用符を含む)。自分で「正規化」しないこと。例えば原文が CF Placket なら、CF placketCf Placket に変えてはいけません——大文字小文字は依然として厳密に区別されるため、書き間違えるとヒットしません。

ステップ3:ファイルをアップロード時に「用語集を使用」をチェック

PDF翻訳 ページでファイルをアップロード後、「詳細設定」を展開して「用語集を使用」にチェックを入れ、先ほど作成した用語集をプルダウンから選択します。

複数の用語集を同時に有効化することも可能です(例:ブランド用語と業界用語を別の用語集で管理)。

ステップ4:訳文をダウンロードして用語ヒットを確認

翻訳完了後、訳文をダウンロード。PDF内で用語集のいずれかの訳語を検索し、全ての出現箇所で指定の訳語に置き換えられているか確認します。

ある用語がヒットしなかった場合、最も多い原因は用語集のkeyの大文字小文字・ハイフン・特殊記号が原文書と一致していないことです——ステップ2のコツに従って修正し、再度翻訳してください。


4. 高頻度シナリオ3種の用語集設定ノウハウ

業界によって用語へのニーズは大きく異なります。BelinDocユーザーの利用シーンで最も多い3つを紹介します:

法律 / 契約:法律用語を固定し、訳語のブレを防ぐ

法律文書では用語の絶対的な一貫性が必須です:

原文推奨訳語(シーン別)
plaintiff原告(「訴訟人」「告訴人」などの混在を避ける)
defendant被告
whereas〜により(契約前文の固定訳)
force majeure不可抗力
governing law準拠法

運用のコツ:契約書や判決書など長文書では用語集の有効化を強く推奨します。さもないと、同じ用語が50ページに3〜4通り出現し、後工程のレビューに膨大な負担をかけます。

エンジニアリング / 技術:標準コード+略語の規範化

技術文書の核心的な矛盾は「略語が多い+標準コードが多い」ことです:

原文推奨訳語
DIA直径(「日」や「直径インチ」と誤訳されないように)
TYP典型・標準(略語を展開せずに)
Reinforced Concrete鉄筋コンクリート
tolerance fit公差はめあい
ISO 9001ISO 9001(標準コードは原文を維持)

運用のコツ:ISO/DIN/JIS/ASMEなどの標準コードは、用語集で原文=訳語(つまり ISO 9001 → ISO 9001)に設定し、「これは翻訳しないで」とAIに明示します。モデルが親切心で日本語化してしまい逆に誤りになる事態を防げます。詳しくはエンジニアリング図面翻訳ガイドを参照。

ブランド / マーケティング:ブランド名の維持+製品コードの統一

ブランド担当者のニーズはブランドの一貫性製品コードの誤訳防止です:

原文推奨訳語
BelinDocBelinDoc(翻訳しない)
iPhone 17 Pro MaxiPhone 17 Pro Max(翻訳しない)
Air Cushion™エアクッション™(商標記号を維持)
Series AシリーズA

運用のコツ:ブランド用語は通常原文=訳語(つまり翻訳しない)に設定し、モデルが「過剰にローカライズ」してブランド名まで翻訳してしまうのを防ぎます。


5. 実践比較:用語集ON vs OFF

IT/ビジネス契約でよくあるシーンを例に挙げます:用語 Service Level Agreement、チームの標準訳語が「サービスレベル合意書」とします。この用語はPDF契約書の中で改行で分断されやすいのです(Service Level が1行、Agreement が次の行)。

用語集を使わない場合

モデルは段落ごとに違う日本語に訳してしまいます:「サービスレベル合意書」「サービスレベル契約」「SLA契約」「SLA」のまま——30ページの契約書で同じ用語が3〜4通りに散らばり、後工程の校正担当者は全文検索でひとつずつ統一する羽目になります。

BelinDocの用語集を有効化

全文で統一ヒット:「サービスレベル合意書」——出現位置すべてが定義した訳語に置き換わり、契約書全体で用語が一貫します。

同様のシーンは医学(ラテン語起源の専門名)、法律(契約の定型用語)、エンジニアリング(標準コード)で毎日のように発生しています。用語集の価値は単一フレーズではなく、長文書全体での用語の一貫性——機械翻訳が従来最も苦手としてきた領域です。


6. まとめ:用語集はAI翻訳の「ラストワンマイル」

AI翻訳は「翻訳できるか」を解決しましたが、専門業務における実用性を最終的に決めるのは用語の一貫性です——医学論文で同じ分子名が5通りに訳されたり、契約書で同じ法律用語が3通りになったり、仕様書で同じ工程用語が複数の訳語で表記されたり——いずれもエンドユーザーにとっては災害です。

BelinDocが2026年5月に用語集をアップデートした目的は、「用語集オカルト」を「用語集コントロール」に変えること。次のような文書を頻繁に翻訳する方には特におすすめです:

  • ✅ 長契約書 / 判決書 / 法務資料
  • ✅ エンジニアリング図面 / 技術仕様書 / 工程シート
  • ✅ 医学論文 / 臨床報告 / 医薬品添付文書
  • ✅ クロスボーダーブランドのマーケティング素材 / 製品マニュアル

自分の分野の用語集を作って登録することを強く推奨します——一度設定すれば、以降の全文書で自動的に再利用され、チームレベルの一貫性が即座に実現します。

👉 BelinDocの全機能と料金を見る:料金プラン


よくある質問 FAQ

Q1:用語集はすべての翻訳モデルに有効ですか?

A: はい。BelinDocの用語集機能はモデル横断で統一されています。GPT-5、Gemini 3、Claude 3.5 Sonnet、DeepSeek V4のいずれを使っても、同じルールで用語が注入されます。モデル選定はAI翻訳モデル選定ガイドを参照ください。

Q2:大文字小文字は厳密に一致させる必要がありますか?

A: はい、大文字小文字は引き続き厳密に区別されます。これは意図的な設計です——多くの場面で大文字小文字自体に意味があるため(例:CF は中心線、cf は略語)、緩めると誤マッチが発生します。用語集のkeyは原文の表記をそのまま使ってください。

Q3:用語key内のスペース・改行・タブは混在してもよいですか?

A: はい。BelinDocの2026年5月のアップデート以降、複数語の用語がPDF抽出層で取りうる様々な空白形態(改行/複数スペース/タブ)はすべて正しく認識されます——用語集には標準の半角スペース1つを書いておけばよく、原文の組版形態に関係なく漏れません。PDF翻訳における鍵となる改善点です。

Q4:用語集は翻訳速度を遅くしますか?

A: ほぼ影響ありません。LLM推論時間と比べて用語集処理時間は無視できるレベルで、50ページのPDF+200件の用語でもわずか数百ミリ秒の追加にとどまります。

Q5:組織/チームで用語集を共有するには?

A: 組織アカウントで作成した用語集はすべての組織メンバーに表示・利用可能。ブランド担当・翻訳チーム・法務部門が同じ用語標準をメンバー横断で共有するのに最適です。

Q6:用語集のエントリ数や1件の長さに上限はありますか?

A: 1つの用語集で数百件の用語ペアをサポート。1件のkeyとvalueはともに200文字以内に収めることを推奨します(ほぼすべての専門用語シナリオをカバー)。それ以上の規模(数千件超)の場合は、分野別に複数の用語集に分けて同時に有効化するのがおすすめです。

Q7:特定の翻訳だけ用語集を一時的にオフにできますか?

A: はい。用語集は翻訳のたびに明示的にチェックするため、チェックを外せばオフになります。「ON vs OFF」の効果比較を行う際に便利です。

関連記事