PDFの中にある表をExcelで集計・編集したい場面は、多くの業務で発生します。
しかし、社用PCではフリーソフトのインストールやオンライン変換サイトの利用が禁止されていることも多く、「結局手入力している」というお悩みもよく伺います。
本記事では、フリーソフトや不明なオンラインサービスに頼らず、Excel・Word・ブラウザ・Acrobatなどの公式ツールのみでPDF内の表をExcelに変換する方法をまとめてご紹介します。
※本コンテンツは「記事制作ポリシー」に基づき、正確かつ信頼性の高い情報提供を心がけております。万が一、内容に誤りや誤解を招く表現がございましたら、お手数ですが「お問い合わせ」よりご一報ください。速やかに確認・修正いたします。
-
Excel 365/2021 以降 + テキストPDF
→ 方法1:Power Queryでの取り込みを第一候補にする -
古いExcelしかない / Wordあり
→ 方法2:Word経由+必要に応じて区切り位置 -
Wordなし / ブラウザのみ
→ 方法3:ブラウザコピー+区切り位置 -
画像PDFが多い / 業務で頻繁に利用
→ 方法4:Acrobat Pro導入を検討
PDFの種類と難易度(テキストPDF/画像PDFの違い)
PDFには大きく分けて、次の2種類があります。
-
テキストPDF
-
元がExcelやWordなどから「PDFとして保存」されたもの
-
表の中の文字をドラッグして選択・コピーできる
-
比較的きれいにExcelへ変換しやすい
-
-
画像PDF(スキャンPDF)
-
紙の帳票をスキャンしてPDFにしたもの
-
表の中の文字を選択できず、全体が写真のようになっている
-
文字認識(OCR)が必要なため、変換の難易度が高い
-
この記事ではまず、テキストPDFに対する方法を中心に説明し、その後で画像PDFへの現実的な対応策を整理します。
まず確認すべき3つのポイント(Excelのバージョン・PDF種別・利用可能ツール)
作業に取りかかる前に、次の3点を確認してください。
-
Excelのバージョン
-
Excel 365/2021 以降か、それ以前か(Power Queryの「PDFから」機能があるかどうか)
-
-
PDFの種類
-
テキストPDFか、画像PDFか(文字をドラッグして選択できるかで判別できます)
-
-
利用可能なツール
-
Wordはインストールされているか
-
Acrobat Proのライセンスがあるか
-
ブラウザ(Edge/Chrome)は使えるか
-
これらを踏まえたうえで、次の章の内容から自分に合った方法を選びます。
方法の選び方フローチャート
ここでは、環境別に「まず試すべき方法」の目安を整理します。
Excel 365/2021 以降が使える場合
-
PDFがテキストPDFであれば、最優先で「Power Query」による取り込みをおすすめします。
メリットは次のとおりです。
-
表構造をかなり忠実に維持しやすい
-
一度設定すればPDF差し替え時も更新が簡単
該当する場合は、「方法1:Excel『Power Query』でPDFの表を直接取り込む」をご覧ください。
古いExcelしかない場合(2016以前など)
Power Queryの「PDFから」機能がない場合は、次の順で検討します。
-
Wordを使える場合
→ 「方法2:Word経由でPDFの表をコピーしてExcelに貼り付ける」 -
Wordが使えない、あるいはうまく変換できない場合
→ 「方法3:ブラウザ+区切り位置」で最低限の表構造を作り直す
Acrobat Proを契約している場合
-
テキストPDF・画像PDFのどちらにも対応しやすいため、業務で頻繁に変換が必要な場合は有力な選択肢です。
-
特に画像PDFについては、Acrobat ProのOCR機能がほぼ必須となります。
該当する場合は、「方法4:Acrobat Proなど公式ツールでExcelに書き出す(有償)」をご覧ください。
どれも当てはまらない場合の現実的な選択肢
-
Excel・Wordはあるがバージョンが古い
-
PDFの構造も複雑
-
Acrobatもない
このような場合は、次のような割り切りが必要です。
-
ブラウザ+区切り位置で「骨格だけ取り込み、その後人手で整える」
-
重要度の高い列だけを優先し、すべてを完璧に再現しようとしない
完全自動を目指しすぎると、かえって時間がかかることがあります。
「どこまでを自動にして、どこからを人手で補うか」を明確に決めておくことが重要です。
方法1:Excel「Power Query」でPDFの表を直接取り込む
対応バージョンと事前確認
以下のExcelであれば、PDFからのデータ取得に対応している可能性があります。
-
Microsoft 365 のExcel(最新版)
-
Excel 2021 以降
メニューに「データの取得」→「ファイルから」→「PDFから」が表示されているか、事前に確認してください。
実際の操作手順(PDFからデータの取得)
-
Excelを起動し、空のブックを開きます。
-
リボンの”[データ]タブ”をクリックします。
-
“[データの取得]→[ファイルから]→[PDFから]”を選択します。
-
変換したいPDFファイルを選択し、[インポート]をクリックします。
-
「ナビゲーター」画面が開き、PDF内のテーブルやページの一覧が表示されます。
-
取り込みたい表を選択し、右側のプレビューで内容を確認します。
-
特に問題がなければ、”[読み込み]”をクリックします。
-
Excelシートに、PDF内の表がそのまま挿入されます。
必要に応じて、[読み込み先]で「テーブル」「ピボットテーブル」など出力形式を選ぶことも可能です。
うまく表が出てこないときのチェックポイント
Power QueryでPDFを読み込んだ際にうまく表が表示されない場合、次のポイントを確認してください。
-
PDFが画像PDFではないか
-
文字が選択できない画像PDFの場合、テーブルとして認識されません。
-
-
ナビゲーターで「ページ」を選択していないか
-
「テーブル」ではなく「ページ」を選ぶと、表構造がうまく復元されないことがあります。
-
-
テーブルの候補を複数試す
-
同じページに対し、複数のテーブル候補が表示されることがあります。それぞれ選択してプレビューを確認してください。
-
それでもうまくいかない場合は、方法2や方法3のように「Wordやブラウザを経由して成形する」アプローチに切り替えるのが現実的です。
方法2:Word経由でPDFの表をコピーしてExcelに貼り付ける
Power Queryが使えない環境でも、Wordを経由することで比較的きれいに表を取り込める場合があります。
PDFをWordで開くときの注意点
-
Wordを起動し、[ファイル]→[開く]から対象のPDFを選択します。
-
「PDFを編集可能なWord文書に変換します」といったメッセージが表示された場合は、内容を確認して[OK]をクリックします。
注意点は次のとおりです。
-
レイアウトが完全には再現されない場合があります。
-
変換後、表になっている部分と、単なるテキストとして認識されている部分が混在することがあります。
WordからExcelに表を貼り付ける手順
-
Word上で、表として認識されている部分をドラッグして選択します。
-
右クリック →[コピー]を選ぶか、Ctrl+Cでコピーします。
-
Excelを開き、貼り付けたいセル(左上)を選択します。
-
Ctrl+Vで貼り付けます。
-
貼り付けオプション(小さなアイコン)が表示された場合は、
-
「貼り付け先の書式に合わせる」
-
「テキストのみ保持」
などを試し、最も整った状態になるものを選んでください。
-
表が崩れたときの調整テクニック
Word経由でも、次のような崩れが発生することがあります。
-
全ての内容が1列に押し込まれてしまう
-
行の途中で改行されてしまう
-
数字と単位が別の列に分かれてしまう
このような場合は、次の手順で調整します。
-
列幅を自動調整する
-
対象の列を選択し、列見出しの境界線をダブルクリックします。
-
-
[区切り位置指定ウィザード]を使う
-
崩れている列を新しい列にコピーします。
-
[データ]タブ →[区切り位置]を選択します。
-
「スペース」や「カンマ」など、PDFからのコピーで使われている区切り文字を指定して列分割します。
-
-
不要な改行を削除する
-
セル内に改行が多い場合は、「検索と置換」で
Ctrl+Jを使って改行を削除する方法も有効です。
-
Wordでどうしても表として認識されない場合は、方法3のブラウザ+区切り位置を検討してください。
方法3:ブラウザ(Edge/Chrome)+「区切り位置」で表を作り直す
Wordが使えない場合や、Wordでの変換がうまくいかない場合に有効なのが、ブラウザとExcelの「区切り位置」機能を組み合わせる方法です。
ブラウザでPDFを開いて表をコピーする手順
-
PDFファイルを右クリックし、[プログラムから開く]→[Microsoft Edge] または Chrome を選択します。
-
ブラウザ上でPDFが表示されたら、表の範囲をドラッグして選択します。
-
右クリック →[コピー]、または Ctrl+C でコピーします。
うまく選択できない場合は、拡大表示してから再度選択すると精度が上がることがあります。
Excelで「区切り位置」を使って列を整える手順
-
Excelを開き、貼り付けたいセル(左上)を選択します。
-
Ctrl+Vで貼り付けます。
-
貼り付け結果が「1列にすべて入っている」場合、その列を選択します。
-
[データ]タブ → [区切り位置]をクリックします。
-
ウィザードで次のように設定します。
-
「元のデータの形式」:区切り文字で区切られたデータ
-
「区切り文字」:スペース、タブ、カンマなど、実際のデータに合わせてチェック
-
プレビューを確認し、列の分割位置が適切か確認
-
-
[完了]をクリックすると、複数列に分割されます。
その後、列幅の調整や数値形式の設定(桁区切り、小数点、日付など)を行うことで、実用的な表に仕上げることができます。
単純な表に向くケース・向かないケース
向いているケース
-
列数が少ない(3〜6列程度)
-
罫線やセル結合が少ないシンプルな一覧表
-
金額・数量・日付など、規則性のあるデータが多い
向いていないケース
-
見出しが二重になっている複雑な表
-
1つのセルに複数の情報が詰め込まれている(例:商品名+コード+備考など)
-
注釈や脚注が入り組んでいる帳票
複雑な表では、「すべてを完璧に再現する」のではなく、業務上必要な列だけを抜き出してシンプルな表を作り直す方が効率的です。
方法4:Acrobat Proなど公式ツールでExcelに書き出す(有償)
Adobe Acrobat Proを契約している場合、PDFを直接Excel形式に書き出すことが可能です。
特に、画像PDFを多く扱う場合には検討する価値があります。
Acrobat ProでExcelに書き出す手順
-
Acrobat ProでPDFファイルを開きます。
-
右側のツールバーから”[PDFを書き出し]”(または類似の名称)を選択します。
-
形式として”「スプレッドシート」→「Microsoft Excel ブック(.xlsx)」”を選びます。
-
必要に応じて、ページ範囲などを指定します。
-
[書き出し]をクリックし、保存先とファイル名を指定します。
-
出力されたExcelファイルを開き、表が正しく変換されているか確認します。
画像PDFの場合は、事前にAcrobatのOCR(テキスト認識)機能を実行しておくと精度が向上します。
オンライン変換ツールを使う際の注意点
Adobe公式のオンライン変換サービスもありますが、以下の点に注意してください。
-
組織のセキュリティポリシー上、外部サービスへのアップロードが許可されているか
-
利用規約にデータの取り扱いについて明記されているか
-
無料枠と有償プランの違い(ページ数制限など)はどうか
「公式サービスだから必ず安全」とは限りません。必ず社内規程を確認した上で利用してください。
有償ツールを導入する判断基準
次のような状況であれば、Acrobat Proなど有償ツールの導入を検討する価値があります。
-
画像PDFの表をExcel化する業務が頻繁に発生している
-
1件あたりの手入力・修正時間が長く、人件費的にも非効率になっている
-
社外に出せない機密データが多く、オンラインサービスが使えない
年間コストと、手入力・修正にかかる時間(人件費)を比較し、投資対効果を試算することをおすすめします。
画像・スキャンPDFの表をExcelに変換する現実解
なぜOCRが必要になるのか
画像PDFでは、表も文字もすべて「画像」として記録されています。
そのままでは文字として認識されないため、OCR(光学文字認識)で「画像 → 文字」に変換する必要があります。
-
OCRがない場合:セル一つ一つを手入力するしかない
-
OCRがある場合:多少の修正は必要だが、一括で文字に変換できる
ただし、OCRは完璧ではなく、フォントや印刷状態によって認識精度が変わります。
Office/Acrobatでできること・できないこと
Acrobat Pro
-
OCR機能が標準搭載されている
-
PDFをOCR処理したうえで、Excelなどに書き出し可能
-
手書き文字や極端に品質の悪いスキャンは誤認識が増える
Office側の機能の例
-
OneNoteで画像を挿入し、「画像からテキストをコピー」する
-
Excelの一部機能やモバイルアプリの「画像からデータ」機能を利用する(環境による)
これらは環境によって利用可否が異なりますので、社内インフラに合わせて検証が必要です。
どうしても精度が出ない場合の妥協ライン
画像PDFは、どのツールを使っても完全自動で理想的な表に変換するのが難しいケースがあります。
その場合は、次のような「妥協ライン」を決めておくと運用しやすくなります。
-
重要な数値列だけは手入力+ダブルチェックする
-
OCRでざっくり読み込んだ上で、合計値が一致するまで修正する
-
認識ミスが多い列(品名など)は、人手での修正を前提とする
「100%自動化を目指す」のではなく、「高リスクな部分は人が確認する」前提で設計することが大切です。
業務で使える!変換後に必ず確認したいチェックリスト
数値・桁区切り・日付の崩れをチェックする
変換後は、次の点を重点的に確認してください。
-
桁区切り(カンマ)が原因で文字列扱いになっていないか
-
マイナス記号や括弧つきの数値が正しく反映されているか
-
日付形式が「シリアル値」になっていないか、または「文字列のまま」になっていないか
必要に応じて、「セルの書式設定」や「テキストを列に分割」を使って正しい形式に揃えます。
合計値・件数で元PDFと突き合わせる
-
金額の合計
-
データ件数(行数)
-
特定の重要項目(売上合計、数量合計など)
これらを、元のPDFとExcelで突き合わせて、差分がないことを確認します。
差異があれば、どの行で誤りが発生しているかを絞り込んで修正します。
再利用しやすいテンプレートとして保存するコツ
-
列幅や書式を整えた状態をテンプレートとして保存しておく
-
毎月同じ形式のPDFが届く場合は、同じ列構成でシートを用意しておく
-
変換手順(どの方法を使うか)を簡単なマニュアルとして残し、チーム内で共有する
これにより、作業者が変わっても安定した品質で変換できるようになります。