PDFで受け取った請求書や実績表、名簿などをExcelで集計・編集しようとして、「コピーすると崩れる」「変換したら列がズレた」「スキャンPDFで何もできない」と困った経験はないでしょうか。
手入力で対応すれば確実ですが、時間もかかり、入力ミスの不安も残ります。
実は、PDFの表をExcelに変換する作業は、PDFの種類を見極め、目的に合った方法を選ぶだけで、手戻りを大幅に減らすことが可能です。ExcelのPDF取り込み機能、Adobe Acrobatの書き出し、コピー貼り付け、OCR、無料ツール――それぞれには向き・不向きがあり、順番を間違えると余計に修正作業が増えてしまいます。
本記事では、PDFの表をエクセルに変換する最適な方法をケース別に整理し、変換後によく起きる「セル結合」「列ズレ」「数値が計算できない」といったトラブルの直し方まで、実務目線で詳しく解説します。
「どの方法を選べばいいのか」「どこまで自動化できて、どこから手直しが必要なのか」を明確にし、最短で使えるExcelデータを作るための判断軸と手順をまとめました。
PDF変換で無駄な試行錯誤を減らし、安心して業務に使えるExcel表を作りたい方は、ぜひ最後までご覧ください。
※本コンテンツは「記事制作ポリシー」に基づき、正確かつ信頼性の高い情報提供を心がけております。万が一、内容に誤りや誤解を招く表現がございましたら、お手数ですが「お問い合わせ」よりご一報ください。速やかに確認・修正いたします。
pdfの表をエクセルに変換する前に確認すること
テキストPDFとスキャンPDFで方法が変わる
PDFの表をExcelに変換するとき、最初にやるべきことは「このPDFはテキストPDFか、スキャンPDF(画像PDF)か」を切り分けることです。ここを外すと、どれだけ手順を丁寧に踏んでも結果が安定せず、時間だけが溶けてしまいます。
テキストPDFは、PDF上の文字をドラッグして選択でき、コピーできるタイプです。多くの請求書、見積書、システム出力の帳票、Webからダウンロードした明細などがこれに該当します。テキストとして情報が埋め込まれているため、Excelの取り込み機能やAcrobatの書き出し機能で比較的きれいに表構造が再現されやすい傾向があります。
一方のスキャンPDF(画像PDF)は、紙をスキャンしたもの、FAXをPDF化したもの、撮影画像をそのままPDFにしたものなどが該当します。文字を選択できない、コピーしても意味のない文字列になる、あるいは選択自体ができない場合は、基本的に画像PDFと判断して構いません。画像PDFはそのままではExcelに表として移せないため、OCR(文字認識)が前提になります。OCRの品質は、原稿の状態に大きく左右されます。具体的には次の条件が悪いほど誤認識が増えます。
解像度が低く、文字が潰れている
斜めに傾いている、影が入っている
罫線が薄い、線が途切れている
手書きが混ざっている、印影がかかっている
背景が汚れている、ノイズが多い
この切り分けが重要なのは、変換手段の選び方が根本から変わるからです。テキストPDFなら「取り込み」「書き出し」「コピー」が中心になり、スキャンPDFなら「OCR→抽出→修正」が中心になります。まずはPDFを開き、表の文字が選択できるかどうかを確認してください。それだけで、最短ルートが見えてきます。
機密情報があるならオンライン可否を先に決める
次に確認すべきは、PDFの内容が外部サービスにアップロード可能かどうかです。オンライン変換サービスは確かに便利で、インストール不要・手順が短い・環境に依存しにくいという利点があります。しかし、請求書や顧客情報、個人情報、社外秘の見積、契約関連の明細などを含む場合、社内規定やコンプライアンス上の理由でオンライン変換が禁止されているケースも少なくありません。
ここを曖昧にしたまま進めると、途中で「このデータは外に出せない」と判明してやり直しになったり、最悪の場合は社内ルール違反になったりします。最初に次のように判断しておくと安全です。
オンライン不可(推奨:社内規定が厳しい場合)
Excelの取り込み機能(Power Query)や、PC上で完結するAcrobatの書き出し、ローカルOCRを選ぶ。オンライン可(ただし条件付き)
匿名化できるデータのみ、あるいは事前承認がある場合のみ利用する。ログ管理や利用規約の確認も行う。判断がつかない
迷ったらオンラインを使わない。結果として最短になることが多い。
また、機密性とは別に「社外PCや共有PCで作業している」「個人のフリーアカウント利用が禁止されている」といった事情もあります。この場合も、オンライン変換よりもExcelやAcrobatなどローカルで完結する方法のほうがトラブルが少ないです。
表の「目的」によって最適解が変わる
「PDFの表をExcelに変換したい」といっても、ゴールが違えば正解も変わります。目的を先に決めると、手段選定も修正作業も一気にラクになります。よくある目的は大きく次の3パターンです。
集計・分析がしたい(数字を計算、ピボット、フィルタ等)
見た目より「列が正しく分かれていること」が重要です。多少レイアウトが崩れても、列が安定していれば後で整えられます。Power Queryで表として取り込む方法が相性が良いことが多いです。加工・編集して提出したい(体裁も大事)
罫線、セル結合、配置など見た目の再現性も求められます。Acrobatの書き出しや、必要に応じてOCR精度の高い手段を使い、最終調整も前提にします。一部だけ抜き出して使いたい(該当範囲だけ)
全ページの変換より、表の必要箇所だけをコピーして貼り付けたほうが速いケースが多いです。特に「数行だけ」「特定の列だけ」といった状況では、最短ルートになります。
この目的が定まると、「変換で崩れが出てもどこまで許容するか」「どの修正に時間をかけるべきか」が明確になります。結果として、手戻りが劇的に減ります。
Excelの機能でpdfの表をエクセルに変換する方法
Power QueryでPDFから表を取り込む手順
Excelには、PDFからデータを取り込む機能があります。これは内部的にはPower Query(データ変換・取り込み機能)を利用しており、PDF内の表を抽出してExcelのテーブルとして読み込むことができます。テキストPDFであれば、まずここから試す価値があります。
手順は環境により表示が若干異なりますが、一般的には次の流れです。
Excelを起動し、新規ブックを開く(既存ブックでも可)
リボンのデータタブを開く
データの取得(または「取得と変換データ」)から、ファイルから → PDFからを選ぶ
変換したいPDFを指定する
ナビゲーター画面で、抽出候補の一覧(Tableやページ)が表示される
プレビューを見て目的の表に近い候補を選択する
そのまま取り込むなら読み込み、取り込み前に整形するならデータの変換を選択
ここで重要なのが「候補の選び方」です。PDFの作りによって、同じページから複数のTable候補が出てきたり、表が分割されて複数候補になったりします。プレビューで次を確認してください。
見出し行が意図した列に入っているか
行が途中で折れて別行になっていないか
列が余計に増えていないか(罫線や空白が原因のことがある)
合計行や注記が混ざっていないか(混ざっていても後で削除可能)
「読み込み」で一旦取り込んでから直すこともできますが、後工程が重くなる場合は、データの変換(Power Queryエディター)で整形してから読み込むほうが効率的です。
また、複数ページにまたがる帳票の場合は、ページごとに表を取り込み、後で結合することもできます。表構造が同じなら、Power Queryで「追加(Append)」して一つの表にまとめると、毎回の作業が再現性のある手順になります。
取り込み後に崩れやすいポイントと整形のコツ
Power Queryで取り込めても「完璧な表」になるとは限りません。崩れやすい代表例と、整形の考え方を押さえておくと修正が速くなります。
よくある崩れ 1:見出しが2段・3段になっている
たとえば「2025年」「上期」「下期」のように見出しが階層化されている表は、取り込み後に列名が空欄になったり、不要な列が生まれたりします。この場合は、Power Queryで不要な行を削除し、見出し行を1行に整形してから「最初の行をヘッダーとして使用」を適用すると安定します。
よくある崩れ 2:セル内改行が原因で行が分裂する
PDFの表では、1つのセルに複数行の文字が入っていることがあります(住所、品名の長い説明など)。取り込み後に改行が残ると、見た目がズレたり、行が分裂したように見えたりします。Power Query側で置換(改行をスペースにする等)を行うか、Excel側で置換して整えると扱いやすくなります。
よくある崩れ 3:罫線や空白が列区切りとして誤認識される
罫線が多い表、空白の多い表は、列が不自然に増えることがあります。Power Queryでは、不要な列を削除し、必要な列だけ残してからデータ型を設定します。無理に「見た目を元に戻す」より、目的が集計なら「必要な列が揃う」ことを優先してください。
整形の基本方針は次のとおりです。
まず不要要素を除去する(タイトル、注記、空白行、余計な列)
次に「列」と「行」の形を安定させる(列名、区切り、結合)
最後にデータ型を整える(数値、日付、文字列)
この順番を守ると、後で数値変換が失敗したり、日付が混乱したりする事故が減ります。Power Queryの強みは、一度整形手順を作ると、次回以降も同じPDF構造なら再実行しやすい点です。毎月同じ形式の帳票を処理するなら、特に効果が大きい方法です。
Adobe Acrobatでpdfの表をエクセルに変換する方法
AcrobatでPDFを書き出してExcel化する手順
Adobe Acrobat(特にデスクトップ版)には、PDFをExcelに書き出す機能があります。体裁をある程度維持したい場合や、Excelの取り込みで表が分裂する場合は、こちらが安定することがあります。
一般的な流れは次のとおりです。
AcrobatでPDFを開く
右側のツール、またはメニューからPDFを書き出し(または「書き出し」)を選ぶ
形式としてMicrosoft Excel(XLSX)を選ぶ
必要に応じて設定を確認し、書き出しを実行
保存先を指定して出力する
Acrobatの利点は、PDFの内部構造を前提に、表として扱いやすい形にしてくれる点です。特に次のようなケースで効果を感じやすいです。
罫線が多い帳票で、Excel取り込みだと列が増えすぎる
セル結合が多く、Power Queryだと分裂しやすい
画像と文字が混在し、Excel取り込みの候補が不安定
ただし、どの方法でも万能ではありません。Acrobatで書き出しても、セル結合が別の形で再現されたり、改行が残ったりすることがあります。その場合は、後述の「崩れたときの直し方」の出番です。
表だけ欲しいときのコピー貼り付け手順
「PDF全体をExcel化するほどではない」「必要な表はこの範囲だけ」という状況はかなり多いです。この場合、書き出しを試す前に、表の範囲だけコピーしてExcelに貼り付けるのが最短になることがあります。
手順はシンプルです。
AcrobatでPDFを開く
表の範囲をドラッグして選択する
右クリックでコピー(環境によっては「書式設定を維持してコピー」などの項目)
Excelを開いて貼り付ける(Ctrl+V)
この方法のメリットは、必要な箇所だけ抜けること、手順が短いこと、失敗してもやり直しが早いことです。一方で、PDFの作りによっては次の失敗も起きます。
見た目は表でも、内部的には「テキストが並んでいるだけ」で列に分かれない
余計なスペースやタブが混ざり、列がズレる
セル結合が想定外に再現される
この場合は、貼り付け後に「区切り位置(テキストを列に分割)」で整えると改善することがあります。特に、貼り付け後に1列に縦長になってしまった場合は、区切り位置で「区切り文字(タブ、スペース)」を使って列に戻せるケースがあります。ただし、スペース区切りはデータ中のスペース(品名など)まで分割する危険があるので、プレビューを見ながら慎重に進めるのがコツです。
スキャンPDFはOCRが鍵になる
スキャンPDFの場合、Acrobatで書き出しやコピーをしても、文字が選択できず、表として扱えないことが多いです。ここで必要になるのがOCR(文字認識)です。
OCRは「画像を文字にする」工程ですが、表の場合はさらに「文字を列と行に割り当てる」工程が加わります。つまり、OCRができても表が整うとは限りません。スキャンPDFを扱うときは、次の現実的な考え方が重要です。
OCR後に必ず誤認識が出る前提で、チェックする場所を決める
100%の自動化を狙うより、手直しが少ない形に持っていくことを狙う
誤認識が致命的になる項目(合計金額、数量、単価、日付など)は二重チェックする
表のOCRで特にミスが出やすいのは、次のようなパターンです。
「1」と「I」、「0」と「O」
小数点「.」が消える、カンマが誤認識される
罫線が列区切りとして認識されず、列が合体する
反対に罫線や汚れがノイズとして認識され、列が増える
数字の桁が欠ける、全角・半角が混ざる
OCRの精度を上げるには、元データの品質改善(傾き補正、余白トリミング、コントラスト調整)も有効ですが、現場では「元PDFが変えられない」ことも多いです。その場合は、OCR後に修正しやすいように、まず必要範囲だけを対象にし、データ量を減らしてから整形するほうが総作業時間が短くなることが多いです。
無料ツールでpdfの表をエクセルに変換するときの注意点
オンライン変換のメリットとリスク
無料のオンライン変換サービスは、環境を選ばず、手順も短く、急ぎの場面で頼りになります。特に、Excelの取り込みがうまくいかない、Acrobatが手元にない、というときに選択肢に入りやすいでしょう。
オンライン変換の主なメリットは次のとおりです。
インストール不要で、すぐ試せる
PCの権限が制限されていても利用できる場合がある
OCRを含む変換を用意しているサービスもある
変換スピードが速いことが多い
一方、リスクや注意点も明確にあります。
データを外部にアップロードするため、機密情報や個人情報の扱いに注意が必要
サービスごとに利用規約・保存方針が異なるため、社内ルールと衝突しやすい
無料枠に制限がある(回数、容量、OCRは有料など)
変換精度がPDFの状態に左右され、手直し前提になりやすい
特にスキャンPDFのOCRをオンラインで行う場合、「OCRの品質」はサービス差が出やすく、さらに無料枠だと精度や処理条件が限定されることがあります。急ぎで試すなら良いですが、継続運用には向かないケースもあります。
機密データを扱うときの代替ルート
機密データを扱う場合、基本方針は「外に出さない」ことです。そのうえで現実的に選べるルートを整理すると、次のようになります。
テキストPDFの場合
まずExcelのPDF取り込み(Power Query)を試し、ダメならAcrobatの書き出しへ。表の一部だけならAcrobatのコピー貼り付けも有効。スキャンPDFの場合
ローカルで完結するOCRを使う(社内規定に合うソフトを選定)。OCR後は、Excel側で整形しやすい形にすることを優先する。
また、どうしてもオンラインを使う必要があるなら、次の工夫でリスクを下げられる場合があります。
氏名や住所、口座番号などを事前にマスキングしたPDFを用意できるなら、それを使う
必要ページだけを抜き出し、最小限のデータだけアップロードする
作業後は変換結果の保管場所や共有範囲を明確にし、不要データを残さない
ただし、これらは社内ルールの範囲内で行うことが大前提です。迷うなら、オンラインを避ける判断が最も安全です。
pdfの表をエクセルに変換したあと崩れたときの直し方
セル結合・改行・列ズレを直すチェックリスト
変換が成功しても、実際の仕事で困るのは「ここから直すのが大変」という状態です。崩れた表を目の前にすると、つい手当たり次第にセルを動かしたくなりますが、効率が落ちるだけでなく、ミスも増えます。直すときは、まず状況を分類し、順番を決めるのが最短です。
まず、修正に入る前のチェックリストです。
元データ(変換直後の状態)を別シートにコピーして保管する
何を最終成果物にするか決める(集計用か、提出用か)
崩れのタイプを分類する(セル結合、改行、列ズレ、数値形式、文字化け)
「列の安定」を先に作る(列が決まらないと修正が二度手間になる)
次に、代表的な崩れと対処を具体化します。
セル結合が多すぎて表として扱えない
PDFの体裁を維持しようとしてセル結合が大量に再現されると、集計や並べ替えが難しくなります。集計が目的なら、セル結合は邪魔になりやすいので、結合を解除し、空白セルに上の値を埋める(フィルダウンする)など、データ化に寄せるほうが結果的に速いです。提出用で体裁が必要なら、いったんデータを整えた上で、必要箇所だけ改めて結合を作るほうがミスが減ります。
セル内改行(Alt+Enter)で見た目や行が崩れる
PDFから来たデータには改行が混ざりやすいです。Excelで「置換」を使い、改行コードをスペースや空欄に置き換えると整理できます。改行を消すと単語が詰まる場合は、スペースに置き換えるほうが読みやすいです。住所や品名など、改行が意味を持つ列だけは例外的に残す判断もあります。
列ズレ(途中から列がずれる、列数が揃わない)
列ズレは、修正の中でも厄介な部類です。最初に確認したいのは「ズレが一定か、行ごとにバラバラか」です。
ズレが一定(同じ位置でズレる)なら、区切り位置で再分割したり、不要列を削除して列を揃えたりしやすい
行ごとにバラバラなら、元の抽出方法(Power Queryの候補選択、Acrobatの書き出しなど)を変えたほうが速い場合がある
無理に手作業で直すより、一段階前の工程を変えて再抽出するほうが短時間で終わることも多いです。「直す」か「やり直す」かの判断は、作業時間の最適化で非常に重要です。
数字と日付がうまく扱えないときの直し方
PDFから変換した表で頻発するのが、数字や日付が「文字列」として入ってしまい、計算や並べ替えがうまくいかない問題です。見た目は数字でも、Excelにとっては文字なので、合計が合わない、フィルタの並びがおかしい、といったトラブルにつながります。
数値にならない主な原因は次のとおりです。
先頭や末尾に空白が入っている
全角数字が混ざっている
カンマ、通貨記号、単位が一緒に入っている(例:1,200円)
マイナス表記が特殊(例:△1,200)
OCR誤認識で「O」「I」などが混ざっている
対処の基本は「原因を潰してから数値化」です。よく使う手順は次のとおりです。
余計な文字(円、個、%など)を置換で除去する
全角→半角を統一する(必要に応じて)
空白を除去する(TRIM相当の処理、置換など)
そのうえで数値形式に変換する
Power Queryを使っている場合は、列のデータ型を数値に設定し、エラーが出る行だけを抽出して原因確認するのも効率的です。エラー行が特定できると、修正の優先順位が明確になります。
日付が扱えない原因も似ています。
「2025/1/2」「2025-01-02」「令和7年1月2日」など表記が混在
OCRで「/」が欠ける、数字が入れ替わる
月日が全角、あるいはスペース混入
対処としては、まず表記を揃え、日付型に変換します。表記揺れが多い場合は、日付の列を一度文字列として扱い、置換や抽出で形式を整えた上で日付化すると安定します。集計や並べ替えが目的なら、日付列が正しく日付型になることは非常に重要です。
文字化け・フォント崩れの対処
最後に、文字化けやフォント崩れです。これはPDF側の文字情報の持ち方(フォント埋め込み、文字コードなど)や、変換エンジンとの相性で起こります。現場では「どう直せばいいか」よりも「どのルートなら起きにくいか」を押さえるほうが実用的です。
文字化けが起きたときの現実的な対処は次の優先順位です。
同じPDFを、別の方法で再変換する(Excel取り込み→Acrobat書き出し、またはその逆)
文字化けする列だけ、コピー貼り付けのルートを変える(範囲抽出など)
どうしても直らない場合は、該当列だけ手入力や別資料参照で補う(コスト判断)
文字化けの修正をExcel上で無理に行うより、変換ルートを変えたほうが短時間で解決するケースが多いです。
フォント崩れについては、提出用資料を作る場合に気になりやすいポイントです。見た目が崩れる原因は、元PDFのフォントとExcel側のフォントが一致しないことです。対処としては、最終的にExcel側でフォントを統一し、列幅や行高を整え、罫線を引き直すことになります。体裁が重要な提出物では、変換結果をそのまま提出するのではなく、「下書きを自動で作る工程」と割り切るとスムーズです。
pdfの表をエクセルに変換でよくある質問
表が画像の場合はどうすればいい?
表が画像(スキャンPDF)であれば、基本的にOCRが必要です。まずはOCRをかけて文字情報を作り、そのうえでExcelに取り込む、またはExcel形式に書き出す流れになります。
ただし、OCR後のデータは必ずチェックが必要です。特に、業務上重要な項目は誤認識が致命傷になりやすいため、次のような列は優先して点検してください。
合計金額、単価、数量、税額(数字が絡む列)
日付(請求日、納期、対象期間など)
顧客名や品名(誤字が後工程に影響する列)
口座番号やコード類(桁落ちが起きやすい)
また、画像PDFの場合は「全部を変換する」よりも「必要なページ・必要な範囲だけ」を対象にしたほうが精度も作業時間も良くなることが多いです。
複数ページの表を1枚にまとめられる?
可能です。方法は大きく2通りあります。
Power Queryで各ページ(または各Table)を取り込み、同じ列構造なら追加して結合する
毎月同じ形式の帳票を処理する場合に強く、再現性があります。AcrobatでExcelに書き出した後、Excel側でシートや範囲を統合する
単発作業ならこちらが簡単なこともあります。
注意点は、ページごとに列構造が微妙に違う場合です。列名が違う、途中から列が追加される、合計行の位置が違う、といった差があると統合が崩れます。この場合は、統合前に列を揃える工程(不要列の削除、列名の統一、空欄の補完など)が必要になります。
変換精度を上げるコツはある?
精度を上げるコツは、テクニックよりも「選び方」と「前処理」と「点検箇所の設計」です。
選び方:テキストPDFならExcel取り込みやAcrobat書き出し、画像PDFならOCR前提
前処理:画像PDFなら傾き・影・余白などを整えられると誤認識が減る
点検箇所の設計:全部を完璧に確認しようとせず、ミスが致命的な列を重点的にチェックする
さらに、変換後に崩れた場合、「頑張って直す」より「別ルートで再変換する」ほうが精度改善になることもよくあります。変換は相性が大きいので、1つの方法に固執しないのが実務上のコツです。
オンライン変換は社内的に使って大丈夫?
結論としては、社内ルール次第です。個人情報・顧客情報・社外秘が含まれる場合、外部アップロードが禁止されている企業は少なくありません。判断がつかないときは、オンライン変換は避け、Excelの取り込みやAcrobatのデスクトップ機能、ローカルOCRなど「外に出さない方法」を選ぶのが安全です。
また、オンラインが許可されている場合でも、利用範囲やアカウント管理、データ保管の扱いなどが決められていることがあります。個人の判断で使うのではなく、運用ルールに沿って利用することが重要です。