クラウドサービス クラウド

「Google Drive」でPDFや画像からテキストを抽出するには

「Google Drive」は、PDF文書を通常の「Google Docs」に変換し、テキストを抽出できるようにすることが可能だ。ここでは、その手順を解説する。

 古い企業のPDFや画像を見つけて、そこに含まれるテキストに迅速にアクセスする必要が生じたが、そのファイルの編集可能なバージョンが見つからず、コピー&ペーストもうまくいかない。そういった経験は、読者の皆さんにも何度もあるはずだ。あるいは、PDFや画像を別の目的に利用できるように「Word」文書や「LibreOffice」文書に変換できさえすればいい、というケースもあるかもしれない。

 確かに、正にその機能を持つソフトウェアを購入することも可能だ。しかし、「Google Drive」ユーザーであれば、その機能をすぐに利用することができる。そう、Google DocsはPDF文書を通常の「Google Docs」に変換するのを非常に上手くやってくれる。確かに完璧ではない。実際には、この機能はPDFおよび画像向けの光学文字認識(OCR)である。だが、それらのファイルに含まれる貴重なテキストにアクセスする手段を探している人にとっては、それを可能にしてくれる便利な手段である。

 それはどのように実行すればいいのだろうか。初期状態だと、この機能は利用できない。幸い、この機能を有効にするのは、信じられないほど簡単だ。それでは、具体的な方法を見ていこう。

編集部おすすめの関連記事

残り本文:約1207文字 ログインして続きを読んでください。

「クラウドサービス」で読まれている記事

TechRepublic Japanで人気の記事

編集部オススメ

トレンドまるわかり![PR]

財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
PC・モバイル
新興技術
ITインフラ
クラウドサービス
クラウドストレージ
IaaS
PaaS
プライベートクラウド
OS・ミドルウェア
開発
データベース
運用
セキュリティ

ホワイトペーパーランキング

  1. AWSが提唱する、モダン分析プラットフォームのアーキテクチャと構築手法
  2. AWS資料、ジョブに特化した目的別データベースを選定するためのガイド
  3. Zero Trust Workbook--ゼロ トラストの先にある世界を知るためのガイダンス
  4. 「ゼロトラスト」時代のネットワークセキュリティの思わぬ落とし穴に注意せよ
  5. データ駆動型の組織でビジネスの俊敏性を実現するには?戦略的な意思決定とイノベーションを両立へ

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]