クラウドサービス クラウド

「Google Drive」でPDFや画像からテキストを抽出するには

「Google Drive」は、PDF文書を通常の「Google Docs」に変換し、テキストを抽出できるようにすることが可能だ。ここでは、その手順を解説する。

 古い企業のPDFや画像を見つけて、そこに含まれるテキストに迅速にアクセスする必要が生じたが、そのファイルの編集可能なバージョンが見つからず、コピー&ペーストもうまくいかない。そういった経験は、読者の皆さんにも何度もあるはずだ。あるいは、PDFや画像を別の目的に利用できるように「Word」文書や「LibreOffice」文書に変換できさえすればいい、というケースもあるかもしれない。

 確かに、正にその機能を持つソフトウェアを購入することも可能だ。しかし、「Google Drive」ユーザーであれば、その機能をすぐに利用することができる。そう、Google DocsはPDF文書を通常の「Google Docs」に変換するのを非常に上手くやってくれる。確かに完璧ではない。実際には、この機能はPDFおよび画像向けの光学文字認識(OCR)である。だが、それらのファイルに含まれる貴重なテキストにアクセスする手段を探している人にとっては、それを可能にしてくれる便利な手段である。

 それはどのように実行すればいいのだろうか。初期状態だと、この機能は利用できない。幸い、この機能を有効にするのは、信じられないほど簡単だ。それでは、具体的な方法を見ていこう。

編集部おすすめの関連記事

残り本文:約1207文字 ログインして続きを読んでください。

あなたにおすすめの記事

関連記事

ホワイトペーパーランキング

  1. デジタル時代に“生き残る”金融企業と“消えていく”金融企業、その決定的な違いとは?
  2. IoT、AI、自動化で事業を組み上げよ--製造業のITのための最新テクノロジー完全ガイド
  3. なぜ医療機関は簡単にはIT変革を実現できないのか?“ならでは”の課題と解決策を探る
  4. すぐに分析に利用できるデータは3割以下!?AIを活用した分析に向けデータ準備はどうあるべきか
  5. 【成功事例】保存データ最大99%削の快挙、バックアップ5分!大量のPCを運用自動化、負担大幅減

編集部おすすめ

トレンドまるわかり![PR]

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
クラウドストレージ
IaaS
PaaS
プライベートクラウド
OS・ミドルウェア
開発
データベース
運用
セキュリティ
新興技術
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
学習

ベンダー座談会

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]