テキストマイニング

Text Mining Studio:GUIで使えるテキストマイニング--頻度や特徴などを分析

テキストマイニングツールの「Text Mining Studio」は、グラフィカルな操作環境で高度なテキスト分析を処理できる。言葉の頻度や特徴、注目度、評判など、7系統14種類の分析機能を備えている。

Text Mining Studioのポイント

  • グラフィカルな操作でテキストを分析できるテキストマイニングツール
  • 言葉の頻度や特徴、注目度、評判などを分析できる
  • 7系統14種類の分析機能を備えている

Text Mining Studioの製品解説

 NTTデータ数理システムの「Text Mining Studio(TMStudio)」は、グラフィカルな操作環境で高度なテキスト分析を処理できるテキストマイニングツールである。テキストマイニングの基本である頻度の分析から、テキストに付随する属性に基づいた特徴分析や話題分析など豊富な分析機能を備える。

編集部おすすめの関連記事

 TMStudioは、テキストを多角的に分析するために(1)基本情報、(2)頻度分析、(3)注目分析、(4)特徴分析、(5)評判分析、(6)話題分析、(7)時系列分析――という7系統14種類の分析機能を備える。それぞれの機能の詳細は下記の通り。

 基本情報は、データの総量や1行の平均的な単語の数、品詞の情報などのテキストに関する基本情報や属性ごとの集計など、分析する上でまず知っておく必要のある情報を得る機能だ。

 頻度分析は、単語の頻度に関する情報を表示する機能で、属性ごとの集計も可能だ。集計結果は、さまざまなグラフで表示できる。2種類の属性を指定して、クロス集計結果を図示することも可能だ。構文解析で得られた係り受けの情報をもとに、係り受けの頻度を表示する機能も備える。

 注目分析は、注目した単語がどういった使われ方をしているのか、ほかのどういった単語と同時に出てくるかといった情報を表示する。

 特徴分析は、属性ごとに特徴的な単語を抽出する。ターゲットを絞った要求の抽出や属性別の傾向などが把握できる。属性ごとに特徴的な係り受け表現を抽出する機能も備える。

 評判分析は、良いイメージで語られる言葉と、悪いイメージで語られる言葉を抽出する。抽出した単語が原文でどのように用いられているかを確認できる。

 話題分析は、属性と言葉、また言葉同士の関連性の強さをネットワーク図で図示する。関連性の指標として、単語同士の係り受け関係もしくは同時出現(共起)の確率も提示可能。ネットワーク図を整理することによって、関連の強いもの同士のクラスタが把握できる。文章を指定のクラスタ数に分類し、各クラスタの情報をレポートする機能も備える。全クラスタの属性分布と単語分布をグラフで確認できる。各クラスタを構成する代表的な単語を抽出することも可能だ。

分析結果を表示している画面の例
分析結果を表示している画面の例(NTTデータ数理システム提供)
Text Mining Studioのまとめ
用途と機能グラフィカルな操作環境で高度なテキスト分析を処理できるテキストマイニングツール
特徴文章の中に出てくる言葉の頻度や特徴、注目度、評判(ネガティブあるいはポジティブな文脈なのか)を分析する
稼働OSWindows Vista SP2/7 SP1/8.1/10、Wndows Server 2008 SP2/2008 R2 SP1/2012/2012 R2
導入企業横河電機、アイエックス・ナレッジ、ジャパンネット銀行、TOTO、情報工房、TMJ、など

関連記事

ホワイトペーパーランキング

  1. 報告: IT部門と事業部門の「境目」が消え始めた!?世界のITリーダーが回答
  2. 実はオンプレより、クラウドの方が安全!?情シス マサシと一緒に考えるクラウドのメリット/デメリット
  3. “収益10億円への道”を具体的に描く、世界のSaaSビジネス成功企業からの指南書
  4. 日揮やグリーも活用--世界7万6千社で使われるBox事例集
  5. Boxをビジネスに活⽤するために-業種、職種別のユースケース

編集部おすすめ

ピックアップ製品

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ
新興技術
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
統計解析
テキストマイニング
ソーシャルメディア分析
BI
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
学習

ベンダー座談会

Follow TechRepublic Japan