神戸のデータ活用塾!KDL Data Blog

KDLが誇るデータ活用のプロフェッショナル達が書き連ねるブログです。

テキスト分析入門(4):テキスト分析サービスの比較をしてみた

こんにちは、DIチームの垣内です。

これまでの「テキスト分析入門シリーズ」ではテキスト分析とは何かという概要と活用方法を8つご紹介しました。今回は実際に利用できる日本語のテキスト分析サービスをご紹介します。

 

 

今日までに様々な企業が日本語のテキスト分析サービスを提供していますが、その多くは「翻訳」「要約」など特定の活用方法に特化したものとなっています。では、実際に業務で使いたい場合は、どのような視点でサービス選定をしたら良いのでしょうか?また、汎用的な分析ができるサービスにはどのようなものがあるのでしょうか?

 

選定にあたっては、「どういう分析をしたいか」という目的設定と、「自社で運用しているCRMがどのサーバー上で動いているか」という確認は必ず行いましょう。この2つを確認することで、目的に即したサービス選定が可能となります。

 

さて、日本語のテキスト分析が出来るサービスはどのようなものがあるでしょうか?
調査した所、グラフやワードクラウドといった分析結果を視覚化するサービスは沢山存在していますが、分析結果をシステムに組み込めるサービスはあまりないことが分かりました。

 

本記事では、汎用的なテキスト分析機能が可能でシステムに組み込みやすい、MicrosoftAWSGoogleの3社より提供されているサービスの概要と機能・金額を比較しながらご紹介していきたいと思います。

 

 

テキスト分析サービス3選 ~概要編~

Microsof社が提供するテキスト分析サービス

Microsoft社からは「Text Analytics」と「LUIS」が提供されています。
「Text Analytics」は、文章から感情やキーフレーズといった特徴を発見することに特化した機能が提供されています。
一方の「LUIS」では、文法構造を明らかにする機能や文章理解する機能が提供されています。


それぞれのサービス特性がやや異なりますが、サービスの紹介ページにはデモ画面があるので、機能を試すことができるようになっています。

azure.microsoft.com

azure.microsoft.com

 

AWSの提供するテキスト分析サービス

AWSからは「Amazon Comprehend」が提供されています。
このサービスは文法構造を明らかにする機能だけでなく、感情やキーフレーズといった文章の特徴を発見することができます。


アカウントにログインすると、画面上で「Amazon Comprehend」を簡単に機能を試すことができます。

aws.amazon.com

Googleの提供するテキスト分析サービス

Googleからは「Natural Language API」と「AutoML Natural Language API」というテキスト分析サービスが提供されています。
「Natural Language API」では、文法構造を明らかにする機能に加え、感情分析が出来るサービスとなっています。
「AutoML Natural Language API」では、独自にモデルを構築することができます。

※「独自にモデル構築する」をわかりやすく表現すると「業務に沿ってにNatural Language APIをカスタマイズする」という事です。

 

英語で書かれていますが、サービス概要ページから分析結果を見ることができます。

cloud.google.com

 

 

テキスト分析サービス3選 ~比較編~

さて、各社が提供するサービスの概要を簡単にご紹介しました。具体的な機能の違いや金額感は比較表を用いて説明していきたいと思います。

各機能ではたくさんの用語が出てくるので、適宜この用語整理表をチェックしてください。

用語整理表

f:id:kdl-di:20211020111522p:plain



<機能比較>

MicrosoftAWSGoogle各社が提供しているサービスの機能を表にまとめてみました。

f:id:kdl-di:20211029173640p:plain

Microsoftでは2つのサービスに分かれていますが、AWSと同じく幅広い分析が可能となっています。製造業ではMicrosoft Azure(Microsoft提供のクラウドサービス)の別サービスが使われていることもあるので、社内の人に聞いてみましょう。

AWSの「Amazon Comprehend」は幅広く分析が出来るのが特徴的です。色々な分析してみたいといった場合に最適なサービスです。

もし上記のサービスを使っても、分析結果に物足りなさを感じた場合は、自分たちで独自のモデル(AI)を作ることができるGoogleの「AutoML Natural Language API」を選ぶとよいでしょう。段階的にテキスト分析の難易度を変更できる所が他にない特徴となっています。

 

<金額比較>

金額面で比較してみましょう。

f:id:kdl-di:20211105112559p:plain

各種サービスの料金体系をまとめてみましたが、どこも独自の単位を用いてるので、「1件当たり500文字の文章、1万件」という条件で分析した際の金額でサービスを比較してみました!(※2021年8月時点での価格で計算)

Microsoft Azureのサービスから見ていきましょう。
「Text Analytics」は月約1万1200円、「LUIS」では月約1,680円かかってきます。
文章から特徴を発見することに注力したいと決まっている場合は「Text Analytics」、文章理解に注力したいと決まっている場合は「LUIS」を選択するのが良いでしょう。

AWSの「Amazon Comprehend」の場合、機能ごとに課金されるので構文解析のみの場合は月約250円、感情分析だと月約500円、イベント検出をする場合は月約1万5000円となっています。最小限の分析だけで良い場合はAWSを使うのがおススメです。

Googleの「Natural Language API」の場合、大量の文章を分析したい場合やカスタマイズが必要な場合にお勧めです。

 

 

まとめ

会社でMicrosoft Azureを使っているという方で、文章から特徴を発見することに注力したいと決まっている場合は「Text Analytics」、文章理解に注力したいと決まっている場合は「LUIS」をおススメします。

 

金額を気にしつつ、まずは最小限で分析したいという方や、金額は気にせず沢山色んな分析機能を使いという方は「Amazon Comprehend」がおススメです。

 

業界用語が多い・専門分野の文章を扱う方で、より良い精度が必要な方はGoogleの「Natural Language API」で一度精度を試した後、「AutoML Natural Language API」でカスタマイズするというステップを踏んでみてはいかがでしょうか?

最後に

テキスト分析入門シリーズ全4回を通して、どんな分析が出来るのかという説明と、実際に分析をする際はどんなサービスを選べば良いかご紹介させていただきましたが、いかがでしたでしょうか。

テキスト分析に限らず、データを活用したい際は「アイデアを発散させつつ、どういう課題を解消したいか目的を定める」という段階が重要になってきます。

分析アプリケーションの構築だけでなく、課題の発見から解決方法の提案まで幅広くご相談を承っております。ご興味のある方は是非お問合せ下さい!

 

 

 

垣内優花

データインテリジェンスチーム所属
テキスト活用するプロジェクトを担当。ビジネスを意識したデータ活用を考えるデータアナリスト。初心者向けの情報・テキスト活用について発信していきます!