FAQ
Proxem、当社のソリューション、当社のテクノロジー、当社の手法について何かご質問はありますか? よく聞かれる質問に対する答えをいくつかご紹介します。詳細については、お問い合わせください。
データの収集と処理
テキスト・データであれば、どのタイプでも Proxem Studio は処理できます。たとえば、プレーン・テキスト、Web ページ、電子メール、PDF、Word 文書などです。
要件によっては、ページや電子メールの HTML タグをクリーン・アップするなどの前処理を Proxem Studio に組み込み、データに適用することもできます。
データのインポートするときのモードは、次の 3 つです。
- Connect Files モジュールから直接データをインポート: スプレッドシートやその他のファイル(PDF や Word など)からインポート
- Connect Web モジュールを使用した Web ページの収集
- 既存の IS から API を介してインポート
Proxem Studio は、Mediatech-cx、Satisfactory、Critizr、WizVille など、多数の市場管理フィードバック・ソリューションと最初から統合されています。
現在までに、Proxem Studio は、中国語、オランダ語、英語、フランス語、ドイツ語、ハンガリー語、イタリア語、日本語、ポルトガル語、ロシア語、スペイン語など、27 以上の言語に対応しています。
Proxem Studio は、何百万もの原文テキストを難なく統合することができます。
機械学習に基づく自動提案アルゴリズムを完璧に機能させるために、少なくとも 2,000 件のサンプルを入力として与えることをお勧めしますが、Proxem Studio は言語リソースと強力なセマンティック・ルール・エンジンを兼ね備えているため、少量でもきちんと機能します。
Proxem Studio には、マーケット・マッピングやテクノロジー・ウォッチなどの用途のための Web ページ収集モジュールが組み込まれています。
Proxem にはソーシャル・メディア収集ソリューションが搭載されていませんが、よく使っているソーシャル・モニタリング・ソフトウェアを Proxem Studio と連携させて、ソーシャル Web の情報をもとに原文テキストを分析することは可能です。また、Google My Business API を使用して Google Avis のデータを取り込むこともできます。Proxem Studio は、Critizr、Mediatech-CX、WizVille、Satisfactory などの多くのフィードバック管理ソリューションと最初から連携するようになっています。
Proxem にとって、データのセキュリティーと機密性は重要な懸念事項です。
一般論でいうと、Proxem Studio で個人データを扱うことはお勧めしません。ほとんどの場合、原文テキストやドキュメントの作成者を特定する情報は当社にとって必要ありません。
EU 一般データ保護規則 2016/679 (通称「GDPR」)の推奨に従って、SaaS プラットフォームに存在する個人データを保護するようにプロジェクトをセットアップすることをお勧めします。特に次の 3 つの作業が重要です。
- 分析のニーズに必要なメタデータのみを含める。
- 顧客のみが関係者と関連付けることができるキーの使用を促進する。
- テキスト・コンテンツに仮名化を適用する(任意)。Proxem Studio は、名前、電子メール、住所、電話番号などの情報から収集した原文テキストを削除することで、データから個人を特定できないようにします。
分析と分類
分析の信頼性は、いくつかのパラメータと、設定した目的によって異なります。セマンティック分析で最適化しようとしている主な指標が、次の 2 つです。
- 再現率: システムはすべての原文テキストあるいはすべてのドキュメントを分類できるのか? すべての意見が肯定、否定、中立にうまく分類されるのか? 一般的に、再現率そのものを測るのは非常に困難です。というのも、人間がすべてのデータを分類する最初の段階で、システムが「取りこぼす」ものがあるかどうかを把握しておく必要があるからです。この難題を解決する 1 つの方法は、網羅率(自分のドキュメントのどれだけが自動的に分類されるのか)を近似させることです。すべてのカテゴリーに属するすべてのドキュメントを分類できれば、再現率は 100% になりますが、この状態はシステムにとって適切であるとは到底言えません。したがって、再現率と適合率をどう組み合わせるかが重要なのです。
- 適合率: システムが分類するときに、正しく分類されているか? 一般的に、適合率はサンプリングによって測定されます。当社は、分析結果の一部をエクスポートし、人間の専門家に提出します。専門家は、それに基づいて機械の各決定が正しいかどうかを判断します。
プロジェクトのニーズに応じて、いずれかの指標が優先されます。
再現率と適合率の組み合わせにより、全体的な分析パフォーマンス・スコアである F 値(単位はパーセント)が得られます。パフォーマンスのよいケースでは、最高で 95% の F 値を叩き出しています。なお、この値は、ソース、テキストで検出されるクラスまたはコンセプトの数、予算に依存しています。
当社にとって成果物の品質は最優先事項です。Proxem Studio には、セマンティック分析の品質を測定およびモニタリングするモジュールが搭載されているため、プロジェクト全体を通したモニタリングと継続的な改善が可能です。
分類計画の策定は、プロジェクトによって異なり、次の項目に大きく依存します。
- 扱うソースの数
- オープン・クエスチョンの数
- 処理するデータの全体量(教師なし機械学習の改善に結びつくだけの大量のデータが望ましい)
- 言語の数
全般的に言うと、初期設定にかかる時間は平均で数週間であり、本番運用にこぎ着けるまでは 3 ヵ月足らずです。
Proxem Studio は、あらゆる種類のコーパスと形式を処理するように設計されています。教師なし機械学習の能力を持っているため、あらゆるタイプの産業で効果をすぐに発揮できます。
現在、銀行、保険、流通、e コマース、エネルギー、健康、輸送、通信、人事など、あらゆる業種のテキスト・データを処理しています。
はい、通常はそうです。
お客様は一般に数多くのテーマについて話すため、話の本質をすべて把握できることが不可欠です。
もちろんできます。あるいは人並みにコーヒーを作れるかもしれませんが、
それはさておき、一般論で言うと、皮肉や嫌味を検知するのは非常に難しくなります。たとえば、「bravo Macron」(ブラボー、マクロン)と書かれた原文テキストがあったとして、これは皮肉なのか、それとも本物の感情を表しているのか、言葉だけではわかりません。
Proxem Studio は、場合によっては皮肉を理解することもあり得ますが、それには原文テキストだけでなく、概して情報量を増やすという条件が必要になります。一般的には、スコアが 0 の NPS プロジェクトで「Thank you for the delay」(わざわざ遅れてくれてありがとう)という原文テキストがあった場合、ここで捉えられる理由は遅延に対する批判であり、「ありがとう」という表現は皮肉として捉えられ、感謝の言葉としては認識されません。
分類計画は Proxem Studio の中で常に進化しています。日常的に発生するフィードバックや、新しいテーマ、新しいニーズが計画に反映されています。
また、組織内のさまざまな部門の目的に応じて、さまざまなファイリング計画が存在することもよくあります。Proxem Studio は、原文テキストの分類計画だけでなく、扱われているテーマの完全なシソーラスも提供しています。これにより、当初の分類計画では説明されないテーマに関するオーダーメードのスタディで情報を相互参照することがきます。
レポートの生成
Proxem Studio の Report モジュールで、表とデータの視覚的表現を別々に作成できます。
完全設定可能なウィジェットが多数あるので、ダッシュボードを好きな数だけセットアップして、社内に簡単に分散できます。すべての視覚的表現をエクスポートしてプレゼンテーションに組み込むこともできます。また、PDF レポートを作成して電子メールによる共有や受信も可能です。
Proxem Studio でつくられたすべてのデータは、Explore モジュールと Report モジュールに搭載されている Excel または CSV エクスポート機能を使用してエクスポートすることができます。Rest API を介してエクスポートして、ご使用の情報システムと完全統合することもできます。
技術
Proxem Studio は主に Microsoft .NET テクノロジーを使用して開発されており、ElasticSearch 検索エンジンをベースにしています。
言語処理アルゴリズムは Proxem の研究開発の成果であり、Proxem によって完全開発されました。
チャットボットと電子メール応答のアシスタントを展開するための Dialog モジュールは、一部が Microsoft Bot Framework をベースにしています。
Proxem Studio が機械学習(ML)による AI とエキスパート・システムを同時に活用できるのは、強力なセマンティック・ルール・エンジンのおかげです。
Proxem Studio では、自動言語処理のためのさまざまなレベルの機械学習アルゴリズムが統合されています。たとえば、ニューラル・ネットワークや分布分析のモデルに基づく言語モデルの機械学習、コーパス内で扱われているテーマを検出するための教師なし学習(単語埋め込みやクラスタリング)、教師あり学習アルゴリズムなどがあります。
当社の研究開発の詳細については、こちらをクリックしてください。
サービスとサポート
はい。お客様のプロジェクトにプロジェクト・マネージャーが 1 人付き、Proxem Studio のご利用をサポートします。
また、カスタマー・サクセス・マネージャーが、ワークショップやトレーニングを定期的に開催し、お客様の組織への導入やよい実践方法をサポートするほか、ソフトウェア開発のニーズを考慮したサポートも行います。
プロジェクトごとに、ソフトウェアと各種モジュールの取り扱いに関するトレーニングを提供しています。
また、「Power User」トレーニングもご用意しています。このトレーニングを受けると、セマンティック分析プロジェクトを自由に実施できるようになります。
レベル 1 のサポートは、専用の電子メール・アドレス経由でご利用いただけます。受け付けの時間帯は、平日の午前 9 時から午後 6 時 30 分までの間です。
どのプロジェクトにも必ずプロジェクト・マネージャーとしての窓口が 1 つ設けられ、レベル 1 のサポートを受けることができます。
ニーズやプロジェクトの複雑さによっては、次のような追加のサポートが受けることもできます。
- 年間を通してのトレーニング
- セマンティック分析の継続的な改善
- ニーズに応じた個別のコンサルティング(IT サポート、ダッシュボードの実現のサポート、顧客のニーズに応じた調査など)
個別の見積もりについては、お気軽にお問い合わせください。
価格
Proxem Studio のサブスクリプションの価格は、次の条件に応じて変わります。
- 月間/年間の全体的なデータの処理量
- プラットフォームのユーザー数は、プロファイルによって異なります。Power User はすべての機能にアクセスが可能で、たとえばセマンティック分析の設定を可能にするモジュールにアクセスできます。Analyst は Explore モジュールと Report モジュールにアクセスしてデータの分析、ダッシュボードの作成と配布などを行うことができます。Reader ができるのは Report モジュールにアクセスしてダッシュボードを参照することだけです。
- 使用可能な言語の数
- サポートとトレーニングのレベル
個別の見積りについては、お問い合わせください。
Power User ライセンスを選択し、セマンティック分析を自分で設定する場合を除いて、コストはかかります。
セットアップのコストは、ソースの数、オープン・クエスチョンの数、実装する分類プランの複雑さに応じて変わります。
個別の見積りについては、お問い合わせください。