ファイナンス稲門会の皆様、こんにちは
今回は、3月2日に行われました、
「BigData研究会
~大量のパテント情報からブルーオーシャンを探せ~」
をテーマとする稲門アカデミーのレポートが、
幹事の清水正大様より届いておりますので、ご紹介致します(-^□^-)
以下、ご覧ください
ーーーーーーーーーーーーーーーーーーーーーーーー
2015年3月2日に開催された稲門アカデミーでは、
VALUNEX社の中村代表取締役CEOをお招きし、
『大量のパテント情報からブルーオーシャンを探せ』というテーマで、
BigDataの中でも、非構造データの分析結果を可視化する
先進事例をご紹介頂きました!
BigDataは、実体が目に見える例が多くはないため、
BigData分析の実際を体感しづらい面があるかと思います。
同社のサービスでは、大量の特許文書を、1枚のレーダーチャートに
投影することで、技術トレンドやのホワイトスペースの俯瞰、競合分析のための
分析結果を紹介頂きました。
確かに、初めてレーダーチャートみても、何が何だかわかりませんが、
見方を教えてもらうと、確かに、何かが見えてくる気がします!
大量の無機質な文書情報から、こんなグラフィカルな俯瞰図が作れんですね!
俯瞰図以外にも個別事例として、ダイソンで利用されている遠心分離に関する特許に
係る各メーカーの追随事情や追随しすぎて特許侵害になった例もご紹介頂きました。
領域や技術(製品)でも色々見てみたくなりますね!
ちなみに、
技術的要素を振り返ると以下のようなイメージとのこと
・文章を単語に分割
・単語同士で同義語などを同一のものに置き換える(専用の辞書を利用した名寄せ)
・単語の出現頻度(TF:Term Frequency)、逆文書頻度=ドキュメント当たりの出現頻度(IDF:Inverse Document Frequency)という概念で、どんな文書にも出現する単語=重要でない単語、特定の文書に出現する単語=重要な単語 と仕訳し、重要単語をフィルタする
・各単語の出現有無から、各ドキュメントを多次元ベクトル(中村様の分析では6000万次元とのこと)に変換
・ベクトルとベクトルの距離(内積)を計算することで、距離が近い=同一(様)技術に関する文書、距離が遠い=技術が比較的関連しない文書を算出
・各ベクトル(ドキュメント)の距離でクラスタ化し、平面に投影
ご多忙にも関わらず、講演を引き受けて下さった中村様、本当にありがとうございました。
皆さま、今後もBigDataやICT、また、最近のトピックであるFintechに関しても、稲門アカデミーで開催していきたいと思いますので、是非ご参加宜しくお願いします。
ファイナンス稲門会ワーキンググループ清水
ーーーーーーーーーーーーーーーーーーーーーーーー
以上です。
幹事の清水さんありがとうございました(*^_^*)
今後もたくさんのイベントを開催してまいります!
皆様のご参加をお待ちしております