クレームの構造解析

ITmediaニュース:特許文書を読みやすくする専用解析技術、NTTデータが開発

難解な特許文書を読みやすいように表示します──NTTデータは、自然言語処理技術を活用し、特許文書を解析して視覚的に表示したり、類似特許検索のためのキーワードを抽出することができる新技術を開発した

という記事が出ています。

形態素解析テキストマイニングにもよく用いられている方法で、とりたてて新しいものだとは思えませんが、よくもまあクレームを解析しようと考えたものだと感心しました。

sk_nttdata

上記ニュースサイトに掲載されている解析例を見ると、うまく解析できているように見えますが、記載方法は、人により千差万別ですし、句読点の打ち方一つで全く変わった意味になってしまいますから、そこまでうまく判別できるのか、知りたいところです。記事によれば、

10月12~14日の「特許・情報フェア&コンファレンス」(発明協会主催、東京・科学技術館)で、請求項の構造を視覚化する機能などを中心としたシステムを展示する。

ということですので、もし見てきた人がおられましたら、どんなだったかご教示下さいませ。

ところで、形態素解析を特許の分野に応用する試みがこれまでになされていたのかどうかは知りませんが、個人的には、特許公報の全文データを、形態素解析することによって、公報自体を読まずに類似技術を探索したり、パテントのポートフォリオ解析ができないかと思って、自分のPCにフリーの形態素解析システムの茶筌奈良先端科学技術大学院大学で開発)をインストールしています。時間もないし、病気になったりしたため、まだできていませんが、いずれ手をつけようと思っています。

さて、余談ですが、新入社員や未経験者などに実務を指導するOJTの現場では、クレーム作成は個々のスキルに属する暗黙知の部分。これをいかに伝達するか、いろいろと苦労が絶えないことと思います。上のクレーム構造の解析図を見ていて思ったのですが、このようにエレメントとサブエレメントをきっちりと分けて、互いの修飾関係を間違えないように線で結んでから、日本語の文法に沿って記述するようにしてOJT教育をしてはどうかな、と感じました。少なくとも、論理的に明確なクレームが作成する訓練になりそうな気がします。