BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Nuxeoによるfiseセマンティックエンジンの紹介

Nuxeoによるfiseセマンティックエンジンの紹介

ブックマーク

原文(投稿日:2010/09/02)へのリンク

Nuxeo社の社員ブログに最近投稿された記事のなかで、NUXEOが貢献しているオープンソースのRESTfulなセマンティックエンジンであるfise (Furtwangen IKS Semantic Engine)が紹介されている。fiseの目的は、開発者に、開発の際の足がかりとなる再利用可能なHTTPセマンティックサービスの一群を提供することで、セマンティックに関する新しい機能や、流行の機能をCMSにもたらすことだ。fiseは、セマンティックWebを利用可能にすることで、CMSの提供範囲を広げようという、より大きな取り組みであるIKS(Interactive Knowledge Stack)の一部である。

セマンティック・エンジンは、非構造データ(テキストファイルなど)を入力として受け取り、検索可能なインデックスと用語索引を生成し、入力データの「意味」を抽出する。例えば、セマンティック・エンジンは、典型的には、文書を分類することができる(言語やトピックによる分類や、推奨タグの付与、既知のエンティティ(名前や場所、日付など)の抽出など)。この種の分類情報を利用することで、エンジンは関連する文書をソートしたりリンク付けしたりできるとともに、主張内容を抽出することができる(X社がY社をこの日にこの値段で買収したなど)。コンテンツ管理システムでは、主にテキスト(多くの場合はマルチメディア・テキスト)の作成や永続化、構造化された整理などに関心が集まるので、セマンティック・エンジンと連携することは、コンテンツの検索と整理に明らかに役に立つ。コンテンツ管理システムは、企業内で文書が作成されたり利用されたりするのを追跡するために主に利用されることもあれば、洗練されたサイトを含むすべての「文書」(Webページ)を整理および管理するために利用される場合もある。「セマンティックWeb」を構築するための取り組みの一面として、すべてのWebページがこの種のセマンティック・エンジンによって作成された分類、インデックス作成、用語データなどを包含するべきだ。

Open CalaisZemantaEvriなどは、Web API経由で利用可能なセマンティック・エンジンの例であり、これらは、WebページやWebサイトに意味を付与し、注釈をつける。この種のセマンティック・エンジンの祖先は、IZEであり、この製品は、ウィスコンシン州マディソンのPersoftという小さな企業によって1988年から開発、販売されていた。

セマンティックに注釈をつけることの論理的裏付けは、Olivier Grisel氏(Nuxeo blogの著者)によって次のようにまとめられている。

個々のコンテントを、オープンで普遍的なデータベース(DBpediaやfreebase、NY Times databaseなど)で定義されたセマンティックなエンティティやトピックと、ひも付けることで、オンラインWebサイトやイントラネットのようなコンテンツ主導のアプリケーションが共通の思考の枠組みを共有し、お互い発見しやすくなり、相互運用性も高まる。

情報発信者は、このような技術を利用して、自動的に更新されるエンティティ・ハブを構築することができる。このハブは、厳密さを排除した、アプリケーションをまたいだ普遍的な識別子で認識されるセマンティック・エンティティと関連づいた様々な種類(ドキュメントやカレンダのイベント、人や組織…)のリソースを集約する。

fiseは、エンドポイントとして定義された3つの基本的なHTTPサービスを提供する。

fiseは、3つのHTTPエンドポイントを提供する。engineとstore、sparqlのそれぞれのエンドポイントだ。
  • /engineエンドポイントを利用すると、英語の文章を分析して、サーバーに何も保存することなく分析結果を送り返してもらうことが可能だ。これは、ステートレスHTTPサービスである。
  • /storeエンドポイントも同じ分析を行うが、結果をfiseサーバーに保存する。これはステートフルHTTPサービスである。分析結果は、後ほど参照することができる。
  • /sparqlエンドポイントは/storeエンドポイントに送信するコンテンツを抽出するための、複雑なグラフに対する問い合わせを行うマシンレベルのアクセス方法を提供する。

これらのサービスは、手動でエンジンの性能を評価したい場合、Webユーザインターフェースを使ってアクセスすることが可能であり、結果はブラウザを使って取得することができる。この機能は、主にデモ用途のものだ。fiseを利用する2つめの方法は、文書の内容に付加価値を付与するためにHTTPサービスとしてfiseを利用するマシン(Nuxeo DMやNuxeo DAMのようなサードパーティのECMアプリケーションなど)から接続を行うために、RESTful APIを利用するものだ。

組織や個人は、継続的に処理しなければならない、構造化されていない文書を中心とした大量の情報の中に埋没しつつあることに気付きはじめている。これが理由で、コンテンツ管理システムや、セマンティックエンジンの技術を備えたCMSにますます関心があつまっている。Nuxeoは、自身がCMSサービスの提供者であり、fiseを自社の製品ラインに統合する計画をもっている

現時点では、fiseは主にデモ用途の基本的なWebインターフェースを備えたスタンドアロンのHTTPサービスである。これを真に有用なサービスにするためには、Nuxeoのプラットフォームと統合して、Nuxeo DMや、Nuxeo DAM、Nuxeo CMFのユーザが統合されたセマンティック環境の利点を享受する必要がある。

 

あなた、もしくはあなたの属する組織は、どれぐらいCMSを利用しているだろうか。また、コンテンツにセマンティックな属性を付与することで、どのような価値を見いだすだろうか。

この記事に星をつける

おすすめ度
スタイル

BT