Research Survey and Memo: June 2004 Archives

June 29, 2004

Research Directions for Ubiquitous Services

Kenichi Yamazaki,
"Research Directions for Ubiquitous Services",
2004 International Symposium on Applications and the Internet (SAINT2004), p.12, January 2004.
IEEE Xplore

SAINT2004でkeynote(Tutorial?)になっていた論文である。著者はNTT Docomoの人である。
タイトルを直訳すると「Ubiquitous Serviceの研究とその将来」について...となると思われる。

論文の概要について書く。

UCE: (Ubiquitous computing environment)が近い将来出現するだろう。
すでにInternet上で提供されているサービスとUbiquitous Serviceとの違いは

1. サービスはしばしば物理的な条件(状況)を引き金として提供される
2. サービスはある条件が満たされた時に提供されるので，サービスはユーザの状況または実世界の状態を知っているという前提を置くことができる．
3. サービスはユーザがそれを期待していなくても提供される．なぜならばこのようなサービスはユーザの意図ではなく，システムによって自動的に提供されるからである

これらの特徴から考えられる技術的問題は以下の通り

1. 物理環境データの量は非常に多く，またそれを実時間で処理する必要がある．したがって，処理の拡張性や連続性は重要である．

2. サービスは実世界を十分理解したうえでintelligentである必要がある．これはしばしば"Context-Awareness"と呼ばれる．データ量は多く処理の実時間性も高いので人がそれらのデータを扱うのが困難なのは明らかである．したがってintelligence性が，人との対話処理なしで処理を行うことを可能にしなければならない

3. サービスは時によって人の注意を得るために妨害的な処理になるかもしれない。しかし，時によっては人の注意を引かず，処理をひっそりと自動的に行うかもしれない

以下に挙げるような，多くの技術領域における技術が必須になるだろう

1. 実世界情報を感知する手段の探求と改善:
感知，処理，無線通信のハードウェア，エネルギー消費のハードウェア技術の進歩が必要だろう．またOSやmiddlewareの進歩も必要だろう．また環境データ処理の拡張性，切断処理，効率的な資源管理，そして実時間での自律反応も必須の機能である．そのようなOSは単に既存のOSの単純化したものでは役に立たないだろう．なぜならば，求められる仕様や制約条件が既存のOSとはまったく異なるからである．

2. 実世界の理解する手段の探求と改善:
RFIDは物理世界における物体を認識可能にする技術として最有力の技術である．しかし、RFIDは単に物理物体を認識可能にするだけであって，理解にはまだほど遠いのが実情である．実世界におけるOntologyがこの問題に対する解決策になるかもしれない．他のAI関連の技術が判断と学習のために必要となるかもしれない

3. ユーザとサービスを理解する:
ユーザの注意，意図，振る舞いそして好みなどを理解する必要がある．一方で「何がサービスなんだ?(what are services?)」という大きな問題がある．サービスが何かを理解できなければ，対象とする状況でなにが最も適切なサービスなのかを決定することができない．サービスを記述するために多くの技術が提案されているが，それらが十分なものなのかどうかは我々もまだわかっていない．

さらに商用上の問題と捕らえた場合，以下の問題もある

- 既存のネットワークをどのように発展(evolve)させるか
- 顧客にどのようにして利益と安全性を確信させるか

我々は，実世界に対する"practical provision"を持ったUbiquitousサービスを考えなければならない

Posted by z at 04:02 AM

June 28, 2004

CircleView - A New Approach for Visualizing Time-related Mutidimensional Data Sets

Daniel A.Keim, Jorn Schneidewind, Mike Sips,
"CircleView - A New Approach for Visualizing Time-related Multidimensional Data Sets",
Advanced Visual Interface - AVI2004, pp.179--184, , May 2004.
ACM Digital Library

時間をキーとして参照可能な多次元情報の視覚化システムであるCircleViewに関する論文．
CircleViewは階層構造情報の視覚化(Ex. treemap)と円形表示(Ex. Pie Chart and Circle Segments)を組み合わせた視覚化手法である．

このシステムの主たる目的は，時間に応じて変化するデータ集合からパターンや例外，そして類似性を認識できるようにすることである．またこのシステムは対話的操作も可能であり，探索的なデータ解析も支援できる。また類似性や順序付けアルゴリズムを応用することでデータの相関や例外部位の調査機能も持ちあわせている．

論文の内容を大雑把に書いておく

時間情報を持つ情報の視覚化システムは多く提案されているが，それらは時々刻々変化するデータの動的特徴を捕らえる手段を与えていない．このようなデータの場合，実時間におけるパターンを見せることが重要であると同時に，全データ時間帯におけるイベント履歴を保持し，見せることができる必要がある．

本研究では，これまでの考察を元に、設計上の着眼点として以下の点に留意し、念頭においたシステム設計を行う

1. top level view (最上位からの表示)
2. highlighting of important information (最重要情報のハイライト化)
3. interactivity (対話性)
4. details on demand and drill down (必要に応じて詳細を提示，さらなる詳細化)
5. continuous data stream displays (連続したデータ流の表示)
6. intuitiveness of the visulization method (直感的な視覚的表示)
7. comparison of data stream attributes (データ流の属性比較)

探索的な情報解析(EDA: Exploratory Data Analysis)は以下のような3つのステップで行われる - (これについてはSHNEIDERMAN著のInformation Seeking Mantra:という参照があった)

1. まず概略を見て(Overview first)
2. フィルタと注目をし(zooming and filtering)，
3. そして必要に応じて詳細を見る(details-on-demand)

視覚化方法は，混乱を避けるため単純化されている。基本形は円であり、円周方向に視覚化対象の情報の属性値の数分だけ分割する(ケーキ切り)．つまり6次元の情報であれば6分割する．また半径方向には時間を割り当て(つまり時間軸は円の半径軸に沿っている)，適当な時間間隔ごとに分割してマスを作り、その各マスに情報を表示する．データの詳細を見たい時には，ある時間帯を表すマスを選択する．するとマスを区切っている時間間隔が変更され，さらに詳細な時間間隔でデータが表示されることになり、結果としてデータの詳細を見ることができるようになる．なお各マスの色によってデータ(集約値/要約値)を表している．

相関やパターンを発見するためには，類似しているマスが近くにあることがユーザにとっては望ましい．類似したマスを探し、並べ替えることが必要だが，そのためには類似しているマスを探し出すことが必要である．その方法としてはいくつかの手法がある(discrete Fourier transformやwavelet)が，その手段の詳細は触れない．ここでの主張は，Circle Viewは表示の順番を変えることができ，マス目間での類似性発見を支援できるようになっているということである．

属性値の時間変化を把握するのは簡単である．新たなデータが得られると表示はリアルタイムに変化する．図4の例ではこれまでのデータが円の中心方向に移動し，新しいデータが円の最外周に追加されていくのを見ることができる．もちろん，リアルタイムに表示をデータの更新に自動追従させてもいいし，静的表示にして過去の情報を閲覧することもできる．

また単一CircleView表示の拡張として複数のCircleViewを表示し，その情報の種別やカテゴリーに応じて情報を再構成し，それぞれのViewに割り当て表示するとともに，その重要さに応じて円の大きさを変更することで，複数の多次元情報の情報提示を行うことも可能である．

本論文ではCircleViewという新しい対話的視覚化システムを提案した．この手法はTreeMapなどに代表される階層的情報の視覚化技術と Pie ChartやCircle Segmentなどに代表される円形配置の手法を組み合わせた手法である．本手法の主たる目的は連続して得られるデータの特徴変化を比較できるようにし，パターンの認識，例外や類似性の発見を支援することである．CircleViewは対話機能を提供しており，ユーザの要望に応じて詳細情報を見ることを可能にしており，探索的なデータ解析を可能にしている．また類似及び順序づけアルゴリズムの利用により，データの相関や例外の探索能力も有している．

Posted by z at 03:10 AM

June 16, 2004

The MyLifeBits Lifetime Store

Jim Gemmell, Roger Lueder and Gordon Bell,
"The MyLifeBits Lifetime Store",
ACM SIGMM 2003 Workshop on Experiential Telepresence(ETP 2003), pp.80--83, November 2003.
ACM Digital Library

記憶媒体(ハードディスク)の技術の進歩により、人の人生に関する全ての情報をデジタル化し、記録することも可能になりつつある．MyLifeBitsは人の生涯において価値のある情報を記録し、管理するためのシステムである．MyLifeBitsはその人が見たり聴いたりした、 webページ、電話の通話記録、視聴したラジオやテレビなどを記録する．本システムは、情報に依存したリンク構造やデータベースの特徴を生かし、これらによって記録された情報をいかに何らかの形で有用にするかということに焦点を当てたアプリケーションである．

という、俗に言う「全部録り」システムの研究である．

論文の内容を「つまみ書き」する

- MemexというVannevar Bushが1945年に描いていた個人情報記録システムに刺激されて開発されたシステム。
- Memexは文書、写真やaudioを記録し、それらがfulltext search、声や音による注釈付け、そしてハイパーリンクによる構造化が可能なシステムであった。
- MyLifeBitsはまさにこれを具現化したもので、情報収集、記録そして管理を支援するシステムとなっている。
- 技術の進歩は、様々な情報をデジタル化し(capture)、記憶すること(Storage)を可能にした
- 必要なのはこれらの情報をいかに有効活用できるようにするツールを開発できるか? である。MyLifeBitsは、これらの記録の閲覧(browsing)、検索(searching)、管理(managing)そして楽しむこと (enjoying)を支援するために設計されている。
- この論文では、この点において情報に依存したリンク(typed links?)とデータベース機能がこれらの機能実現の「鍵」であることに焦点を当てる。

- MyLifeBitsは情報収集、記録、検索、報告、注釈そしてストーリ作成を支援する
- MyLifeBitsのデータモデルはentry(写真や文書)とそれらを結ぶTyped linkによって成り立っている。
- typed linkの例としてはcontact情報からphotoへ結ばれたlinkは「写真中の人」というlinkになる。
- このように情報が大量にある場合には注釈が非常に重要となる
- 注釈は簡単に作成できなければならず、ユーザが好みそうな方法でなければいけない。

- MyLifeBitsでは、既存のfolder(directory) treeが非対称方向グラフ(DAG)の集まりに置き換わる
- いかなるオブジェクトもいくつかの親collectionによって関連づけられることになる(もちろん、制約上、ループ状の関連付けは作られない)
- この関連付けは注釈同様、簡単に作れるべきである。例えばWebブラウザのボタンを押すと、見ていたWebページが"読んだWebページ"として関連づけられるという具合である。

- このfolder(directory)階層という概念からtyped linkへの移行は単に重要という以上のものである．なぜならば，それらのリンクには意味があり，意味のある情報間だけがつながっているとともに，間違った情報間の関連づけができなくなるという利点もあるからである．例えば，日付にlinkされている情報は，検索範囲を狭めるという点で有効であると考えられ，イベントにlinkされている情報は，特定のイベントに関連した情報であり，人にlinkされている情報は，その特定の人に関する情報であることが明白だからである．また，誤った関連付けができない例として，写真を"Samからの電話"にlinkづけようとしてもそれはできない．なぜならば，"〜からの電話"リンクは，写真と人名間に作成することはできず，人名からphone callへのリンクのみとなるからである

- User Intefaceは簡単で，現在注目しているinstanceにlinkしている全ての情報を提示することができる．Thumbnail viewとtimeline viewがあり，時刻に関するリンクや各情報の概要を見ることもできるようになっている．またlink typedはマウスがinstanceの上にある時にpop upされ，見ることができる．

- 検索の高速化のためにデータベースを使っている．検索履歴は保存してあり，過去の検索条件を繰り返し使うことができる．またシステムとしてGUIやSQL 等では簡単に指定できないような検索をできるようにしておくことが大事だろう．例として「最近使われているファイル」という例が挙げられている．

- またデータベースを使っているのでレポートを生成するのも簡単である．Lifetimeにおいて何を記録し，どのようにそれを使っているかを知るのも容易である．例として「よく見に行くWebページ」とか「fundingという文字が含まれているメールが来る時刻」といった例が挙げられている．現行のシステムには7種類のレポートが含まれており，もちろん追加可能である．

- データベースのindexを使って，マーキング(pivot)をすることも可能である．特に時刻を使うことは有効であろう．あるイベントに関する時刻をマーキングしておき，のちにその時刻周辺にあるすべての情報を見るといったことができる．例えば，ある時期に不動産屋と会って土地の紹介をしてもらい，その土地情報をWebページで見ていたが，その当時はさほど興味がなかったためその時はそれまでで終わっていた。しかし数ヶ月後になって，その土地に再び興味が沸いたが，その土地のWebページを思い出すことができず，見ることができない．こんなときにMyLifeBitsを使えば，それは簡単に発見できる．不動産屋の情報を見つけ出し，それにlinkされている情報を得る．その中から電話通話の情報を見つけ出し，それを一つずつ聞いて，その通話の中に含まれているURLを見つけだす．ということになる．しかし，この方法は退屈である．こんなときにtime/pivot法が生きてくる．不動産屋との電話を見つけ出し，その「電話をしている最中」という時間ですべての情報を検索すれば目的のWebページはすぐに見つかるだろう(土地のWebページは電話している最中に見に行っていたとする)．もちろん，Webページはnetworkを介して得るのではなく，その時点ではすでにMyLifeBitsに記録されているのである．

- 利用履歴もいろんな形で使用できる．ハイライトすべき場所の検出や，注目する必要のない部位のスキップなどの抽出に応用できる．これはmovieの再生時に，前回見ずに飛ばした部分を同じように飛ばして再生することも可能である．

- データベースを使用していることで，検索結果を柔軟かつ便利な方法で限定することもできる．例えば，単に検索を行えば，文書，写真，ビデオなどさまざまな情報が結果としてえられるものをビデオだけに限定するといったことが簡単にできる．また，属性値によってクラスタを作り，それを用いてフィルタリングすることもできる．例えば，larget-gapやk-means法
でクラスタを作り，ユーザは検索結果を狭めるために，特定のクラスタに注目して，それに含まれる検索結果を得ることもできる．時間，Webページのタイトル，e-mailのsubjectなどがそれに使えるだろう．

- 本システムではすでに二つのlink提示プログラムを実装している．1つは写真capture wizardで，写真とカレンダー内のイベントとをlinkする．もう1つはtelephone recording applicationで，caller-IDに一致した電話番号とその通話記録をlinkするものである．

- 仮想的に記録領域は無限大という時代に入りつつある，そして人が体験するありとあらゆる形の情報を記録することができるようになった．問題はそうやって蓄えられた情報をどのように有効活用できるようにするかである．MyLifeBitsではtyped linkやdatabase，視覚化，complex query そしてtime pivotが有効な情報収集に有効であることを示してきた．

- もちろん本研究には多くの課題がある．特にprivacy問題、自分と他人の人生との比較対話(?)，social and user interfaceの問題が残されている．

要するに情報検索の分野とかとか、他のいろんな場面で問題になっているように「情報自体は簡単に収集できるようになり、そして蓄える事ができるようになったが、それを有効活用できるようにする方法がない。だからそのための一手段としてtyped linkというものを提案し、情報間を意味を持ったリンクでつないでいけば、その膨大な情報を有効活用できるようにする一手段となりうるだろう」というところだろうか...

このProjectのWebページは、こちら(Microsoft Research)である。

Posted by z at 02:43 AM