June 16, 2004

The MyLifeBits Lifetime Store

Jim Gemmell, Roger Lueder and Gordon Bell,
"The MyLifeBits Lifetime Store",
ACM SIGMM 2003 Workshop on Experiential Telepresence(ETP 2003), pp.80--83, November 2003.
ACM Digital Library

記憶媒体(ハードディスク)の技術の進歩により、人の人生に関する全ての情報をデジタル化し、記録することも可能になりつつある.MyLifeBitsは人の生涯において価値のある情報を記録し、管理するためのシステムである.MyLifeBitsはその人が見たり聴いたりした、 webページ、電話の通話記録、視聴したラジオやテレビなどを記録する.本システムは、情報に依存したリンク構造やデータベースの特徴を生かし、これらによって記録された情報をいかに何らかの形で有用にするかということに焦点を当てたアプリケーションである.

という、俗に言う「全部録り」システムの研究である.

論文の内容を「つまみ書き」する

- MemexというVannevar Bushが1945年に描いていた個人情報記録システムに刺激されて開発されたシステム。
- Memexは文書、写真やaudioを記録し、それらがfulltext search、声や音による注釈付け、そしてハイパーリンクによる構造化が可能なシステムであった。
- MyLifeBitsはまさにこれを具現化したもので、情報収集、記録そして管理を支援するシステムとなっている。
- 技術の進歩は、様々な情報をデジタル化し(capture)、記憶すること(Storage)を可能にした
- 必要なのはこれらの情報をいかに有効活用できるようにするツールを開発できるか? である。MyLifeBitsは、これらの記録の閲覧(browsing)、検索(searching)、管理(managing)そして楽しむこと (enjoying)を支援するために設計されている。
- この論文では、この点において情報に依存したリンク(typed links?)とデータベース機能がこれらの機能実現の「鍵」であることに焦点を当てる。

- MyLifeBitsは情報収集、記録、検索、報告、注釈そしてストーリ作成を支援する
- MyLifeBitsのデータモデルはentry(写真や文書)とそれらを結ぶTyped linkによって成り立っている。
- typed linkの例としてはcontact情報からphotoへ結ばれたlinkは「写真中の人」というlinkになる。
- このように情報が大量にある場合には注釈が非常に重要となる
- 注釈は簡単に作成できなければならず、ユーザが好みそうな方法でなければいけない。

- MyLifeBitsでは、既存のfolder(directory) treeが非対称方向グラフ(DAG)の集まりに置き換わる
- いかなるオブジェクトもいくつかの親collectionによって関連づけられることになる(もちろん、制約上、ループ状の関連付けは作られない)
- この関連付けは注釈同様、簡単に作れるべきである。例えばWebブラウザのボタンを押すと、見ていたWebページが"読んだWebページ"として関連づけられるという具合である。

- このfolder(directory)階層という概念からtyped linkへの移行は単に重要という以上のものである.なぜならば,それらのリンクには意味があり,意味のある情報間だけがつながっているとともに,間違った情報間の関連づけができなくなるという利点もあるからである.例えば,日付にlinkされている情報は,検索範囲を狭めるという点で有効であると考えられ,イベントにlinkされている情報は,特定のイベントに関連した情報であり,人にlinkされている情報は,その特定の人に関する情報であることが明白だからである.また,誤った関連付けができない例として,写真を"Samからの電話"にlinkづけようとしてもそれはできない.なぜならば,"〜からの電話"リンクは,写真と人名間に作成することはできず,人名からphone callへのリンクのみとなるからである

- User Intefaceは簡単で,現在注目しているinstanceにlinkしている全ての情報を提示することができる.Thumbnail viewとtimeline viewがあり,時刻に関するリンクや各情報の概要を見ることもできるようになっている.またlink typedはマウスがinstanceの上にある時にpop upされ,見ることができる.

- 検索の高速化のためにデータベースを使っている.検索履歴は保存してあり,過去の検索条件を繰り返し使うことができる.またシステムとしてGUIやSQL 等では簡単に指定できないような検索をできるようにしておくことが大事だろう.例として「最近使われているファイル」という例が挙げられている.

- またデータベースを使っているのでレポートを生成するのも簡単である.Lifetimeにおいて何を記録し,どのようにそれを使っているかを知るのも容易である.例として「よく見に行くWebページ」とか「fundingという文字が含まれているメールが来る時刻」といった例が挙げられている.現行のシステムには7種類のレポートが含まれており,もちろん追加可能である.

- データベースのindexを使って,マーキング(pivot)をすることも可能である.特に時刻を使うことは有効であろう.あるイベントに関する時刻をマーキングしておき,のちにその時刻周辺にあるすべての情報を見るといったことができる.例えば,ある時期に不動産屋と会って土地の紹介をしてもらい,その土地情報をWebページで見ていたが,その当時はさほど興味がなかったためその時はそれまでで終わっていた。しかし数ヶ月後になって,その土地に再び興味が沸いたが,その土地のWebページを思い出すことができず,見ることができない.こんなときにMyLifeBitsを使えば,それは簡単に発見できる.不動産屋の情報を見つけ出し,それにlinkされている情報を得る.その中から電話通話の情報を見つけ出し,それを一つずつ聞いて,その通話の中に含まれているURLを見つけだす.ということになる.しかし,この方法は退屈である.こんなときにtime/pivot法が生きてくる.不動産屋との電話を見つけ出し,その「電話をしている最中」という時間ですべての情報を検索すれば目的のWebページはすぐに見つかるだろう(土地のWebページは電話している最中に見に行っていたとする).もちろん,Webページはnetworkを介して得るのではなく,その時点ではすでにMyLifeBitsに記録されているのである.

- 利用履歴もいろんな形で使用できる.ハイライトすべき場所の検出や,注目する必要のない部位のスキップなどの抽出に応用できる.これはmovieの再生時に,前回見ずに飛ばした部分を同じように飛ばして再生することも可能である.

- データベースを使用していることで,検索結果を柔軟かつ便利な方法で限定することもできる.例えば,単に検索を行えば,文書,写真,ビデオなどさまざまな情報が結果としてえられるものをビデオだけに限定するといったことが簡単にできる.また,属性値によってクラスタを作り,それを用いてフィルタリングすることもできる.例えば,larget-gapやk-means法
でクラスタを作り,ユーザは検索結果を狭めるために,特定のクラスタに注目して,それに含まれる検索結果を得ることもできる.時間,Webページのタイトル,e-mailのsubjectなどがそれに使えるだろう.

- 本システムではすでに二つのlink提示プログラムを実装している.1つは写真capture wizardで,写真とカレンダー内のイベントとをlinkする.もう1つはtelephone recording applicationで,caller-IDに一致した電話番号とその通話記録をlinkするものである.

- 仮想的に記録領域は無限大という時代に入りつつある,そして人が体験するありとあらゆる形の情報を記録することができるようになった.問題はそうやって蓄えられた情報をどのように有効活用できるようにするかである.MyLifeBitsではtyped linkやdatabase,視覚化,complex query そしてtime pivotが有効な情報収集に有効であることを示してきた.

- もちろん本研究には多くの課題がある.特にprivacy問題、自分と他人の人生との比較対話(?),social and user interfaceの問題が残されている.

要するに情報検索の分野とかとか、他のいろんな場面で問題になっているように「情報自体は簡単に収集できるようになり、そして蓄える事ができるようになったが、それを有効活用できるようにする方法がない。だからそのための一手段としてtyped linkというものを提案し、情報間を意味を持ったリンクでつないでいけば、その膨大な情報を有効活用できるようにする一手段となりうるだろう」というところだろうか...

このProjectのWebページは、こちら(Microsoft Research)である。

Posted by z at June 16, 2004 02:43 AM