コンテキスト解析

特集
ユビキタスプラットフォーム
コンテキスト解析
松本 真介 西崎 渉太 橋本 洋一
概要
自宅で据置きのPCを利用する時代から、スマートフォンなどのモバイル端末でいつでもどこでもサービスを
利用できる時代となり、ユーザの状況に配慮した情報サービスの提供が求められている。コンテキスト解析技術
とは、このようなサービスの実現のためにユーザのセンサデータから、
そのユーザが置かれている状況やユーザ
の個人特性などの背景といったコンテキストを計算機が把握する技術である。
本稿では、ユビキタスプラットフォーム向けに開発したコンテキスト解析機能について紹介する。
1. はじめに
これまでの情報サービスの利用者は、デスクの上に置かれた
2. ユビキタスプラットフォームの
コンテキスト解析機能
PCを利用するユーザであった。このため計算機が行う利用者
我々が車載ナビ向けに研究を行っていたGPSデータによる
のコンテキストの解析は、アクセスログを中心としたものが大
人のコンテキストの解析技術で培ったノウハウをもとに、以下の
半であり、その内容も“どのページから来たのか”や“どういう
2機能を実装した。
タイミング で何回ページを開いたか”といったものが主 流で
(1)訪問地推定
あった。
緯度経度の羅列である GPS データから、人の移動の区切
しかし、ユビキタス社会が実現しつつある現在の情報サービ
りとなる時間と位置を見つけることにより、その人が訪れた
ス提供者は、以下の理由により、実生活のコンテキストを把握
場所を推定する。
する技術を模索している。
●
(2)個人特性解析
スマートフォンや車載ナビの発展により、実生活におけるあ
訪問地推定で生成されたデータをもとに、人ごとの時間
らゆる場所・あらゆるタイミングに情報サービスを提供す
的、地理的な特性を解析する。
ることが可能になり、ユーザのコンテキストに配慮した情
以降の章でこれらの機能について詳述する。
報サービスの提供が求められるようになった
●
スマートフォンの普及による、GPSや加速度センサなどの
2.1 訪問地推定
各種センサの価格低下・高度化により、ユーザの地理的な
本章ではGPSで取得した位置情報から訪問地の推定に至る
位置や行動を推測するための情報を容易に収集できるよ
までの手法について述べる。本稿での訪問地とは、施設内の部
うになった
屋の移動や着席などのミクロな移動における停止地点ではな
ユビキタスプラットフォームはユビキタス社会に向けた共通
く、自宅から最寄り駅、最寄り駅から勤務先などの地図で表さ
基盤であるため、これらの要望にこたえるべくコンテキスト解
れるようなマクロな移動における滞在地点を指す。
析機能を実装した。これにより、より多くの情報サービス提供者
に参画してもらうことを目指す。
2.1.1 推定手法
次章以降、ユビキタスプラットフォームに実装したコンテキスト
GPSを利用して取得した位置情報は、観測地点が屋内や地下
解析機能について紹介する。
であったり、周りに高層ビルが立ち並んでいたり、天候であった
16
2015
第15号
特集
ノイズ除去前の位置情報
ノイズ除去後の位置情報
図1 位置情報のノイズ除去比較
りと様々な要因によって精度が著しく低下する場合がある。多く
けた位置情報と欠損した位置情報が含まれた場合では位置情
の場合、精度が低下した位置情報(以下、ノイズと言う)は実際の
報の密度が異なるため、訪問地推定精度が低下する。
位置とかい離しており、以降の解析処理にも悪影響を及ぼす。
この問題を解決するため、過去に正常に取得できた位置情報
この問題を解決するため、訪問地推定の前処理として、推定
を用いて欠損した部分の位置情報を補完する手法を考案した。
に利用する位置情報群からノイズの除去を考案した。図1は、弊
その上で、各位置情報の時間と距離から近傍の位置情報を利用
社東京本社滞在中に発生したノイズを今回考案した方法により
して補正を実施している。図2は、ノイズ除去後の位置情報群に
除去した結果である。処理前の生の観測データでは実際には滞
対し、欠損した位置情報を補完・補正した結果である。処理前の
在していない位置も含まれている(図1左の丸)が、処理を行っ
生の観測データでは実際には滞在していたが観測されていな
た後は除外されていることが確認できる(図1右の丸)。
い箇所が散見されるが、処理を行った後は欠損した位置が補完
また取得した位置情報は必ずしも一定間隔ではなく、スマー
され滑らかな移動が再現されている。位置情報の密度を一定に
トフォンの電波状況(地下鉄利用時等)やバッテリ切れ等によって
保つことにより、欠損した状態と比較すると地図上に表示され
位置情報が取得できずに欠損することがある。正常に取得し続
た位置情報も滑らかに見ることが可能である。
ノイズ除去後の位置情報
補完・補正後の位置情報
図2 ノイズ除去後位置情報から補完・補正
17
補完・補正後の位置情報
訪問地推定結果
図3 訪問地推定結果
次に、前述した補正まで実施した位置情報は単純な時系列の
2.2 個人特性解析
情報であるため、特定の地点での滞留時間や移動距離を利用し
一口にコンテキストと言っても、その状況を表すパラメー
て訪問地が推定される。図3は、補完・補正後の位置情報から
タは様々であり、各パラメータが取りうる値も多様である。
訪問地を推定した結果である。弊社東京本社での勤務と最寄り
しかし、情報をレコメンドするシステムにおいては、システ
駅での待ち状態の2地点が訪問地として推定された。
ムによって取得でき、かつ推薦情報の選択やランキングに
影響を及ぼしそうなコンテキストのみに注目するというの
2.1.2 移動履歴データ、現在状況の推定
が現実的な対応であろう。
訪問地を推定することで、移動履歴データの作成や現
例えば、スマートフォンに何らかの情報をプッシュするサー
在状況の推定も可能である。
ビスを考えた場合、情報を配信するタイミングを推し量るこ
移動履歴データとは訪問地間の移動した位置情報のま
とで、利用者が感じる煩わしさを軽減することが期待できる
とまりである。現在状況の推定とは、訪問地に滞留中であ
(図4)
。例えば、勤務先に向かう途中では娯楽に関する情報
るか移動中であるかを推定した結果である。
を避け、ニュースや交通情報を配信する。あるいは、金曜日
の帰宅途上であればレジャーに関する情報を配信するという
2.1.3 利用例
ことが考えられる。この場合は“勤務先へ移動中か”
、
“帰宅
本章で紹介した訪問地推定機能により、緯度経度の羅
途上か”といった状況が解析すべきコンテキストである
(表1)
。
列であるGPSデータを以下のような抽象度の高いデータ
に変換することが可能となる。
●
移動ごとに区切った移動履歴データ
●
その人が現在移動中か訪問地に滞在中かも判断するこ
休日、自宅周辺で
買い物
勤務先へ移動中
その状況に
応じた
コンテンツの
配信
とが可能となる。
これらのデータは、それのみでは利用用途は限定的で
あるが、2.2章に記載する個人特性解 析のような上位の
データ解 析を行うためには前処理として必須のものであ
り、位置情報を利用したサービス提供のためのデータ解
析全般で利用できると考えられる。
18
帰宅のため移動中
勤務中
図4 情報配信サービスにおけるコンテキストの例
2015
第15号
する時間帯、帰宅する時間帯など(これらをカレンダーと
コンテキスト
配信コンテンツの例
称している)を推定する機能である。プライバシーへの配
自宅周辺エリアに滞在
自宅周辺のイベント、お買い得情報
慮から一定期間の移動履歴から導かれる統計的な値とし
勤務先へ移動中
ニュース、交通情報
勤務中
緊急速報(それ以外は配信しない)
帰宅中
娯楽、レジャー情報
てこれらを表現している。
自宅周辺エリアを出発し、勤務先エリアに向かう移動履
歴だけを選択すると、曜日ごとの出勤確率を計算するこ
上記のようなサービスの実現を想定して、コンテキストを推
とができる。これに基づき、その個人にとっての平日・休
定するために必要な基礎的な情報をここでは個人特性と称して
日をデータから推定することができる。土日に出勤し、そ
いる。個人特性を明らかにする上では、プライバシーの侵害に当
れ以外の曜日に休みを取る人であっても、全く同じ仕組み
たらないよう配慮が必要になるが、ビジネスとプライバシーを
で平日・休日の推定が可能になる。
踏まえて効率性と秘匿性の間の解を見つける、というのが現実
同様に、出社時に自宅周辺エリアを出発する時刻に注目
的なアプローチであると考える。
して、確率分布を得ることができる。これを用いれば、あ
そこで、本章で紹介する個人特性解析機能では自宅や勤務先
る時刻に自宅周辺エリアを出発したときに、それが勤務先
の位置をピンポイントで特定することを避けて地域メッシュの
に向かう確率がどの程度かを見積もることが可能になる。
集合として表現しており、それぞれを自宅周辺エリア・勤務先周
帰宅における移動についても、同じ考えで推定することが
辺エリアと称している。また、通勤や帰宅のための移動を推定す
できる。図5は、月曜から金曜を平日とし、朝7時ころに
るための基礎情報として、時間帯ごとに移動履歴を統計的に捉
出社し、夜18時から21時に帰宅するという特性をもつ個
えた確率分布として表現する方法を採用した。
人の実際のデータによる確率分布である。
このように個人の行動を特徴付ける情報を、広がりのあるエ
リア、広がりのある時間帯として捉えることにより、個人が特定
曜日別出社確率
されないような形で個人特性の表現を実現している。以下、そ
れらの実現方法について説明する。
1.0
0.8
0.6
(1)個人ごとの生活圏推定
訪問地推定の結果得られる移動履歴データを用いて、
個人ごとの生活圏を推定する機能である。ここでは、自宅
0.4
0.2
0.0
月曜 火曜 水曜 木曜 金曜 土曜 日曜
周辺エリアと勤務先周辺エリアを生活圏として称している。
まず、特定の個人の移動履歴から、地域メッシュの特
出勤時の出発時刻確率分布
徴量を計算する。特徴量とは、例えば個人の移動履歴か
らわかる出発地点・到着地点の出現頻度や、滞在時間の
0.4
0.2
0.0
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
分布のような値である。そうした複数の特徴量に基づい
0.6
0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
て、地域メッシュの集合が自宅周辺に該当するのか、勤務
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30
先周辺に該当するのかを推定する。
例えば、訪問頻 度が 非常に高いエリアがあった場合、
帰宅時の出発時刻確率分布
それが自宅を含むエリアである可能性が高い。さらに自
宅周辺エリアに次いで高頻度で訪れるエリアがあれば、そ
れが勤務先周辺エリアの候補として考えることができる。
0.10
0.00
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
□
0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
時
00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30 00 30
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
分
(2)個人ごとのカレンダー推定
0.20
移動履歴データと自宅・勤務先周辺エリアの推定結果
を結びつけることにより、その個人が出勤する曜日、出社
図5 個人ごとのカレンダー
19
特集
表1 コンテキストと配信コンテンツの例
3. おわりに
本稿ではユビキタスプラットフォームに実装したコンテキスト
解析機能について紹介した。今後、ユーザから得られるセンサ
情報は増加し続けると予想され、またこれらを利用したよりよ
いサービスの提供が求められると予想されるため、コンテキス
ト解析機能の必要性も増すと考えられる。
今回ユビキタスプラットフォームに実装した機能は、訪問地や
エリア・カレンダーなど限定的なコンテキストが対象であるが、
把握したい状況はサービスによって様々であるため、解析でき
るコンテキストの種類の拡充が望まれる。
今後は応用範囲の広い基礎的な状況解析機能の拡充を進め
ていく予定である。
20
2015
第15号
[1] Jannach D., Zanker M., Felfernig A., Friedrich G.( 著 ); 田中
克己、
角谷 和俊
(訳)
:情報推薦システム入門 - 理論と実践 -,p.306,
共立出版 ,(2012)
[2] 曽根原登、宍戸常寿(著); 安岡寛道(編)
:ビッグデータ時代の
ライフログ―ICT 社会の“人の記憶”,p.9, 東洋経済新報社 ,
(2012)
松本 真介
MATSUMOTO Shinsuke
●
●
先端技術研究所 事業開発部
ユビキタスプラットフォームの開発に従事
西崎 渉太
NISHIZAKI Shota
先端技術研究所 事業開発部
ユビキタスプラットフォームの開発に従事
● EXAGE の開発に従事
●
●
橋本 洋一
HASHIMOTO Youichi
先端技術研究所 研究開発部
ユビキタスプラットフォームにおける分析機能の開発に従事
● ビッグデータ分析の研究開発に従事
●
●
21
特集
参考文献