講演資料1 - 共通語彙基盤整備事業

共通語彙を如何に活用するか
2015-2-4 45
平本 健二
経済産業省 CIO補佐官
(内閣官房 政府CIO補佐官)
0
もう既に語彙基盤の世界は実現し始めている
 検索大手サービスが提供するschema.orgのデータ構造に対応することで、
公表データを高度に活用することが可能になる。
StartTime
10:00
EndTime
21:00
渋谷の大型店では、
ビックカメラも対応
1
流通で活用するイメージ
コア語彙 業(界横断 )
製品
分類
分類-コード
名称
ID
自動認識ID
価格
説明
使用方法
製造者
製造者-ID
販売業者
販売業者-ID
入数
形態
重量
サイズ
色
原産国
原産国-コード
規制情報
ドメイン語彙 業(界固有 )
製品個品
製造日
ロット番号
消費期限
使用期限
賞味期限
シリアル番号
状態
所有者
購入価格
農作物
大分類
中項目
小分類
生産者
栽培方法
保管温度
・・・
 業界横断で情報の再利用と組み合わせが可能。
食品
05
じゃがいも
三鷹農協
箱
10kg
50×40×30
農家
送付元
送付先
じゃがいも
50箱
50×40×30
10kg
0-30度
送付元
送付先
キッチン洗剤
20箱
12kg
50×60×30
・・・
2015-1-15
A001
野菜
根菜類
じゃがいも
田中太郎
有機農法
0-30度
日用品
08
キッチン洗剤
○○化学
40本
箱
12kg
50×60×30
物流
化学企業
小売
じゃがいも
三鷹農協
田中太郎
有機農法
キッチン洗剤
2
どうやって活用するか
 様々なドキュメントが提供されているが、どう使えば良いのか。
内容
使い方
情報交換に使用すべき語彙が定
義されている。社会で共通的に
使う語彙についてグループ化さ
れている
システム等を整備する時に、使えるデー
タ項目がないか確認する。
情報連携
パッケージ
(IEP)
情報交換するための具体的な使
用方法を提供している。
基本的な項目のデータ構造を元に、自
サービスで導入するためのカスタマイズを
行う。
データ項目の追加・削除や、使用する
コードの指定なども行われる。
ツール
実際に組み込んだ事例を示す。
データ変換に活用する。
事例
実際に組み込んだ事例を示す。
導入の参考にする。
コア語彙
3
自治体・ユーザ企業での活用
4
新規に導入する場合
1.
データ洗い出し
 新システムで必要なデータ項目の洗い出しを行う
2.
データ確認とサブセット作成
 IMIのIEPがあるときには、項目の過不足を検討する。そして、IEPのうち使用する項目のサブセットを作成す
る。不足している情報項目があるときには、コア語彙を参照して追加、コア語彙にないときには独自に追加
する。IEPがないときには、コア語彙を基に、IEPを独自に作成する。
3.
データ実装方式の検討
 画面やデータベースでのデータ実装方式を検討する。郵便番号や町字コードから住所を自動入力するな
出力
システム内のデータ
どの工夫を行う。
入力
住所登録
郵便番号 100-0013
住所
住所
自動入力
千代田区霞が関
丁番地号 3 - 3 - 3
ビル名
Gビル
ビル番号 A
部屋番号 132
・・・
IMIデータ項目
登録内容
種別
事業所住所
国
日本
都道府県
東京都
市区町村
千代田区
町名
霞が関
丁目
3
番地
3
号
3
ビル名
Gビル
ビル番号
A
部屋番号
132
<Country>日本/ <Country>
1000013
10000133-3-3-A-132
霞が関3-3-3
・・・・・
名簿
100-0013 千代田
区霞が関 ・・・
入館証
渡辺 花子
東京
住所コード
郵便番号
①入力は簡易に実装
②システムにはIMI形式に分解して格納
③様々な形式で出力
5
既存の仕組みに導入する場合
1. データ対応表の作成
 自組織内で当該領域に関するデータベースを持っている時には、IMIのデータ項目に対して対応表を作成
する。
2. 情報交換用データセットに変換
 情報交換先にあわせて、構造化されたデータ項目を、1行で記載するデータ項目に変換したり、その逆に、
1行で書かれたデータ項目を分割したりする。
3. IMI形式データの受信と自組織のデータ形式への変換
 データ連係先には、IMI形式でのデータ送信を依頼する。その上で、IMI形式で受信したデータを、自組織
のデータ形式に変換する。
IMIデータ項目
登録内容
既存システム
種別
国
事業所住所
連携先システム
日本
インタフェース
都道府県
東京都
データ項目
登録内容
市区町村
千代田区
1000013
データ項目
登録内容
郵便番号
町名
霞が関
事業所
住所
千代田区霞が関
3-3-3
丁目
3
方書
Gビル A132
番地
3
100-0013
東京都千代田区霞が関
3-3-3 Gビル A132
号
3
ビル名
Gビル
ビル番号
A
部屋番号
132
・・・
住所コード
郵便番号
①既存システムのデータ
構造は変更不要
1000013
②他システムとの連携時は、IMI
の情報交換用データに変換
③受け取ったデータを自シス
テムのデータ構造に変換
6
そうは言っても、きれいに導入できない
 住所データの調整例
データ提供元システム
データ項目
登録内容
種別
1
企業名
株式会社○○
住所
千代田区霞が関
3-3-3 Gビル
A132
分離困難なものは
そのまま利用
・・・
分解
コード付与
漢数字変換
方書は未分離
実装Iデータ項目
登録内容
種別
株式会社
企業名
株式会社○○
都道府県
東京都
都道府県コード
**
市区町村
千代田区
市区町村コード
***
町名
霞が関
丁目
3
番地
3
号
3
方書
GビルA132
郵便番号
1000013
1.インタフェースで調整するが、無理なところは割り切ってあきらめる
(割り切った部分を明確にしておく)
2.できれば入力ルールにより、データ・クレンジングが簡易にできる形式にする
7
ユーザ事例:米国HHSでのNIEM導入1
 2400のシステムがある中でインタオペラビリティをとることが重要であった。
 システム間の連携はHealth Information Exchangerというアグリゲーション
サービスを入れたのがよかった。
 1つではなく、地域毎に作ってもよいし、P2Pでもよい。
 HumanServiceのドメインの構築は以下の流れで行われた。
1.
2.
目的(Value Proposition)を明確にし
プロジェクトチャーター、運用・維持計画を作成
•
3.
プロセスドキュメントは、調整計画(関係組織との)、ステークフォルダの洗い出し、交換
データの初期リストの洗い出し、有効なツールの調査、定例ミーティングの設定。
NBAC(NIEMビジネス・アーキテクチャ・コミッティ)に参加し、プロセスを定義し、他の
イニシアチブとの関係を整理
•
NBACは様々な部門が係るので月次での電話会議、週次での調整電話会議、対面会議、
集中ワークショップで調整。地方自治体なども参加
8
ユーザ事例:米国HHSでのNIEM導入2
 NIEMによる効果





きちんと意義され、フォーマット化されたフォーマットを使うことで情報共有できる
システム開発において、共通の製品や機能を使えるので、コスト削減になる
相互運用性の高いデータが国中で使われることでリスクが低減できる
正確で利用可能なデータを迅速に公開できるので公衆衛生が改善する
webを通じて正確な情報にアクセスできるのでアクセスが増加する
 ローコストである等の効果の説明は特にしていない。ITがPatient managementを大きく
変えると言う観点が重要である。
 高品質なサービスをするための新しい方法といえる。その基盤としてのNIEMがある。
9
シビックハッカーによる活用
10
アプリ開発で活用
1. やりたいことを決定
2. 関連IEPやコア語彙を抜粋
3. 利用するデータ項目を抜粋
AEDにはどんなデータが
必要なんだろう?
こんなところにIEPが
あった
IEPを活用
企画や設計のデータ検討時間を短縮
活用するデータ項目は、これとこれ。
4. 不足するデータを追加
5. 実装
コア語彙も活用
そうだ、IEPにはないけど、
この項目を追加しよう
企画の高度化に注力
6. (IEPを登録)
みんなが使えるように、
新しいIEPを登録しておこう。
11
行政情報へのIMI適用事例:AED Search
 AEDの情報は、自治体や企業から公表されていたが、記述内容がバラバラで有り、広
域アプリケーションができなかった。また、実用には情報項目が不足していた。
 IMIのデータ構造に合わせることにより、設計時間の短縮、広域でのサービス構築が
可能になった。
データ構造に基づくアプリ開発
共通語彙基盤
IODD2014
公共設備APPS
開発支援キット
(データ項目・構造)
ハッカソン、
開発者等
に提供
47都道府県の200市町村区以上のデータ
必須項目
LocationName NVARCHAR(MAX), -- 名称
Perfecture NVARCHAR(MAX),
-- 都道府県
City NVARCHAR(MAX),
-- 市区町村
AddressArea NVARCHAR(MAX),
-- 町名以降
Source NVARCHAR(MAX),
-- 情報源(URLなど)
オプション
Latitude
-- 緯度経度座標系_緯度
Longitude
-- 緯度経度座標系_経度
ScheduleDayType
-- 利用可能時間
ScheduleDayStartTime
-- 開始時間
ScheduleDayEndTime
-- 終了時間
FacilityPlace
-- 設置場所(※受付横とか)
FacilityNote
-- 補足
JSON Data - AED位置情報
のフォーマット
Id
LocationName
Perfecture
City
AddressArea
Latitude
Longitude
FacilityId
FacilityName
Facilitytdlace
ScheduleDayTytde
ScheduleDayStartTime
ScheduleDayEndTime
AccessAvailabilityOfPad
FacilityUser
DayOfInstallation
PhotoOfAedUrl
Url
FacilityOwner
FacilityOperater
ContactPoint
ContactTelephone
ContactExtension
FacilityNote
TypeOfPad
ExpiryDate
ExpiryDateOfPads
ExpiryDateOfBatteries
TypeOfDefibrillator
ModelNumber
SerialNumber
Source
DateOfUpdatingInformation
-- 場所_地名【名称】
-- 構造化住所_都道府県
-- 構造化住所_市区町村
-- 構造化住所_町名
-- 緯度経度座標系_緯度
-- 緯度経度座標系_経度
-- 公共設備_ID
-- 公共設備_名称
-- 公共設備_設置場所【設置場所】
-- 公共設備_利用可能時間【利用可能時間】
-- 開始時間
-- 終了時間
-- 公共設備_建物内外【建物内外】
-- 公共設備_利用者【利用制限】
-- 公共設備_設置日
-- 公共設備_写真URL【写真】
-- 公共設備_ホームページ【ホームページ】
-- 公共設備_設置者【設置者】
-- 公共設備_管理者
-- 公共設備_連絡先【連絡先】
-- 連絡先_電話番号
-- 連絡先_内線番号
-- 公共設備_補足【補足】
-- AED_パッド種類
-- AED_有効期限
-- AED_パッド有効期限
-- AED_バッテリ有効期限
-- AED_タイプ
-- AED_モデルナンバー
-- AED_シリアルナンバー
-- メタデータ_情報源
-- 更新日時
広域でのアプリ開発、データ
共有が効率的に可能
12
データ共通化はみんなが幸せ
 データを提供する側は、標準的なデータで公開していれば、問い合わ
せなどが減ります。
 開発する側は、横展開ができます。
 良いアプリがどんどん開発されれば、市民の活用の幅が広がります。
オープンデータにし
たけど、データ項目
について要望が
様々だな
売って、儲け
ちゃおうかな。
(*^^)v
B市
職員
C市
センスの良いアプリを作っ
ちゃったもんね♪
A市
シビックハッカー
あのソフトと連携しようと思って
いたのに、データ構造違うの
D市
隣の市はデータ項目が違うの??
13
システムベンダでの活用
14
手作りモデルからの脱却
 これまでは、独自設計をする手作りモデル(人月モデル)であった。
 選択して組み合わせることで価値を生み出す組立モデルへ変化。
 日本のシステム構築モデルの抜本的改革
 パッケージソフトウェア事業者も、データ構造の共通化により大きな影響を受ける
世界最大の組織内ネットワーク[米陸軍知識ネット(AKO)]の事例
標準記法(BPMN)
後 援 名 義 BPMN.igx
大臣官房
総務課
相談する
業務の
流れ
後援の条件が変更された時
合議を確認する
関係課室
経済産業省
別手続で実施
Yes
担当課室
相談を受ける
大臣
賞か?
後援基準
Yes
No 挨 拶
文が
必要か
事前審査をする
起案する
課室長が決裁
する
通知する
承認後の指導
及び監督をする
後援事業の準
備をする
変更等に対す
る報告を行う
最終確認を行う
No
開催期日の少
なくとも一ヶ
月前
主催者等
相談をする
申請書類を作
成する
開催概要
収支予算
団体の概要
その他資料
申請資料を修
正、追加する
事業の実施を
する
現場
終了の報告を
行う
事業報告書
収支報告者
システム
選択
他省等
業務担当者が、
標準的なデータ項目を使って、
拡張性の優れた業務プロセスを、
迅速に構築し、広く展開可能
グアムで作ったモデルが、登録し
た瞬間に全世界の業務になる
データ
項目
事前に用意した
項目リストから選択
15
具体的な開発方法例1
 政府が作った共通化対象のデータのテンプレートが用意されているので、
そのテンプレートをベースにデータ構造を作れる。
 その結果、互換性の高いシステムを迅速に作ることができる
NIEM-UML
資料:
MagicDrow CAMEO NIEM
①作りたいデータの基本形を選択
②データ構造から、使うデータを選択すると
ともに、必要に応じて追加
③データベースや交換用データモデル、関連文書を自動生成
16
具体的な開発方法例2
 ツールからNIEMのデータセットを呼び出すことで、簡単にデータ設
計ができる。
簡単にアプリ開発
可視化された開発環境
テストも実施
17
まとめ
使ってくださ
い
データ設計の時間を、
価値の創出へ
意見をくだ
さい
事例を共有
しましょう
18