2010年12月10日金曜日

次期e-Radがどうあるべきかを妄想してみる。 第二回。API公開のすすめ。

e-Radについて妄想してみる第二回。第一回はこちら

今回も扱うネタはデータ連携なのだが、もう少し具体的に考えてみる。
まず、前回の内容を簡単に振り返ってみる。議論の発端となった「予算監視・効率化チーム」中間報告に次期システムの目的として掲げられていたのは以下の2点。

・研究者の業績や略歴を審査に活用
・他のデータベースと連携して相互に利用できる仕組みを作る

これらの目的を果たすためにどうあるべきかを考えて、どのデータをどのシステムで持つべきかを以下のようにまとめた。

① 所属情報(所属機関、役職、氏名、ふりがななど)
  → e-Rad
② 業績情報(論文、著書、知的財産権、講演など)
  → ReaD, Research map → e-Rad
③ 経歴情報(過去の所属機関、役職など)
  → ReaD, Research map → e-Rad
④ その他情報(研究キーワード、コミュニティ、住所、HPなど)
  → ReaD, Research map

つまり、e-Radが現在の所属情報だけでなく、業績情報、経歴情報なども持つような形となっている。これは、どの情報が競争的資金の審査にとって必要か(必要でないか)という観点から切り分けを行っている。不可欠な情報は申請・審査用のシステムで保有し、それ以外の部分はそれ以外のシステムが保有する。上記の①から③までは前者に該当し、④のみが後者に該当する。


さて、ここからが今日の妄想。

・データ参照をしないのはなぜか
 わたしの案の場合、業績情報、経歴情報といった、これまでReaDなどが持っていた情報をe-Radが持つことになる。参照するのではなくてe-Rad自体で管理するように提案するのは、わざわざシステム上のウイークボイントを増やす必要はないと考えるためである。申請や審査に不可欠な情報を他システムから参照するということは、安定稼働のためのハードルを上げることでしかない。その情報が不可欠なのであればあるほど、別のシステムとの参照するようなことは止めるべきである。

 「参照をしない」ということは、「連携をしない」ということとイコールではない。申請と審査に必要な情報はe-Radで管理した上でAPIの公開という形で他システムと連携することがもっとも望ましいとわたしは考える。このAPIの公開の一環として、ReaDやResearch mapなどといった国のシステムとの連携も行われるべきである。

・APIの公開
 「APIの公開」というアイディアは今年6月の熟議カケアイ「我が国の研究費を使いにくくしている問題点は何か?」の議論の中でも指摘されている。以下、takechan2000さんの発言を引用。

研究費申請報告を楽にするという目的にはまったく異論はないのですが、その手段としてここに挙げられたようなDBを統合すればいいという結論は短絡的だと思いました。
研究業績は研究者みなさんいろいろなシステム、サービスを使っていると思います。たとえば手元ではEndNoteやRefWorksを使っている人も多いでしょう。公開側も大学の業績DBであったり、個人のWebページでいろいろ工夫している人も思います。このような多様な環境下ということを考慮せずに、このサービスを使いえばよいあるいは使いなさいというのは結局は研究者に新しい雑務を生じさせるだけだと思います。
最初の目的に関してシステムがどうあるべきはもっと視野を広げてきちんと調査して提案していくべきだと思いました。私からみると、当初の目的はユーザ認証の連携とデータAPIの公開で、かなりのレベルまで解決できるのではないかと思います。

我が国の研究費を使いにくくしている問題点は何か?|熟議カケアイ - 文科省 政策創造エンジン

 APIとは、ざっくり言えば「あるシステムが別のシステムのデータを利用するための約束事」のこと。Twitterを例とすると、Twitterを公式サイトでのみ利用している人は少数派ではないだろうか。公式以外にもさまざまなサイト、アプリが存在しており、人それぞれに自分の気に入ったものを用いてTwitterを楽しむことができる。用いるサイト・アプリは異なっていても、そこに問題は生じない。たとえば公式以外のサイトから書き込みを行ったとしても、その内容は公式サイトに即座に反映され、また別のアプリから見たとしても同じようにその情報を見ることができる。こういったことが可能になっているのは、TwitetrがAPI、つまりTwitter上のデータを利用するための約束事を公開し、その約束に基づいてそれぞれのサイト・アプリが作られているためである。

 メリットとして挙げられるのは以下のようなもの。「WEB制作者」は「APIを利用してサービスを作る人」を指し、「API提供会社」とは「APIを提供する人」、つまりここでは「文科省」ということになる。(太字化は引用者)

WEB制作者にとっては、
他社の膨大なデータベースや機能を、無料で利用できるため、Webサイトの開発コストを大幅に削減でき、かつ効率的に制作することができるというメリットがあります。
このため、個人や小資本の会社でも、人気のWEBサイトを低コストで効率的に作れる可能性もあります。
最近では、APIを使ったWEB制作や、複数のAPIを組み合わせた「マッシュアップ」、APIを使って無料のWEBサービスの収益化を図る「マネタイズ」などが、トピックになっています。

API提供会社にとっては、
自社のみでは考え付かないようなWEBサービスや、自社のみでは実現できないようなWEBサービスを、外部の誰かが作ってくれるため、API利用サイトから自社サイトへユーザーが流入が期待できるようです。
また、自社のデータベースや機能を、間接的にせよ、自社サイトを利用してくれるユーザーが増え、それがデファクトスタンダードに繋がるかもしれないので、結果として、データを集積するスピードが速まり、競争優位に立つことを期待できるようです。

APIとは? | プログラミング実習室

 わたしは次期e-RadがAPIの公開を行うことを提案する。このAPIの公開は上記の説明からも分かるとおり、システムの利便性の向上、保有する研究者情報の活用などに革命的な効果を及ぼす可能性と考えるためである(なお、国の機関によるAPIの公開の例はすでにあって、J-GLOBALが行っている → WebAPI提供について J-GLOBAL)。API公開により、誰でも簡単にe-Rad上で管理する情報を元にしたサービスを作ることができるようになる。Twitterの例で言えば、公式が提供するサービスよりも使いやすいものが生まれているし、単に閲覧・投稿を行うものだけでなくて、たくさんの人が「お気に入り(favorite)」登録を行ったつぶやきを見ることのできる「ふぁぼったー」、つぶやきをテーマごとに整理して、まとめて見ることができる「togetter」など、Twitter内での情報を利用しつつもまったく独自のサービスも生まれている。

その他のサービスはこちらを参照のこと。→ 「Twitter関連Webサービス - TwitterまとめWiki

 同じように、APIの公開を行うことからシステム上でのデータを活用して、役人の発想では考えつかなかったような便利なサービスが提供されるようになる可能性がある。さまざまなサービスが生まれるということはユーザであるところの研究者や大学事務職員などの関係者にとってはシステムの利便性向上につながるだろうし、直接利用はしない一般国民にとっても国費で助成された研究費に基づく研究に関する情報にアクセスする機会が増えることにつながる。これは成果の社会還元、産学連携の振興にも大いに役立つことになるだろう。

 言うまでもないが、公開の対象となるのは公開して良い情報に限られる。何を公開し、何を公開しないという議論は十分に行う必要があろう。とはいえ、公的研究費の採択課題情報やその分野、金額、その実績報告、成果といったものは基本的に公開を義務付けても良いのではないか。
 提供する情報によって提供できるサービスは異なってくるが、このようなサービスがあると面白いのではないかという妄想をいくつか。不謹慎と言われそうなものもあるが、とりあえず。

・事業の公募が開始されたらメールが飛んでくるサービス
・あらかじめ設定しておいたキーワード(人名、分野、専門用語など)を含む業績情報が登録されたらメールが飛んでくるサービス
・被アクセスの多い研究者や業績のランキング
・研究者ごとの研究費獲得額ランキング
・助成金の総額とそれに基づいて投稿された雑誌のインパクトファクターの合計数によって、助成事業の「生産性」を測ることのできるサービス


・大学独自のシステムと連携すべきか
 最後に、takechan2000さんの指摘されている「大学の業績DB」について触れておく。近年、一部の大学では大学内の研究者の分野や業績情報を検索できるシステムを公開している。おそらく共同研究や産学連携に役立てるためなのだろう。いわばReaDの大学限定版とも言うべきものだが、大学内部のシステムであるだけに大学内での強制力は本家よりも強い。結果、こちらの情報の方が充実していて、大学関係者にとってはReaDよりもこちらのシステムとの連携(片方に入力すればもう片方にも反映されるように)してほしいという要望もあるようである。
 しかし、わたしはその必要はないと考える。これは共同研究などを求める方が必要とするのは大学単位の検索システムなのか、全国の研究機関を対象としたものなのかを考えれば明白であろう。大学をわざわざ限定した上で研究相手を探すわけではなく、あくまで探すとすれば研究分野や業績によるはずである。日本全体で使い勝手の良いシステムがひとつできることが利用者にとって最善であるとすれば、それを実現させるためにリソースを集中させるべきであろう。現在の大学単位でのシステムはその意味を失っていくことになるだろうし、それが本来あるべき姿であるかと思う。

 そもそも連携しようにも、日本全国でさまざまな業者によって作られたであろう大学の業績管理システムそれぞれのデータ形式がすべて同じであるわけはなく、それゆえに何の改修もなしに次期e-Radとデータ連携が行えるわけではない。この状態を解決しようとすれば、それぞれのシステムでひとつの形式に対応できるようにするための大規模な改修が必要となる。しかし、先述のとおり、その意味を失うことになるであろうシステムにそれほどの投資を行う価値はないと思われる。

 とはいえ、大学独自システムに登録した情報をすべてイチから入力しろと言うわけではない。既存システムにすでに登録されている情報はCSVファイルなどで取り出し、次期e-Radの業績情報取り込み形式に加工した上で取り込みを行えば良い。このやり方であればシステムの改修は発生しない。CSVファイル内の列を入れ替える程度なのだから、普通の事務職員でも十分作業可能であるはずである。

 大学独自の業績ページは不要ではないかと書いたが、やはり大学独自で検索ページを持ちたい、大学独自の機能、データ項目を追加したいというニーズがまったくないわけではないだろう。これについては、公開APIを利用して自身の大学の情報のみを検索できるようにすれば簡単に実装可能である。当然既存システムからの改修費用は生じるが、開発費、維持費はイチから作るよりも大幅に抑えられるだろう。


 今回の妄想はこの程度で。次は保有する情報の活用について、もう少し掘り下げたい。

0 件のコメント:

コメントを投稿