2005年 11月 08日
グーグルニュースの登場 |
▼グーグルニュースの登場
EPIC2014が究極の報道の姿だと仮定して、われわれは今のどこに位置するのだろうか。EPIC2104の方向に向けた現状をみてみよう。
まずグーグルだが、日本でも2004年9月1日にグーグルニュースを立ち上げている。グーグルニュースは、同社の検索技術を利用して報道機関のニュースサイトから見出しと本文の一部などを集めてきて構築するニュースサイトで、見た目はまるでヤフーニュースのようになっている。
技術的には「クローラー」と呼ばれるソフトがインターネット上の日本語ニュースを掲載する約600のサイトを自動巡回し、ほぼリアルタイムで記事の見出しや本文の一部を収集してくる。巡回するサイトのリストには、日本の大手新聞社、通信社を始め、地方紙、専門紙、スポーツ紙、海外の邦字紙などのサイトが含まれるという。どのサイトを選ぶかは、グーグルのスタッフが判断する。
クローラーが集めてきた見出しや本文などの情報は、「クラスター技術」と呼ばれる技術で内容を自動識別し、同じニュースを取り上げている記事は1つのクラスターと呼ばれるグループにまとめられる。通信社の記事は複数の新聞社のサイトに掲載されることがあるが、そうした重複する記事は自動的に省略される仕組みにもなっている。
クラスターごとにまとめられた記事は、100項目以上の基準に基づいてニュースとしての価値判断が自動的に下される。例えば、短時間に1つのクラスターの記事数が急速に増加するということは、数多くの報道機関が1つのテーマで記事を次々と発信しているということ。すなわち重要ニュースということになる。このほか、日ごろからリンクされることの多い報道機関はそれだけ信頼されている証拠という考え方を基に、その報道機関の記事の価値を高く評価する。こうした基準を基にニュースの重要性を自動的に判断し、トップニュースとしてページの上の方に掲載する仕組みだ。
つまりグーグルニュースのページは機械がすべて自動的に生成する。ニュースの価値判断の基準の設定をしたあとは、人間が関与することは一切ない。
以前に、社のある同僚と報道機関の未来について議論したことがある。彼は「記事の価値判断こそが報道機関の役割であり、そこに報道機関の存在価値がある。その部分では機械による自動化は絶対に無理だ」と主張した。グーグルニュースは彼が無理だと主張する機械による自動化を実現したのだ。
ただグーグルニュースの価値判断のメカニズムにも弱点はある。1社によるスクープ報道の場合、それがどれほど重要なニュースであっても、このメカニズムでは、重要ニュースとして取り扱われない。同じテーマの記事が多くの報道機関から次々と出てこないからだ。。
機械によるニュースの価値判断の仕組みでもっとも単純なものは、アクセスランキングだろう。重要な記事のほうにより多くのユーザーからのアクセスが集中する、という仮定に基づいた価値判断の仕組みだ。ライブドアの堀江貴文社長は、ニュースの価値判断はアクセスランキングで十分、と発言して、多くの反発を招いた。アクセスランキングだと、ショッキングなニュース、スキャンダラスなニュースばかりが上位にランキングされ、伝えるべき重要なニュースが伝わらなくなる、という反発だった。
グーグルニュースは、アクセスランキングに比べれば洗練された価値判断の仕組みである。それでも特ダネはトップニュースとして扱われないという弱点がある。今後ニュースの価値判断の仕組みはより洗練されたものになるのか、ならないのか、というと、より洗練されたものになる可能性のほうが大きいようにとわたしには思える。楽観的過ぎるだろうか。
著者注:間違いの指摘やご意見をいただければ幸いです。参考「本を書きます」
このworkは、クリエイティブ・コモンズ・ライセンスの下でライセンスされています。
EPIC2014が究極の報道の姿だと仮定して、われわれは今のどこに位置するのだろうか。EPIC2104の方向に向けた現状をみてみよう。
まずグーグルだが、日本でも2004年9月1日にグーグルニュースを立ち上げている。グーグルニュースは、同社の検索技術を利用して報道機関のニュースサイトから見出しと本文の一部などを集めてきて構築するニュースサイトで、見た目はまるでヤフーニュースのようになっている。
技術的には「クローラー」と呼ばれるソフトがインターネット上の日本語ニュースを掲載する約600のサイトを自動巡回し、ほぼリアルタイムで記事の見出しや本文の一部を収集してくる。巡回するサイトのリストには、日本の大手新聞社、通信社を始め、地方紙、専門紙、スポーツ紙、海外の邦字紙などのサイトが含まれるという。どのサイトを選ぶかは、グーグルのスタッフが判断する。
クローラーが集めてきた見出しや本文などの情報は、「クラスター技術」と呼ばれる技術で内容を自動識別し、同じニュースを取り上げている記事は1つのクラスターと呼ばれるグループにまとめられる。通信社の記事は複数の新聞社のサイトに掲載されることがあるが、そうした重複する記事は自動的に省略される仕組みにもなっている。
クラスターごとにまとめられた記事は、100項目以上の基準に基づいてニュースとしての価値判断が自動的に下される。例えば、短時間に1つのクラスターの記事数が急速に増加するということは、数多くの報道機関が1つのテーマで記事を次々と発信しているということ。すなわち重要ニュースということになる。このほか、日ごろからリンクされることの多い報道機関はそれだけ信頼されている証拠という考え方を基に、その報道機関の記事の価値を高く評価する。こうした基準を基にニュースの重要性を自動的に判断し、トップニュースとしてページの上の方に掲載する仕組みだ。
つまりグーグルニュースのページは機械がすべて自動的に生成する。ニュースの価値判断の基準の設定をしたあとは、人間が関与することは一切ない。
以前に、社のある同僚と報道機関の未来について議論したことがある。彼は「記事の価値判断こそが報道機関の役割であり、そこに報道機関の存在価値がある。その部分では機械による自動化は絶対に無理だ」と主張した。グーグルニュースは彼が無理だと主張する機械による自動化を実現したのだ。
ただグーグルニュースの価値判断のメカニズムにも弱点はある。1社によるスクープ報道の場合、それがどれほど重要なニュースであっても、このメカニズムでは、重要ニュースとして取り扱われない。同じテーマの記事が多くの報道機関から次々と出てこないからだ。。
機械によるニュースの価値判断の仕組みでもっとも単純なものは、アクセスランキングだろう。重要な記事のほうにより多くのユーザーからのアクセスが集中する、という仮定に基づいた価値判断の仕組みだ。ライブドアの堀江貴文社長は、ニュースの価値判断はアクセスランキングで十分、と発言して、多くの反発を招いた。アクセスランキングだと、ショッキングなニュース、スキャンダラスなニュースばかりが上位にランキングされ、伝えるべき重要なニュースが伝わらなくなる、という反発だった。
グーグルニュースは、アクセスランキングに比べれば洗練された価値判断の仕組みである。それでも特ダネはトップニュースとして扱われないという弱点がある。今後ニュースの価値判断の仕組みはより洗練されたものになるのか、ならないのか、というと、より洗練されたものになる可能性のほうが大きいようにとわたしには思える。楽観的過ぎるだろうか。
著者注:間違いの指摘やご意見をいただければ幸いです。参考「本を書きます」
このworkは、クリエイティブ・コモンズ・ライセンスの下でライセンスされています。
by tsuruaki_yukawa
| 2005-11-08 18:38
| 本の原稿