もともと「ネットに載らない記事は最初から存在しなかったにも等しい」ってのは特にサブカルチャー方面で顕著だったなー。ネットのほうが概覧するには効率が悪いのは事実ね。
歴史的事件の当時の反響をチェックするのが、革命的に楽になりましたなあ。大学の蔵書も、というよりも、そっちの書籍のOCRの成果のスピンオフって話でしたな。
新聞記事ではなくて新聞紙面のデータベース化なのかしらん。特に過去の物では紙面構成そのものが資料的価値があるわけですが。
新聞記者は専門化ではないので、どうしても要約時に重要な部分が抜け落ちたり勘違いしたりしやすいんですよね(まあ一般人よりはマシだけど)。なのでソースになる発表が読めるようにな