Matsu Blog

マーケティング、事業開発、統計学をテーマに何かしらを書き留めていきます

Webスクレイピングと著作権の話

はじめに

今回は、WebスクレイピングによってWebサイト上のデータを収集することについて、法的に問題あるのかないのか明らかにしたいと思います。

著作権って何だっけ

著作権法第二条によると、著作物とは「思想又は感情を創作的に表現したものであつて、文芸、学術、美術又は音楽の範囲に属するもの1だそうです。

単なる文字の羅列や数値、時刻などのデータについては著作物として認められず、当該データを生み出した者の権利を保護する必要ありません。

したがって、Webスクレイピングによって著作物と認められないデータを取得することについては、著作権法上の問題はなさそうです。
では、著作物をスクレイピングした場合の合法性/違法性を考えてみます。

Webスクレイピングを分解してみる

クローリング&スクレイピングに関する行為を以下にあげてみます。

それぞれの行為について、著作権法に適合するか検討していきましょう。

  1. データの収集
  2. データの分析
  3. データの公表

平成30年改正著作権法

その前に改正著作権法から重要な条文を引用しておきます。以下、著作権法47条の5の内容です。

第四十七条の五 電子計算機を用いた情報処理により新たな知見又は情報を創出することによつて著作物の利用の促進に資する次の各号に掲げる行為を行う者(当該行為の一部を行う者を含み、当該行為を政令で定める基準に従つて行う者に限る。)は、公衆への提供又は提示(送信可能化を含む。以下この条において同じ。)が行われた著作物(以下この条及び次条第二項第二号において「公衆提供提示著作物」という。)(公表された著作物又は送信可能化された著作物に限る。)について、当該各号に掲げる行為の目的上必要と認められる限度において、当該行為に付随して、いずれの方法によるかを問わず、利用(当該公衆提供提示著作物のうちその利用に供される部分の占める割合、その利用に供される部分の量、その利用に供される際の表示の精度その他の要素に照らし軽微なものに限る。以下この条において「軽微利用」という。)を行うことができる。ただし、当該公衆提供提示著作物に係る公衆への提供又は提示が著作権を侵害するものであること(国外で行われた公衆への提供又は提示にあつては、国内で行われたとしたならば著作権の侵害となるべきものであること)を知りながら当該軽微利用を行う場合その他当該公衆提供提示著作物の種類及び用途並びに当該軽微利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 電子計算機を用いて、検索により求める情報(以下この号において「検索情報」という。)が記録された著作物の題号又は著作者名、送信可能化された検索情報に係る送信元識別符号(自動公衆送信の送信元を識別するための文字、番号、記号その他の符号をいう。)その他の検索情報の特定又は所在に関する情報を検索し、及びその結果を提供すること。
二 電子計算機による情報解析を行い、及びその結果を提供すること。
三 前二号に掲げるもののほか、電子計算機による情報処理により、新たな知見又は情報を創出し、及びその結果を提供する行為であつて、国民生活の利便性の向上に寄与するものとして政令で定めるもの
e-Gov法令検索

長いのでカッコ部分を省略してみます。

第四十七条の五 電子計算機を用いた情報処理により新たな知見又は情報を創出することによつて著作物の利用の促進に資する次の各号に掲げる行為を行う者は、公衆への提供又は提示が行われた著作物について、当該各号に掲げる行為の目的上必要と認められる限度において、当該行為に付随して、いずれの方法によるかを問わず、利用を行うことができる。ただし、当該公衆提供提示著作物に係る公衆への提供又は提示が著作権を侵害するものであることを知りながら当該軽微利用を行う場合その他当該公衆提供提示著作物の種類及び用途並びに当該軽微利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない
一 電子計算機を用いて、検索により求める情報が記録された著作物の題号又は著作者名、送信可能化された検索情報に係る送信元識別符号その他の検索情報の特定又は所在に関する情報を検索し、及びその結果を提供すること
二 電子計算機による情報解析を行い、及びその結果を提供すること
三 前二号に掲げるもののほか、電子計算機による情報処理により、新たな知見又は情報を創出し、及びその結果を提供する行為であつて、国民生活の利便性の向上に寄与するものとして政令で定めるもの

データの収集

Webスクレイピングは「公衆への提供又は提示が行われた著作物」を収集することであると解釈できそうです。

上記条文の趣旨に鑑みると、各号に掲げる行為を行う者について前述の著作物の利用が認められると解することができるため、当該行為の実現を目的としたデータ収集については同法に合致しそうです。

したがって、「情報解析を行い、及びその結果を提供すること」を目的としてWebスクレイピングする場合は法的に問題ないですね。

データの分析

データの分析はそのまま「情報解析」と解釈できそうです。

したがって、統計分析などに使用するのはまったく問題ないようです
(予測モデルの構築と予測って「情報解析」に入るんだろうか・・・ここまでは調べられず)

データの公開

四十七条の五 二号には「情報解析を行い、及びその結果を提供すること」とあります。

したがって、分析結果を提供すること(例えば、重回帰を回して偏回帰係数やP値を公表すること)は二号記載の通り、問題ありません

一方で、情報解析に用いた著作物をそのまま公表するような行為は、「目的上必要と認められる限度」でもなく、「軽微利用」ということもできないため、同条では認められないと解することができそうです。

最後に

かんたんにまとめただけなので間違いあるかもしれません。お詳しい方いろいろ教えてください。