AIと著作権

Sun, Apr 28, 2024
GenAI copyright


先日文化庁が公開したAIと著作権についての見解を読んでみた。

ちなみにアイキャッチはMicrosoft DesignerのImage Creatorで生成したやつ。

AIと著作権

2024/03/15に文化庁からAI と著作権に関する考え方についてという文書が公開された。 著作権についての解説、AIと著作権の関係、AIに関する著作権上の懸念とそれに対する見解がまとめられていて、面白かったので読んでみた。

面白いとは言っても、最初のほうは法律的な文法で読みづらいし、文字しかないので飽きてくるのをがまんして読んだんだけど、後でほぼ同様の内容が図入りでまとめられたスライドをみつけた。 こっちみればよかったかも。

以下に理解したことを書く。

著作権

  • 著作物とは、アイデア(思想、感情、作風)を創作的に表現したもの。アイデア自体は著作物ではない。
    • e.g. コードは著作物だけどアルゴリズムは著作物ではない。
  • 著作者は、著作物の特定の利用行為(e.g. 複製、譲渡、公衆配信)の独占的権利(i.e. 著作権)を持つ。
    • 複製は、完全なるコピーだけでなく、類似性と依拠性があるものを作成する行為も該当する。
      • 類似性: 著作物の創作的な表現部分と似てること
      • 依拠性: 既存の著作物に接して、それをもとに別の著作物を作ったこと
  • 著作権の侵害とは、非著作者が著作権者の許諾無しに著作権の必要な利用行為をすること。
    • 侵害すると、著作者から差止や損害賠償の請求をされ得る。
    • ただし、侵害に当たる行為が、以下などのいずれかに該当する場合は不問になる。
      • 著作物に表現されたアイデアの享受(i.e. 著作物から知的・精神的欲求を満たすこと)をしたりさせたりすることが目的でない場合。
      • 情報処理及びその結果の提供に付随する軽微利用の場合。
  • 日本の著作権法が適用されるのは以下のいずれかの場合。
    • 著作権侵害による被害が日本国内の場合。
    • 著作権侵害に当たる行為が日本国内で行使された場合。
      • e.g. 侵害したクローラや生成AIが日本のサーバで稼働している。
      • e.g. 侵害した生成AIサービスが日本国内向けに提供されている。

データ収集と著作権

  • クローラなどで著作物のデータを収集すると、複製行為になる。
    • けどAI学習につかうだけなら、軽微利用なので基本的にセーフ。
    • 汎用LLMを作る目的なら、アイデアの享受が目的じゃないからセーフ。
      • ただし、意図的に特定の著作物を過学習させたり、Low-Rank Adaptationして、その著作物との類似性が高いものを生成させるようにすると享受認定されてNGになりうる。
  • RAGのベクトルデータベース作成のためのデータ収集は、生成AIによる出力に収集した著作物(の一部)を含める目的があるとNG。
    • ただし含める割合が軽微ならセーフ。
    • クローラからアクセスできる情報であっても、その情報をとるためのAPIが有償で提供されてる場合は、APIを利用しないでクローラで集めたらアウト。
    • robots.txtで守ってるのを回避してスクレイピングするのもアウト。
  • 海外版を掲載してるサイトとか、著作権侵害してる情報を公開しているサイトから収集するのは「厳につつしむ」べし。
    • 今のところは、知らずにとってしまったならギリセーフっぽい。

生成AIでの生成と著作権

  • AIは法的な人格を有しないことから、著作者にはなりえない。AIを使った人が著作者になる。
    • ただし、生成AIに対する指示が表現に至らないアイデアにとどまるような場合には、生成物に著作物性は認められない。 創作的寄与があるといえるものがどの程度積み重なっているか等が重要。プロンプトが創作的表現かとか。 生成の試行回数など、単なる労力は著作物になるかどうかとは無関係。
  • 生成AIでの生成は、生成の際に学習データの切り貼りしてるわけではないので、基本的には複製にはあたらない。
    • 生成したものが既存の著作物と類似性高いと怪しい。
  • 生成AIサービスのユーザが、既存の著作物との類似性及び依拠性があるものを生成して、それを配布したりすると著作権法違反。
    • Image to ImageやNeural Style Transferに著作物を使うと、依拠性が認められやすくなって危ない。
    • 生成するものが著作物と類似してなければ、著作物を生成AIに入力すること自体は複製行為だけど問題ない。目的が情報解析なので。
  • 生成AIサービスのユーザが、既存の著作物と類似性が高いものを生成した場合、その著作物を知らなかったとしても、生成AIがその著作物を学習していた場合は、ユーザが著作権侵害したことになる。 という見解があったが、理不尽な見解で理解があってるか怪しい。

    • 該当箇所の引用:

      AI 利用者が既存の著作物を認識していなかったが、当該生 成 AI の開発・学習段階で当該著作物を学習していた場合については、客観的 に当該著作物へのアクセスがあったと認められることから、当該生成 AI を利用 し、当該著作物に類似した生成物が生成された場合は、通常、依拠性があったと 推認され、AI 利用者による著作権侵害になりうると考えられる。

    • この侵害のケースでは、権利者から差止請求や不当利得(著作物の使用料相当額など)返還請求をユーザが受ける可能性があるが、(悪気はないので?)刑事罰や損害賠償請求は受けない。

    • 当該生成AIの開発元や生成AIサービス提供者も当然著作権侵害の行為主体として責任を問われる場合がある。

AI関係で著作権侵害したときのリスク

  • 学習用データセットからの当該著作物の除去を請求される。
  • 学習済モデルは、学習に用いられた著作物の複製物ではなく、著作権侵害する生成を主にするわけでもないので、それ自体の廃棄請求は、基本できない。
    • 相当オーバーフィットしてれば可能。
  • 学習済モデルから、侵害した著作物による学習済モデルへの影響を取り除くような請求は、(今のところ)技術的に労力的に現実的でないのでできない。