Appleが自分のサイト・コンテンツをAI学習に利用しないようにする方法

Appleニュース

Appleが自分のサイトをAI学習に利用しないようにする方法

2024.06.252024.06.30

Appleが先日のWWDCでApple Intelligenceを発表しましたが、Apple IntelligenceによるAIが自分のサイトなど管理しているサイトの学習をされないようにする方法を公開しました。

Applebotとは別にApplebot-Extendedを新規導入

Appleは元々Applebotというユーザーエージェントを利用しており、Applebotによってクロールされたデータは、Spotlight、Siri、SafariなどAppleのシステムで利用されています。

今回AppleはApplebotとは別のクローラーとしてApple Intelligence向けのApplebot-Extendedを新規で導入しました。

どちらも勝手に学習されたくない形は「robots.txt」を利用して拒否することができます。

ApplebotとApplebot-Extendedのクローラーによる学習を拒否するには「robots.txt」に記入することで対応できます。

Applebotのクローラーを拒否するには「robots.txt」に以下を記入してください。

User-agent: Applebot
Disallow: /

Applebot-Extendedのクローラーを拒否するには「robots.txt」に以下を記入してください。

User-agent: Applebot-Extended
Disallow: /private/

また、指定のフォルダだけ学習させないという指定をする場合は以下のように指定してください。

例としてsampleフォルダ以下を拒否する場合です。

User-agent: Applebot-Extended
Disallow: /sample/

今回のApple Intelligence以外にもChatGPTをはじめとするAI関連のクローラーを拒否する方法も補足でご紹介します。

OpenAIが提供しているChatGPT が、サイトのデータを学習の利用に拒否するときは以下のコードを「robots.txt」に記入してください。

User-agent: ChatGPT
Disallow: /

Anthropic社の生成AIモデル「Claude」が、サイトのデータを学習の利用に拒否するときは以下のコードを「robots.txt」に記入してください。

User-agent: Claude
Disallow: /

Googleの「Gemini」が、サイトのデータを学習の利用に拒否するときは以下のコードを「robots.txt」に記入してください。

User-agent: Gemini
Disallow: /