データギャップに注意: DeAI にはより多様なデータセットが必要 | オピニオン

開示: ここで表明された見解や意見は著者自身のものであり、crypto.news の社説の見解や意見を代表するものではありません。

人工知能は大流行しています。しかし、分散型 AI (DeAI) を取り巻く誇大宣伝の裏には、多様で安全かつ検証可能なデータの不足という重大な欠陥があります。オンチェーン データセットは、本当に強力なモデルをトレーニングするにはあまりにも限られています。これにより、Web の膨大なデータに自由にアクセスできる中央集権型の巨大企業に AI の未来が譲り渡されるリスクがあります。

DeAI の約束である、民主化され、透明性があり、堅牢な AI は、このデータ ギャップを埋めることにかかっています。巧妙な暗号化がその道筋を提供します。

従来の AI の美点は、その貪欲さにあります。データを貪れば貪るほど、より賢くなります。しかし、この利点は、AI の弱点でもあります。集中型の AI モデルは、明示的な同意なしに収集されることが多いデータでトレーニングされるため、プライバシーと制御に関する厄介な問題が生じます。

ブロックチェーンの分散化と透明性の原則に基づいて構築された DeAI は、魅力的な代替手段を提供します。しかし、オンチェーンのデータのほとんどは金融取引または DeFi から取得されます。特に、小規模な言語モデルでは、微調整のためにより正確なデータが必要です。このため、DeAI モデルは、最新モデルに期待される競争力のあるレベルに改良するために必要な、豊富で多様なデータセットが不足しています。

このようなデータセットは web3 の外部でも利用可能で、The Pile と Common Crawl にはそれぞれ数十億の固有のソースからのデータが含まれています。既存の検証済み web2 データ ソースの深さとデータ量のおかげで、集中型 AI プロバイダーは GPT をこれまで以上に迅速に改良することができました。

同じレベルのデータをオンチェーンで再現することは、競争の激しい時間スケールでは実現不可能です。また、一部の AI 企業は、ここで説明したような微妙なデータを盗んだとしてデータ作成者から非難されていますが、より多くのデータをオンチェーンで取得するには、データをより安全にするという別の方法があります。

橋を架ける

ここで暗号化が登場します。ブロックチェーンのスケーラビリティとプライバシーですでに大きな話題となっているゼロ知識証明は、強力なソリューションを提供します。特に、ゼロ知識完全準同型暗号化 (zkFHE) とゼロ知識 TLS (zkTLS) という 2 つの技術が、DeAI の web2 データのロックを解除する鍵を握っています。

zkFHE を使用すると、暗号化されたデータを復号化せずに計算を実行できます。患者の生データを公開することなく、機密性の高い医療記録で AI モデルをトレーニングすることを想像してみてください。これが zkFHE の威力です。これにより、DeAI モデルはプライバシーが保護された膨大なデータセットから学習できるようになり、トレーニングの可能性が大幅に広がります。

zkTLS はこの原則をインターネット通信に拡張します。これにより、ユーザーは、基礎となる情報を明らかにすることなく、Web サイトからの特定のデータ (クレジット スコアやソーシャル メディアのアクティビティなど) を所有していることを証明できます。これは、web2 のサイロに存在する膨大なデータを DeAI システムに統合するために不可欠です。たとえば、分散型クレジット スコアリング モデルは、zkTLS を利用して、従来の金融機関の認証済み金融データに機密性を損なうことなくアクセスできます。

アドバンテージ、DeAI?

その影響は計り知れません。zkFHE と zkTLS を組み合わせることで、DeAI はプライバシーと分散化という基本原則を維持しながら、web2 の膨大なデータを活用できます。これにより、競争の場が平等になり、DeAI は中央集権型 AI と競争し、場合によってはそれを凌駕することも可能になります。

現在、資金力のある大手テクノロジー企業が主導する大規模言語モデルの開発を考えてみましょう。これらのモデルは、トレーニングに膨大な量のテキスト データを必要とします。zkTLS を活用することで、DeAI 開発者はプライバシーを保護しながら公開されている Web データにアクセスして活用し、より民主的で透明性の高い LLM を作成できます。

もちろん、課題はあります。zkFHE と zkTLS の実装には計算負荷がかかり、ハードウェアとソフトウェアの大幅な進歩が必要です。標準化と相互運用性も、広く採用されるには不可欠です。しかし、潜在的なメリットは計り知れません。

AI の覇権をめぐる競争において、データは究極の燃料です。zkFHE や zkTLS などの暗号化ソリューションを採用することで、DeAI はパフォーマンスに必要な燃料にアクセスできます。これは、よりスマートな AI を構築することだけではありません。より民主的で公平な AI の未来を構築することでもあります。