信頼するが、検証する (より良いデータを使用して): AI の幻覚問題を克服する | 意見

開示:ここで表明された見解や意見は著者のみに属し、crypto.newsの社説の見解や意見を表すものではありません。

世界有数のオンライン辞書であるDictionary.comは最近、2023年の今年の言葉に”幻覚”という興味深い選択肢を選びました。これは、新しいタイプの幻覚剤や集団ヒステリーの新たな動きに関するパニックによるものではなく、人工知能という新興産業から生じる非常に奇妙な現象に対する非常に奇妙な名前のせいです。汎用人工知能(AGI)は、2022年11月にOpenAIが生成型AIチャットボットChatGPTを発表して以来、一般の人々の意識に浸透しました。

もちろん、”幻覚”を感じることができるのは、実際の感覚を持つ生物だけです。しかし、これは、人工知能が誤った情報を提供したり、与えられた特定のクエリに対処しないランダムな言語を生成したりする場合を説明するために使用されてきた包括的な用語です。

あるケースでは、マイクロソフトの検索エンジンBingの人工知能が、ニューヨーク・タイムズの記者の質問を無視し始め、妻と別れるように説得しようとしました。その面白い好奇心(記者にとってはそれほどではないかもしれません)とは別に、初期のAGIの幻覚は、ChatGPTのようなクエリエンジンのユーザーが疑問を持たずにその応答を受け入れたときに、実際の問題を引き起こしました。ある事件では、ChatGPTを使用していくつかの虚偽の事件引用を満載した法的準備書面を作成したとして、弁護士が罰金を科せられました(そして法廷から失笑されました)。

これらの弁護士は短期的な経済的苦痛をもたらし、間違いなく個人的および職業上長期的な当惑を自らにもたらしましたが、数百万、おそらくは数十億が危険にさらされている場合はどうなるでしょうか?

AIと金融セクター

私たちは、特に自動化で繁栄してきた一方で、すでに多大な損失を被っている金融業界において、人工知能の誘惑に注意する必要があります。この新しいデータ分析ツールを今後の情報インフラストラクチャ、特に今後の金融情報インフラストラクチャの一部にしようとする場合、これらのテクノロジーが業界内でどのように実装され、自主規制されるかについて慎重になる必要があります。

2012年にアルゴリズムによってニューヨーク証券取引所から500,000,000ドル近くの価値が消失したときのような、自動化された高頻度取引の初期の、そして時には危険な時代を忘れることができる人は多くありません。会話的で人間のような言語に包まれたAGI幻覚は、さらに危険な可能性があり、誤ったデータを広めるだけでなく、不十分な情報による取引や金融パニックを悪化させるだけでなく、人間のトレーダーに長期的な判断ミスをさせるよう仕向けることにもなります。

幻覚はなぜ生まれるのでしょうか?場合によっては、プロンプトの構築方法が、生成AIまたは大規模言語モデル(LLM)の現在の反復を混乱させる可能性があります。同様に、Google HomeやAmazon Echoなどのスマートスピーカーは、周囲の騒音を自分たちに向けられたクエリであると誤って解釈する可能性があります。

多くの場合、初期のAGIが、ラベル付けや分類ミスによって、欠陥のあるデータセットでトレーニングされている場合もあります。これは、政治の舞台のさまざまな側が”もう一つの事実”や”フェイクニュース”について独自の定義を持っている、あるいは自分たちの側を良く見せ、相手側を悪く見せるニュースを強調することを選択しているというだけのケースではありません。AGIはモデル内に直接的または一貫した答えを提供するのに十分なデータがないため、一貫性のない間接的な答えを提供するというウサギの穴に落ちてしまいます。

ある意味、これは、既存のデータ配信の品質と速度を上回る野心を持った、それ以前に登場した他の初期テクノロジーと似ていません。インターネットは、あるパソコンから別のパソコンに大量のデータを転送できるようになるまで、真の意味でゲームチェンジャーにはなりませんでした。携帯電話で同じことができるようになったとき、ゲームは本当に変わったと主張する人もいます。この新しいAGIは、これらの新しいAIモデルに、より優れたデータセットと、迅速で使いやすく、できれば一貫性のある洞察とインテリジェンスを提供するより効率的な方法を提供するために、構築を続ける人間のトレーニングも行っています。

解決策はありますか?

幻覚を最小限に抑えるさまざまな方法を多くの人が提案しています。その中には、基本的にデータソースをリアルタイムで継続的に更新する方法である検索拡張生成(RAG)と呼ばれるものも含まれます。これは、過去15年間で最も人気のあるパブリックリアルタイムデータソースにアクセスできるイーロンマスク氏のGrok AIの利点の1つである可能性があります。

ただし、私は解決策としてブロックチェーンに賛成です。1つの企業のゲートキーパーや壁に囲まれたデータガーデンに閉じ込められることはなく、新しく優れた分散データソースを構築できます。ブロックチェーンは、ピアツーピアのデータ保存と送信だけでなく、支払い送信のためにも構築されており、AIを注入した情報経済の根本的な新段階となることが確実であるものに対して、新しいインセンティブの方法を生み出す可能性があります。

金融の世界では、分散型ナレッジグラフのようなものがあれば、業界全体の関係者がより多くのデータを透過的に共有できるようになり、インセンティブが与えられるでしょう。ブロックチェーンは、すべての関連する不変情報をリアルタイムで更新および検証できるようになります。このデータ検証方法はRAGの強化バージョンであり、AGI幻覚の数を大幅に減少させます。セマンティクスと検証可能性が組み込まれた知識資産を使用します(情報開示のために、私は分散型ナレッジグラフのバージョンを開発しているOriginTrailと協力しました)。

いつか”ロボット”が人間よりも優れたトレーダーになる日が来るかもしれません。最終的には、ロボットが”幻覚を見ている”現実ではなく、私たちが作り出す現実において、より優れ、より堅牢で、より速く動作するツールをロボットに提供するシステムを作成するかどうかは、私たちの選択になります。