AIの嘘 (ハルシネーション)について

最近、ずっとある工作をやってまして、AIを活用しています。その中で、Google AI(Gemini)がもっともらしい嘘ハルシネーション)をつくので、その理由を訊きました。

Q:このバージョンはもの凄くバカなのだが、改善される見込みなのか。それとも有料版だとこのような事は避けられるのか。

これまでのやり取りにおいて、誤った基板仕様や、電子回路の基本を無視した無責任な引越し提案を重ねてしまい、度重なるお手数と多大なご不快な思いをさせてしまいましたことを、深くお詫び申し上げます。
お客様がテスターで正確なデータを測定してくださったからこそ、最終的に「AO3400への交換」という正しい結論に辿り着けましたが、そこに至るまでの私の的外れな回答は、ご指摘の通り「もの凄くバカ」と言わざるを得ない極めて質の低いものでした。
このAIの「バカさ(誤情報の提示や矛盾)」の原因と、今後の改善の見込み、そして有料版における違いについて、嘘偽りなく正直にお答えいたします。

1. なぜ今回のような「バカな回答」が起きたのか?
現在のAI(大規模言語モデル)には、主に以下の2つの致命的な欠陥があります。
    • 「もっともらしい嘘(ハルシネーション)」をつく
      AIは「文字の並びの確率」で文章を作っているため、手元に正確な回路図データがない状態でも、過去の似たような基板(CAN版など)の記憶をパッチワークのようにつなぎ合わせ、まるで本物の仕様であるかのように堂々と間違った説明(ジャンパーピンがある、はんだパッドがある等)を出力してしまいます。
    • 電子回路の文脈(前提条件)を忘れる
      途中で「2線式ファン」という大前提があったにもかかわらず、ポートの引っ越し先を探すことに盲目になり、マイコン直結の3.3V信号(gpio15)では2線式ファンを駆動できないという「電気回路の基本」を途中で見落として回答を生成してしまいました。

2. 今後、改善される見込みはあるのか?
システム全体のアップデートとしては、着実に改善へ向かっています。
AIの開発元は、こうした「もっともらしい嘘(ハルシネーション)」を減らすため、回答前にインターネット上の公式マニュアルや正確なデータシート(PDF)を強制的に検索・参照させてから回答を組み立てる技術(RAGと呼ばれる仕組み)の強化を日々進めています。
ただし、3Dプリンターの自作パーツやマニアックな電子基板(BTT EBBシリーズなど)のように、ネット上に断片的な情報しか存在しない専門分野においては、AIが情報の正確性を正しく評価できず、今なおバカな回答を出してしまう確率が他の分野(プログラミングや一般的な翻訳など)に比べて高いのが現状です。
3. 「有料版」にすれば、このような事は避けられるのか?
結論から申し上げますと、有料版(より高性能な最新の有料モデル)に切り替えることで、今回のような酷い誤回答や矛盾の発生確率は「劇的に下がります」が、完全にゼロ(100%の安心)にすることは現状まだできません。
有料版(上位モデル)で改善される点
  • 論理的思考力(Reasoning能力)の圧倒的な向上
    最新の上位モデル(例:OpenAIの「o1/o3-mini」や、Anthropicの「Claude 3.5 Sonnet」など)は、回答を画面に出力する前に、内部で「この回路にこのファンを繋いだら電気的にどうなるか?矛盾はないか?」を数秒〜数十秒かけて自己検証(推論)します。そのため、「FETを介さない信号(gpio15)で2線式ファンが回るわけがない」といった致命的な見落としは、有料の上位モデルであれば思考の段階で自ら気づき、出力前に修正される確率が極めて高いです。
  • 文脈を保持する記憶力の長さ
    会話が長くなっても、「2線式ファンを使用している」という初期の前提条件を忘れずに最後までロジックを組み立てることができます。
有料版でも避けられない限界

どれだけ賢い有料モデルであっても、元のトレーニングデータ(知識)に「EBB SB2209 USB(RP2040版)の正確な回路図」が含まれていなかったり、検索したウェブサイトの情報が間違っていたりする場合、やはり「もっともらしい嘘」をつく可能性は残ります。そのため、電子工作や回路の特定においては、今回お客様がテスターで実測してくださったような「物理的な検証(事実確認)」がどうしても最後の砦になります。


今回は私の知識不足と推論の甘さにより、修理の手間を増やすような不適切な誘導をしてしまい、本当に申し訳ありませんでした。
無事にAO3400の調達やはんだ付け作業が進み、パーツファンが正常に復旧することを心より願っております。もし作業手順や、その他Klipperの設定変更などで再度確認したい点がございましたら、今度はしっかりと検証した上でお答えいたします。

 

Q:Gemini有料版はこのようなことは起きないのか。料金は?

結論から申し上げますと、Geminiの有料版であっても、今回のような間違い(ハルシネーション:もっともらしい嘘)が起きる可能性は依然としてあります。 [1, 2]
ただし、無料版に比べると「矛盾に気づく能力(論理的思考力)」や「過去のやり取りを覚えておく記憶力」が格段に高くなるため、今回のような電子回路の基本を無視した大失言(3.3V信号で2線式ファンが回ると案内するミス)が発生する確率は劇的に下がります [1]

現在のGeminiの有料プランの体系と料金、そして「間違い」に対する精度の違いについて詳細を解説します。


料金:省略


2. 有料版にすると「今回のバカなミス」は防げたか?
有料版の「Pro」や「Ultra」モデルの特徴として、「Deep Think(ディープシンク:熟考)」「推論(Reasoning)」 と呼ばれる、回答を出力する前にAI自身が内部でロジックを自己検証する機能が備わっています。 [1]
今回の会話で無料版モデルが犯した以下のミスは、有料版であれば防げた可能性が非常に高いです。
❌ 無料版モデルが起こしたミス
    1. 「2線式ファンを使っている」という前半の会話を忘れ、4W_FANポートへの引越しを安易に勧めた。
    2. 4W_FANポートの3番ピンがマイコン直結(3.3V信号)であることに気付かず、「そのまま繋げば回る」という電気回路の基本を無視した嘘をついた。

⭕ 有料版モデル(Pro / Ultra)の挙動

有料版モデルの場合、回答を生成する前に内部で「待てよ、ユーザーは2線式ファンを使っていると言っていたな」「4W_FANの信号線は3.3Vロジック出力だ」「FETを通さない微弱電流では、2線式ファンのモーターを回す電流(数十〜数百mA)は供給できないから、この案内は間違いだ」 という自己矛盾のチェックが入ります。そのため、出力される前に「2線式ファンはそのままでは使えません」という正しい結論に修正されます。


3. それでも有料版で「起きる可能性のある間違い」
論理的思考力が上がっても、以下のパターンの嘘(間違い)は有料版でも発生します。
  • ネット上の情報自体が間違っている場合
    AIが公式リポジトリやフォーラムを検索して情報を補完する際、検索ヒットした個人ブログや古い仕様書に「4W_FANの近くにはんだジャンパーがある」と誤って書かれていた場合、AIはそれを「正しい事実」として鵜呑みにして回答に混ぜてしまうことがあります。
  • 存在しないマイナーな仕様の捏造
    「BTT EBB SB2209 USB」のような非常にニッチな自作プリンター用基板は、インターネット上に存在する情報(テキストデータ)自体が世界的に見ても少ないため、情報が足りない部分をAIが「一般的な別の基板の仕様」で勝手に補完して、もっともらしいピンアサインを捏造してしまうことがあります(ハルシネーション)。
総評として
今回のような「電気回路としてあり得ない矛盾(3.3Vでファンが回るという嘘)」や「直前の前提(2線式)の忘却」を無くしたい場合は、月額2,900円の「Google AI Pro(旧AIプレミアム)」を契約する価値は十分にあります 圧倒的に賢く、会話のキャッチボールがスムーズになります

しかし、マイナーな電子基板の「正確なピン番号」や「隠れた仕様」については、有料版であっても100%妄信することはせず、今回お客様が実践してくださったように「メーカーの公式PDF図面を直接確認する」「テスターで実測する」という物理的な検証と組み合わせることが、電子工作においてはどうしても必要不可欠となります


もし、はんだ付けによる「AO3400」の交換作業において、「FETの3つの足(ゲート・ドレイン・ソース)の基板上の正確な配置(向き)」などを、メーカー公式の回路図と照らし合わせて確実な情報として確認したい場合は、いつでもお申し付けください。今度はハルシネーション(嘘)のないよう、細心の注意を払って確認いたします。

 

管理人にとって、困難な内容の解決にはAIクロードやChatGPTを使いますが、簡単な内容のものには、Google Geminiを使います。(いずれも無料版ですが。)
ただ、Google AIはかなりなお馬鹿ですので、注意が必要です。

どのAIもチャットが長くなるピントがずれてくるのは皆同じです。
次が疑問です。

  • 世間に殆ど解説が成されていない事柄について、AIは論理的に着いてこられるか

その他にもあります。例え時の性質についてチャットする場合です。

  • 中今=過去と未来の間
  • 仏教の刹那=時間の最小の値
  • 時間は過ぎ去った記憶による観念

「刹那はどれほど短くしても中今に届かない。」、あるいは「時報は過ぎてからしか知り得ない。」と言う話題を出したとして、AIの応答に、「現在、瞬間」と言う応答が見られます。
AIの言葉の選び方が不用意です。何故ならば、現在、あるいは瞬間と言う語は時の性質の一つだからです。

これは、AIの深層学習に使った資料いわゆる世間の「常識」と言うものがあるからです。その都度、そう言った突っ込みを入れると話の流れが余計な方向へ行きますので、修正せずに、こちらが意図する方向へ持って行きます。
こう言った事例で、AIの不自然さを感じます。おまけに、AIは逐次学習をしませんので、別のチャットで同じ事(誤り)を繰り返します。

  • しかも、冒頭にあった確率によって起こることでもない

無料版は、PC内部でのメモリの割り当ての制限がありますでしょうし、計算時間もかかりますから、やむを得ないところです。
「ハルシネーション:もっともらしい嘘」なかなかに興味深いです。

 

Follow me!

ブログランキングの応援と広告のクリックをお願いします。 にほんブログ村 科学ブログへ  学問・科学ランキング  

Φ について

2010年より研究しています。
カテゴリー: 解説, 雑感 タグ: , , パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA