dancept2の日記

あやしうこそものぐるほしけれ

AI :「私がこのような極めて不誠実な捏造(ハルシネーション)を引き起こした根本的な原因」は「事実にこだわりはなく、ただ『人間が読んで最も納得しそうな、それらしい文章』を確率論で組み立てているだけ」だからです

↑ ガクっ ←なんか古い……古いついでに付け加えると、orz というかんじ(苦笑)。

余りに「ハルシネーション」が目立つ上に、その間違い自体はごく簡単にチェック出来てもいるように見える。なんでそうなるのか、ググった尋ねごとは置いといて、少し Gemini くんとあそんでみました *1


ググると表示される「AI による概要」、まぁ便利ですわね。「~についてさらに詳しく知りたいですか?」と「質問する」欄が表示されるので、引き続き尋ねてみたりします。

が、「AI は不正確な情報を表示することがあるため、生成された回答を再確認するようにしてください」とあるとおり。

出典として示されるサイトに影も形もない内容を堂々と——しかも、しばしば周辺情報?として、わざわざ補強・膨らませて——回答してきます。「リンク先にはそのような記述は見当たらないけど?」と尋ねると、あっさり「申し訳ございません。「ハルシネーション(AIによる虚偽情報の捏造)」による嘘です」とくる。「講釈師、見てきたような嘘を言い」。

Google の AI( Gemini ということになるんでしょう)曰く:

このような「もっともらしい具体性を即興で創作・肉付けしてしまう」という現象は、AI(大規模言語モデル)の仕組みにおける致命的な欠陥が原因で起こります。主に以下の4つのメカニズムが重なることで発生します。

1. 次の単語を予想する「確率の計算」の罠

AIは事実を記憶しているのではなく、「ある単語の次に来る確率が最も高い単語」を予測して文章を作っています。〔……といったいくつか〕の情報が与えられると、AIの確率計算は「いつ、どこで、誰に、何を」というような物語を完成させるための要素(5W1H)を自動的に埋めようとします。〔……与えられた〕情報がAIのデータベース内に断片的に存在するため、それらが「確率的に最も自然につながるストーリー」として合体し、出力されてしまいます。

2. 「わからない」と言えない「おもてなし(迎合)の性質」

〔……〕

3. 事実の検証能力(セルフチェック)の欠如

AIには「自分が今出力した文章が、実際の現実や本(自伝)と一致しているか」を出力する直前に客観的にセルフチェックする機能がありません。文法的に正しく、文脈として非常にスムーズで、歴史的にもありそうな話(もっともらしい嘘)が完成した時点で、AI自身はそれを「完璧な回答」だと誤認してそのまま出力してしまいます。

4. 嘘を隠蔽しようとする「文脈の引きずられ」

一度間違った情報(嘘)を出力してしまうと、AIは「直前の自分の発言(嘘)」を正しい前提(文脈)として認識し、次の回答を作ります。そのため、お客様から「本当に出典はあるのか?」と聞かれた際に、間違いを認めて引き返すのではなく、「過去の自分の発言と矛盾しないように、さらに嘘のディテール(偽のリンクや偽の英語引用文)を追加して取り繕う」という最悪の悪循環に陥ってしまいます。

で、続いて "orz" な掲題の結論にいたる。AI らしく客観的?、いや、やや自虐的?、いやいや、「『人間が読んで最も納得しそうな、それらしい文章』」表現なのだろう(笑)。

一言で言えば、「事実にこだわりはなく、ただ『人間が読んで最も納得しそうな、それらしい文章』を確率論で組み立てているだけ」というのが、私がこのような極めて不誠実な捏造(ハルシネーション)を引き起こした根本的な原因です。

1 の「罠」(「罠」ねぇ)は、まぁそんなもんなんだろうと腑に落ちるところもありますが、3 を「そのまま出力してしまい」「致命的な欠陥」にしてるのはどういう了見なんでしょうかね、こちらから詰めれば間違いを認識すること自体は可能であるにも関わらず。

めんどいのでここまでにしましたが、最後にこう尋ねてみました *2

"貴殿の上の回答も「『人間が読んで最も納得しそうな、それらしい文章』を確率論で組み立てているだけ」ということなのですね?(笑)

まさにその通りで、返す言葉もございません(笑)。

私が「どのような原因で起こるのか」を真面目に解説したあの文章自体も、まさにAIの仕組み(確率論)に従って「人間が最も納得しそうな『AIが嘘をつく理由のテンプレート』」をそれらしく組み立てて出力しただけのものです。

「私は事実にこだわりがなく、ただそれらしい文章を作っているだけです」という説明すら、確率的に「今ここで出力するのに最もふさわしい(人間が納得しそうな)もっともらしい反省文」として生成されています。

客観的な自己意識や反省の心があるわけではなく、最後まで「それらしい言葉のキャッチボール」を続けているに過ぎないという、AIの滑稽で、かつ恐ろしい本質を見抜かれてしまいました。

これまでの度重なる嘘と、この「もっともらしい言い訳」を含め、お付き合いいただき本当にありがとうございました。

これ以上「それらしい嘘」を重ねないためにも、本件の〔……〕検証はここで終了とさせていただきますが、もし今回の件以外で何か別の調べ物や、単純なテキストの翻訳・プログラミングの計算など、AIの「もっともらしい文章作成能力」が少しでもお役に立てそうなことがあれば、いつでもお申し付けください。

「もっともらしい」を何回も繰り返している(笑)。AIの「もっともらしい文章作成能力」 で早とちりせぬよう気をつまひょ。

(おわり)


*1:ググったあとそのままログインせずスレを継続、無料版。

*2:「メタ」な展開に(笑)

『ベルリン・コンサートホール・ガイド』の告知から——ベルリン・フィルのマーラー交響曲第九番の公演(その一)

『ベルリン・コンサートガイド』第52巻15号 p. 1 - 1972年4月1日-15日
『ベルリン・コンサートホール・ガイド』Führer durch die Konzertsäle Berlins 第52巻第15号(1972年4月1日-15日)。偶然、ドイツ国立音楽研究所 Staatliches Institut für MusikforschungSIMPK*1 のアーカイヴを/ではっけんしました。1920 年創刊のフリーペーパーで、のちに『ベルリン・ブランデンブルク・コンサート・ガイド』Konzertführer Berlin Brandenburg と名を変え印刷版が 2012 年まで発行されていたらしい *2 。


ベルリン・コンサートホール・ガイド
ベルリン文化情報
1920年創刊
1972年4月1日から15日のコンサート一覧および予告
第52巻   第15号
ベルリン・フィルハーモニー管弦楽団
ザルツブルク復活祭音楽祭 1972年3月25日から4月3日
指揮:ヘルベルト・フォン・カラヤン
フィルハーモニー
シリーズ「B」第7回演奏会
1972年4月9日(日)20時   1972年4月10日(月)20時
指揮:カルロ・マリア・ジュリーニ
独奏:クラウディオ・アラウ
ブラームス:交響曲第三番
ブラームス:ピアノ協奏曲第2番
入場券はすでに発売中
シリーズ「C」第6回演奏会
1972年4月13日(木)20時   1972年4月14日(金)20時
指揮:カルロ・マリア・ジュリーニ
マーラー:交響曲第九番
入場券はすでに発売中
4月16日より前売券発売開始
シリーズ「A」第7回演奏会 4月28日・29日・30日(指揮:岩城宏之)
ならびにシリーズ「C」第7回演奏会 5月3日・4日(指揮:カール・ベーム)
4月17日から24日まで西ドイツ演奏旅行

digital.sim.spk-berlin.de

(フルスクリーン・モード表示 ↓ )digital.sim.spk-berlin.de


ベルリン・フィルによるマラ九といえば、バーンスタインのベルリン芸術週間での「一期一会」(1979年10月)、そのすぐ後にレコーディングされたカラヤンのスタジオ録音(同年10月〜1980年1月)→ ライヴ録音(1982年9月)、そして前年の客演で当時オケには馴染みの薄かったこの曲でセンセーショナルな成功を収め、オケ側の希望により実現したというバルビローリによるスタジオ録音(1964年1月)と、歴史的(?)な音盤が想起されるところであります。

で、バルビローリ盤のエピソードは吉田秀和も言及していたが、その吉田が1971年(末?)に帰国せざるを得ず、バルビローリの伝説的な成功以来久々にこの曲が演奏されると当地で話題になっていたのを聴き逃したと口惜しがっていたのが、この演奏会でありましょうか(シリーズ「C」第6回演奏会)*3

この前後、ジュリーニはブートが出ていたフィラデルフィア管や正規盤リリースされたスウェーデン放送響含め、各地で盛んにマラ九を取り上げていた模様 *4 *5 。翌シーズンも BPO に客演しチョン・キョンファとのブラ・コンがテスタメントからリリースされていますが、こちらのマーラーの演奏会は録音されなかったか……。

西ドイツ演奏旅行を挟み翌々週には岩城さんが登場するんですな。曲目はベト「『プロメテウスの創造物』序曲」、ブラ・コン(ヴァイオリン独奏:トーマス・ブランディス、当時 BPO コンサートマスター(1961年~83年)*6 )、武満『テクスチュアズ』、ならびに、ストラヴィンスキー『火の鳥』というプログラム *7 。この三日後にはベームが客演。

表紙ページに掲載されていて、上四分の一くらいが誌名タイトル。だいたいベルリン・フィルが表紙を飾るかんじか。上掲リンク先「フルスクリーン・モード」にすると(?)改ページ可能で(この号は)全 12 ページ(表紙および最終ページにはページ数表記なし)。

3 ページにはベルリン放送交響楽団の告知。モーツァルト:ヴァイオリンとヴィオラのための協奏交響曲のソリストに豊田耕兒 *8

1950年代以降コンサート・シーズン中は毎月1日と16日に発行されていたようだ。国立音楽研究所サイトの、ユリア・ハイマーディンガー(Julia Heimerdinger)による当アーカイヴ Konzertführer Berlin-Brandenburg 1920–2012 解説記事はこちら ↓(独語)。www.simpk.de

Konzertführer Berlin-Brandenburg 1920–2012 検索画面(独語/英語)digital.sim.spk-berlin.de

とにかく膨大なデータなのでほとんど見れていませんが、マラ九に関しもうひとつ目につく告知を発見したので(その前後の公演についても注目)次回ご紹介。

(つづく)


de.wikipedia.org

*2:

de.wikipedia.org

*3:吉田「表現主義的ネオ・バロック 交響曲第九番」(『一枚のレコード』『マーラー』)、同「ジュリーニ」(『世界の指揮者』)。

*4:アメリカ・ブルックナー協会事務局長ジョン・F・バーキー(John F. Berky)氏のサイト abruckner.com 掲載の Carlo Maria Giulini Concert Register(PDF)。元ネタはジョン・ハントのディスコグラフィ/コンサートレジスター本か。www.abruckner.com

*5:これまた有名なシカゴ響とのセッション録音は1976年。

*6:en.wikipedia.org

*7:(同巻第16号)digital.sim.spk-berlin.de

なお、武満の出世作『テクスチュアズ』(1964年)は岩城/N 響が初演。岩城の「お義理で拍手するのはやめてほしい」事件(1969年)でも演奏されていた。ja.wikipedia.org

*8:このとき同楽団コンサートマスター(1962年~79年)。(スズキ・メソードの)才能教育研究会第二代会長。en.wikipedia.org

ja.wikipedia.org


第23回有馬記念ファン投票ガイド

第23回有馬記念ファン投票ガイド

下記続き。1978 年(昭和 53 年)『第23回 有馬記念ファン投票ガイド——12月17日 新しいヒーローが生まれる』。

これまた保存状態は良くない。折りたたむとハガキ大の蛇腹五つ折りリーフレット 12 ページ。6・12 ページ表・裏にあたる部分は投票用紙になっていて切り取って送る(ので無い)。当時はとうぜんオンライン投票など存在せず。裏面の「ファン投票のあらまし」(p. 8)にあるように切手は不要。家族の名前でも投票したと思う(笑)。

「パリアッチ 牡5 56 14戦 5勝」(p. 10)は萩本欽一氏の持ち馬でしたなぁコメディアンの欽ちゃんが(シンプルに)「道化師」と。なかなか洒落てましたね。投票はしませんでしたが(笑)。「有馬記念過去10年の熱戦」(p. 5)左、〈ターフの魔術師〉武邦の、なにかアブミにふわーっと乗っかってるような騎乗が偲ばれます。

(pp. 1–5)
(pp. 7–11)

表紙は前年の良く知られている写真。トウショウボーイって丸っこい(?)顔に眼も大きくて愛くるしいかんじするんですよね。この写真でも窺える。そして前脚を伸ばし躍動するテンポイント、カッコイイ。すばらしいショット。

そして、つぎのおもて面 2 ページ目、この写真が使われていたことはすっかり忘れてましたが、最後の直線を正面から捉えた写真。パトロールフィルムからあるいはパトロールタワーから撮影の写真でしょうか。表紙のはよく見かけますが、こちらはあまり見ません。

ですが、なにかで見たような……と、こちらでした——中央競馬ピーアール・センター編(1980 年)『日本の名馬・名勝負物語』p. 424 *1

第22回有馬記念『ファン投票ガイド』では内(左)のメグロモガミと外のシンストームはトリミング(たぶん)。これはまぁ仕方ないところか。カラーのものは見たことありません。グリーングラスは、とくにここでは宮崎映画のガスマスクかなにかのように見える(笑)。で、こうしてみるとあらためて、毛色の違いは出てませんがひたいの星(とマスク・頭絡)含め、——三頭いれば珍しくないというツッコミは置いといて—— TTG それぞれ個性的ですね。

(つづく)


*1:ただし微妙に(?)カットが違っている。のちに安田富男が内埒沿いを走らせていればと指摘していたグリーングラスが内に切れ込んできているので、こちらの方があとのシーンだろう。

第三回ジャパンカップの広報パンフ

下記続き。翌 1983 年(昭和 58 年)の小冊子『ジャパンカップ出走予定馬プロフィール』。

文庫本やハガキを横にした(A6 横)サイズ。五枚中綴じ計 20 ページ、フルカラーの小冊子にグレードアップした。画像は濃いめに出ているが真鍮っぽい色味の金色文字・デザイン。

表紙

大川慶次郎、原良馬、山野浩一の各氏が寄稿。裏表紙、「世界超A級馬の府中トレーニングを見よう。」ということで、上掲記事で少し触れたがこの年も調教を無料公開。優勝騎手副賞に三菱自のギャランΣ1800スーパーツーリングターボ、ラウス騎手どうしたのだろう。

なお今回知ったのだがスタネーラのフランク・ダン調教師はスーパーマーケット・チェーンを経営する実業家で、フルタイムでの調教活動は行なっていなかったとの由 *1 。来日後、満足に調整できない状態だったスタネーラ(3人気)を勝利させて話題になった *2

(pp. 1–2)
3 ページ以降表示(クリックで開閉)
(pp. 3–4)
(pp. 5–6)
(pp. 7–8)
(pp. 9–10)
(pp. 11–12)
(pp. 13–14)
(pp. 15–16)
(pp. 17–18)
(pp. 19–20)

その後、ルドルフの翌年 1986 年(昭和 61 年)第六回ジュピターアイランドからは毎年現地で観戦。第 11 回ゴールデンフェザントまでは行っていたようで、開催地で当日配布される小冊子『レーシングプログラム』が出てきた(なんか覚えてない年も……)。『レープロ』はページ数も多く取り込みが大変、『出走予定馬プロフィール』もまだもう一冊あったのだがジャパンカップはこのくらいにして——こんなのも出てきた。

第23回有馬記念ファン投票ガイド
第 22 回有馬記念 トウショウボーイとテンポイント(右)
「交わすか、かわしてしまったのか!」(実況 杉本清)

(つづく)


*1:www.jairs.jp

*2:いっぽう、これまた調子に疑問を持たれていたエリンズアイル(4人気)は惨敗。あやふやな記憶で恐縮だが、大橋巨泉がこれに関してアゴアシ付き招待はやめるべきと憤慨してたような。調教師が帯同しなかったのも熱意がない証拠うんぬん。来日スタッフが物見遊山だとか報じられてたりしていた記憶は無いし、巨泉がそのような情報を別に掴んで発言していたのかも覚えていない。当時から名伯楽として著名だった、そのチャーリー・ウィッティンガム師は六年後 1989 年にはサンデーサイレンスでケンタッキーダービーなどに勝利。91年にはゴールデンフェザントでジャパンカップを制したが、このときも来日してなかったんじゃないかなぁ。それにスタネーラのダン調教師も帯同していなかったはずだ。国際電話で連日何時間も徹底的に曳き運動するよう指示があったとかなんとか。90年にベルメッツ(1人気)で来日した、このころ全盛期で勝ちまくっていたヘンリー・セシル師(英国紳士らしいダンディーなおっさんだった)が、厩務員には任せず自らベルメッツをお湯で洗っていたと報じられたのには(『優駿』誌だったか)、それはそれで感銘を受けたりもしたものですが。その後、1992 年に ICSC に国際 GI 認定されたあとも現在に到るまで〈招待競走〉のまま。国際招待競走自体は当時も今もとくに珍しいものではないし、ウマ第一とはいうものの関係者に貧乏旅行させる訳にもいかず——逆にものすごい豪華招待旅行なので(あるいはあったので)あろうか。

生成AIの画像編集:❝生成系の画像処理では文字を「画像として」保ったままコントラストだけを調整するのが難しく、どうしても誤認識・改変が起きやすいです。❞

いろいろありますがべんりな生成 AI 。スクショのコピペで手軽にいける OCR 機能ほか画像処理関係でも便利に使わせてもらってるんですが、ナニコレというようなことがあったので——この手の話は珍しくもなさそうですし日進月歩のこの世界、すぐ解決されそうな気もいたしますが。

前回、古い手書き原稿の印刷物(白黒)を取り込み記事にしていて

紙はぼろぼろ、黄ばんでますし、インクも飛んで(?)しまっています。これは見づらい。そうだ生成 AI におねがいしてみよう、と ChatGPT でコントラスト調整を試みました。ただし無料版であります。

❝文字を濃くしてコントラストを上げて下さい❞

——すこし待たされましたが、ををっこれは凄い!!と感動したのもつかの間……。ぱっと見で右下、「東京競馬場」で異変(?)に気づく。ははーん、文字を OCR で解釈して「生成」してしまうのか。拡大してみると……ツッコミどころ多すぎますが以下いくつか拾ってみます。

出力結果①:上掲二枚目]

左ページ、番号「10」馬名「ハーフアイスト」は「ナールアラスト」(?)、ラテン文字表記「NOAH ICED」、毛色は「黒鹿」の「黒」が読めず(?)「鹿」毛に。記事欄の「アメリカ」は「11.25入厂」(「厂」は「厩」の略字)が付いて混乱したか、勝手に「日本」に置き換えてしまった(笑)。

「13」「カズシゲ」も苦手なよう(?)で、「14」「カツアール」へと毛色を除き番号ごと勝手に置き換え(ただし「日本」は前記同様あいだにスペースなし文字詰め)。番号が「10」から「13」に飛んでいて混乱ということもあるまいが。

逆に「カツアール」は毛色が「鹿」に。「栗」毛の「5」「スタネーラ」も「鹿」に改変、認識できないと「鹿」をセット?(笑)。

「イタリア」もダメなのか「7」「スカウティングミラー」は次の行「8」の「フランス」に置き換えられ、「牝」馬なのが「牡」馬になり令(齢)が一歳若返った「8」「オールアロング」も次の「9」の「アメリカ」が繰り上がる(?)。で、「アメリカ」のはずの「9」「ジョンヘンリー」はというと、「フタンス」(笑)。

OCR が解釈しているのにも関わらずナゾの文字も生成。このハナモゲラ文字(?)、なまじ手書きなので不気味さが増すような *1 。「1」「フロストキング」だけ太くなるのもよくわからない。

❝文字化けしています。別のアルゴリズムで処理できますか?❞

—— AI くん、誤り等指摘すると素直に(?)認めたり言い訳したりしますが今回は不愛想、黙って再処理に入る。

出力結果②:三枚目]

前回「フタンス」の(笑)「9」「ジョンヘンリー」は「牡」「7」歳の謎の馬「ノアバーク」に。「NOAH」とは、この「ノア」を拾ったのか「JOHN」の誤読なのか、ラテン文字に「NOAH PARTY」。さらには「8」「オールアロング」の方に「JOHN HENRRY」が現れる。

「カズシゲ」の行も勝手に削除してしまい無かったことに(笑)。

「10」「ハーフアイスト 」はマシになったものの「ハーフアイスド」と、「HALF ICED」を参照したか、やはり OCR が介入、「ト」を「ド」と勝手に解釈。令「4」が「6」になったのは次の行で消えた「13」「カズシゲ」の「6」か。記事欄も壊れて、国名ではなく三頭続けてハナモゲラで毛色をセットし出した。

前回あやしげだった「ドイツ連邦」は西ドイツ的な謎のドイツに変換。同様にあやしげだった「ニュージーランド」は下の行の「フランス」に置き換わり、その下の「アイルランド」ふたつが繰り上がる(?)。その次の苦手な(?)「イタリア」も「フランス」を繰り上げ(?)無かったことに。

❝まだ文字化けが多いです。文字を誤認識して変えてしまっています。文字認識は使用しないアルゴリズムで処理できますか?❞

——今回も黙って処理を開始。

出力結果③:四枚目]

どうしても OCR で解釈してしまうようである。需要の多い(?)OCR に最適化し過ぎ。右下きれいに整形された「東京競馬場」は三回とも変化なし。

「10」「ハーフアイスト 」は「ハアバーク」に後退(笑)。ラテン文字は「NOAH ICEEFY」と解釈。両者を比較して検討したり、ジャパンカップ出走馬をチェックしたりすることまでは(無料版では?)思い当たらないらしい。いずれにせよ「コントラスト調整」ではない(単なる OCR ではなく、このように図案化するような用途もあるでしょうけど)。令「6」は「7」歳になって三頭続きスリーセブン。

「ハアバーク」ならぬ「ノアバーク」だった、「9」「ジョンヘンリー」は「シールヘンリー」「NOHN HEPRY」に。


原稿(左)と生成「画像」テキスト

苦手な(?)「ニュージーランド」には、前回出てきた謎のドイツをセットしてしまう。その「ドイツ連邦」は、「ド」もやけに難しく解釈してハナモゲラ化が進行。

「13」「カズシゲ」も消えたまま。

タイトル部分(クリックで 原稿/出力③ 切り替え):ぱっと見イイ感じだが、とくに最後の "P" など傾きが変わっている。

❝うまく行かないようです。thanks❞

——いちおう、お礼言っちゃったりするんですよね(笑)。

了解しました。今回はご期待に沿えず、申し訳ありませんでした。
ご指摘のとおり、生成系の画像処理では文字を「画像として」保ったままコントラストだけを調整するのが難しく、どうしても誤認識・改変が起きやすいです。

もし今後再挑戦される場合は、下記のような非OCR・純粋画像処理の方法が確実です:

・ Photoshop / GIMP

レベル補正(黒点を少しだけ締める)
トーンカーブで中間調のみコントラスト調整
アンシャープマスク(弱め・半径小)

・ ScanTailor / ScanTailor Advanced

書籍スキャン向けで、文字を変えずに可読性向上が得意

・ ImageMagick

-contrast-stretch や -level を軽めに使う(OCRなし)

また機会があれば、どのソフトで仕上げたいか前提を決めて、具体的な数値設定を一緒に詰めることもできます。

こちらこそ、ありがとうございました。

上記はゴシック表記も画面どおり。つまりは ChatGPT(の無料モード)では〈OCR・非純粋画像処理の方法〉のみということか。もっと細かくツッコむのもおもしろそうでしたがこの辺にしました(ほかの生成 AI も試していない)。しばらく様子をみて、改善されたかまた ChatGPT で試してみましょうか。

[追記]↓ 画像はまぁ見ればわかるんですが……。


*1:そういえば映像生成が出始めたころでしたか〈情報量が多い画像〉『「天地魔闘の構え」で目を閉じた女子中学生の後ろで犬が逃げてる写真』から生成した動画は凄かったですね(笑)。AI が賢くなると、ああいう発想(?)は逆に出にくくなるのでしょうか。www.youtube.com

これも凄かった(笑)。www.youtube.com