氏か育ちか論争と生成AIアルゴリズム

ちょっとした心境変化がありまして、ふと思ったことは覚えているうちに残しておかないと明日にはもう忘れているという状況がここ最近よくあるので(食べたものとか、予定とか)、つらつらと

最近の生成AIアルゴリズムが進化プロセスを模倣しているという小話を聞いたので

<<<>>>

生物学的な関心以外にも生物(人間も含めて)を扱う事象で問題となるのが、氏か育ちか というものがある。

言い換えるなら、遺伝か環境か、になるのだが、決まって落ち着く先は「人それぞれ」とか「環境次第」とか腑に落ちない結論・結言になる。まあごもっともという感じで私はそれに関して何も言う事はないし、興味もない。

一卵性双生児を使った実験とか本当のところでは「それは偶然かどうか?」という問題が付き纏う。理想論で言えば、同じ一卵性双生児を2セット用意し、環境をクロスチェックさせることであるが、そんなことは無理やろうし、じゃあどうするかというと、

数と環境を数多く用意するということになる(ランダムサンプリングと統計的解析に耐えうる母集団)

「~は○○割で決まる」というフレーズをどこかで聞いたことがある方も多いと思われるが、これはそのデータセットの扱い・作法を見ないことには何とも言えないというのが私の感想であるし、自分の暮らしの方が大事やし、そんな事は知らないし、興味もないというのが大半で、そこまで精査する人はその道のプロぐらいだろう。

じゃあ、何が言いたいのかというと、仮に何かしらの結果、ここでは形質発現Exとし、

遺伝的要因Gと環境的要因E とする。

Ex = G +E +Vco(G,E) + ε という二変数モデルを仮定

Vcoって何?これは共変数Covariant εはノイズというか排他要因

氏か育ちか論争のほとんどがVcoを無視した話で、ごった煮みたいな論争。

Vcoを平たく言うとデータの偏り

よくあるパターンでなにかしらの極端な例あるいは外れ値を議論の的にするのはVcoのことである。

それはさておき、生成AIアルゴとの関係性について

今まではGとEのみを考慮した行列計算が主だった。

Vcoを考慮するときに考えるべき問題として、

中身のGとEの組み合わせはどうなっているのか?

つまり、分布と確率モデル

G,Eは時間的経過に伴ってどう変化するのか?

つまり、異所的時空間モデル

これが最近の生成AIアルゴリズムに採用されたのだろうという推測。

<<<>>>

進化遺伝生物学的に二変数モデルを遺伝子環境共分散モデルとか言ってたような気もする。ナラタケの撮影でしこたまやぶ蚊に刺されまくっている時に数十年ぶりに想い出した。母系効果とか気にするとややこしかった記憶があるな