前回のお話
そんなわけで、脳PDCAを見直してみると、いろんな「脳バグ」があったので、それをまとめてみた。長くなったので、今回はPlanステージについてだけ。それでも6,000字超えたから、目次から興味のある所だけ読むといいよ。
Planステージの脳バグ
脳のPlanステージは注意→モデル構築(または過去のモデルの再利用)→計画:行動の優先順位リストの作成、というはたらきだ。この3ステップはそれぞれが脳バグを持っている。
注意プロセスの脳バグ
「注意」のバグとは、重要ではないものに注意が向いてしまうことといえる。Planステージの最初(あるいはQCストーリーにおけるテーマの選定)の段階で適切な注意(テーマ選択)ができなければ無意味なPDCAを回すことにすらなりかねない。この種のバグには以下のようなものがある。
新奇性の過大評価「スマホの通知が無視できない」
注意プロセスでは内的思考(興味関心)に基づいて注意対象を決めるのが基本だが、重要な外的刺激が加わるとそれを上書きする形で注意を奪うようになっている。これは、元々は外敵の接近を察知するために適応的に進化した「割り込み機能」だ。だが、ときに脳は取るに足らない外的刺激を
- 生存に直結する異常事態
- 巨大な損失(=報酬の喪失)
と誤認することがある。外敵には素早く反応しなければならないため「割り込み」は「何だか危なそう」という雑な判断により行われる。その結果、私たちは茂みがガサガサいう音にもスマホの着信音にも同じように注意を向けてしまうのだ。
また、この「割り込み」の判断で、対象が「新奇なもの」なのかどうかは既存のモデルを参照して決定される。つまり、脳は「予想通り」に起きる事象は新奇性がないと判断して注目を向けない一方で、次の2つの場合に対象に新奇性を見出す。
- 既存モデルがない(未知のもの)。
- 予測可能性が低い既存モデルがある。
私たちが正体不明の異音に恐怖や好奇心を抱くのは前者によるもので、これは自然なことだ。問題は後者で、脳は危険に対応するために、予測可能性が低い既存モデルを使う場合には「最悪」を想定する(報酬を受け取り損なうことも「危険」の一つということに注意)ことになる。その結果起きるのが以下のような困った状況だ。
- 重要な着信か、広告なのか分からないのにスマホの通知を見ずにはいられない。
- パレート分析により重点的課題が分かっているのに、取り組む問題・課題が「AI」「DX」といった目新しい方向性に流れる。
以上のほか、通常と新奇との閾値に異常を来して様々な外からの刺激に過剰反応してしまうパターンのバグもある。
視野狭窄「貧乏暇なし」
強い不安やストレスを抱えると、脳はその原因だけに注意を固定する。これは、生存の危機において外敵などの原因に注意を向け続け、逃走や抵抗を継続するために発達した「他の注意対象のシャットアウト機能」だ。だが、複雑な問題を処理する場合にはこの作用は以下のような「視野狭窄(トンネルビジョン)」となって現れる。
これらは、視野狭窄によってより良い計画を立案するのに必要な情報が遮断されることによって起きている。
DMN過活動「昨日言ってしまった一言を引きずる」
人間は実際の経験によらなくても、外界を既存のモデルで繰り返しシミュレーションすることでモデルそのものを更新し、その精度を上げることができる。これが思索の正体で、思索を可能にする「空の」脳PDCAを「Default Mode Network: DMN」と呼んでいる。ある程度集中して思索をするために、DMNは外からの刺激に反応しにくい性質を持っている。そこに脳バグが潜んでいる。
深い思索の最中に外からの刺激を「邪魔」と思うことは誰にも経験があるだろう。注意に振り向けることができる脳の資源は有限なのだから、思索の深さと外界への注意はトレードオフとなる。これは脳バグというよりもどうしようもない摂理なのだが、脳は「必ずしも必要のない思索」にとらわれがちだ。脳の「目的」は外界のモデルを改善してRPE(報酬予測誤差)を0に近付けていくこと*1なので、脳は負のRPEを引き上げることに非常にこだわる。その結果、過去の負のRPEを引き上げようとして思索を行う場合があるのだ。この思索は「未来の予測精度を上げる」ためではなく、「過去の評価を塗り替えようとする」方向に向かうものといえる。だが、過去の観測結果は変えることができないし、負のRPEの原因となった予測モデルは未熟なことが多いわけだから、いくら思索をしても一度負に評価されたRPEが変わることはない。このように過去の失敗への固執(反芻思考)が外界からの反応を鈍らせることは「脳バグの極致」とすらいえるかもしれない。
DMN過活動による困りごとは、例えば以下のように現れる。
- カメラマンがより良い構図を得ようと思索するうち、足を踏み外してケガをする(これは思索と注意のトレードオフによるもの、脳バグというより摂理)。
- 昨日友人に言ってしまったひどい一言が気になって集中できず、仕事でミスをする。
- 問題の原因分析に組織のリソースを集中させてしまい、新たに起きた問題への対処が遅れる。
モデル構築プロセスの脳バグ
モデル構築に失敗があれば、当然、正しく結果予測ができない。一方、脳は正のRPEが得られるような「偽の」モデルを構築する場合もある。
モデルの固定化(過学習)「テレビを叩いて壊す」
環境に変化が少なく、新奇性がないと既存のモデルを更新しなくても常に0に近いRPEが得られる。すると、脳はモデルの更新を止めてしまう。これは脳が元々目指していた快適な状態だ。そのため、安定していた環境が変化したときにモデル更新への抵抗が起き、変化にうまく適応できなくなることがある。
また、「これでうまくいった」という記憶(成功体験)が強すぎるとその時点でモデルが固定化し、小さな新奇性はモデル更新を引き起こさなくなって環境に変化があっても非適応的なモデルが維持されることがある。
つまり、以下のような状況だ。
- 社会状況が変化しているのに老舗が商売の仕方を変えられず、衰退していく。
- 新しいソリューションがもたらされたのに、既存のやり方を変えることができない。
- 調子の悪い機械を蹴ったら動作したからといって、次に故障したときに何度も蹴りつけて本格的に壊す。
これらはいずれも、限定的なデータセットにモデルを最適化しすぎた結果、モデルが局所最適に閉じ込められて未知に対応できなくなった状態と理解できる。AIの過学習と同じだ。
モデル構築の放棄と安易なモデルへの逃避「悪いのはあいつのせいだ」
対象の不確実性が高すぎたり、理解が難しいほど複雑だったりすると、モデル構築は難しくなる。例えば、
- 成功条件が不明だったり、後出しされたりする場合。
- 評価軸が非常に多数だったり、曖昧だったりする場合。
などがそれだ。脳はモデル化が困難だと判断するとその構築を放棄する。脳は予測可能性が高い状況を好むので、モデル構築が放棄された対象に対しては回避を志向した計画を立案するようになる。理解が困難な対象は「脅威度が未知の敵」と認識され、恐怖や嫌悪を感じるからだ。例えば以下のようにだ。
- 複数人での会話中、自分には難しい話題が始まると不快になり、その輪から抜けたくなる。
- 解析が難しい要因から目を背け、改善の対象から外す。
このように恐怖や嫌悪を感じるのは非常に不快な状況だ。そこで、脳は検証不可能でシンプルな偽のモデルをでっち上げ、この安易なモデルに飛び付くことで平穏を得ようとすることがある。
- ××の問題を解決するには○○国を排除すればよい(実際には国際問題には複雑な要因があるのに1つの国に問題があると単純化、国を排除するということは個人には検証不可能)。※これは特定の立場を支持する意図はなく、モデル化の失敗例としての一般論だ。
- △△を◇◇から守るには※※の陰謀を防がなければならない(陰謀論により因果関係を単純化、ありもしない陰謀を防止したらどうなるかは検証が不可能)。
- 繰り返される●●の問題を解決するには担当者を変更する必要がある(問題のモデル化ができず担当者が悪いと単純化、担当者が変わっても問題が継続すれば「変更後の担当者も悪い」となり永遠にモデルの検証ができない)。
これらの共通点は、単純で分かりやすく、非科学的で、検証ができないことだ。検証不可能なモデルを用いれば、自分の行動だけが観測対象になるので、簡単に安心感や達成感(ドーパミンをともなう主観的報酬)を得ることができる。上記の例でいえば、○○国の批判をしたり、※※の陰謀論を広めたり、担当者を吊し上げたりすれば、改善のための行動を「計画通り」実行できた、となりRPEを0や正にすることができる。
計画プロセスの脳バグ
計画は、構築されたモデルに可能な入力(行動)から出力(結果=目標)をシミュレーションし、目標の価値が高い順に行動をリスト化したものだ。行動を列挙する際と、目標価値の評価の際それぞれに脳バグが入り込む余地がある。
習慣化:行動列挙の脳バグ「いつもので」
これまでに経験したり繰り返されたりした行動は生成されやすく、未経験の行動は生成されにくい。未経験の行動が生成されても成功確率が不明なため目標の価値は低く見積もられるから、そのような行動は最初から生成されにくくなっているのだ。したがって、意識的に行わない限り探索的な行動をすることは難しい。
対象自体の回避・排除:目標価値評価の脳バグ①「親がどなっても子供のサボりはなくならない」
シミュレーションによりどのような行動に対しても結果(目標)の価値が低く見積もられる場合、その中での最良の行動よりも、モデルの外側から対象自体を回避したり、排除(攻撃)したりする行動の価値が高くなることがある。目標の価値は期待される利益と成功確率の掛け算で計算されることを勘案すると、次のような場合に価値は低く評価される。
- 失敗が叱責・恥・罰に直結する場合(失敗の確率が低くても、失敗時の負の利益が巨大)。
- 評価が人格ベースで行われる(人格はすぐには変えられず、また恣意的に評価されやすいので失敗確率が高いと評価される)。
- 不確実性・予測不能性が高い(成功時の利益より、失敗時の負の利益に重きを置いた「安全側」の評価となる)。
これらの状況は不安(セロトニン不足)を呼び、負の利益を過大に評価させ、回避的・攻撃的行動の価値を相対的に高める。
不適切な評価重み変数:目標価値評価の脳バグ②
様々な目標の価値は「自分にとっての利益」という1つの軸で比較評価される。だが、同じ目標でも「文脈」によってどの程度自分への利益になるかが変わってくる。例えば、喉が渇いたときには、喉を潤すという目標は極めて利益が高いと評価されるだろう。脳はある目標を様々な観点で重みづけして計算し、「自分への利益」という1つの評価値をはじき出す。その過程では文脈に合わせた重み変数の絶え間ない更新が行われているのだ。このとき、重み変数の中に過大・過少だったり硬直化したりしているものがあると、価値計算の結果が歪んでしまうことがある。
過大な重み変数(バイアス):依存と短期的利益の追求
特定の報酬に対する重みが異常に大きくなると、社会的なコストやリスクによる負の重みづけを振り切って、不適切な行動の価値が高まることがある。
- 依存:強烈なドーパミン刺激により不適切行動の利益が過大に評価された状態。
- 目先の利益の優先:行動から結果(利益)までの時間が短いことが、利益を過大に評価させる。
重み変数の硬直化:停滞と強迫
繰り返しの刷り込みなどで一部の重み変数の更新が難しくなると、行動から柔軟性が失われることがある。
- イノベーションの停滞:社会・宗教的規範や常識の重みが強すぎるとイノベーティブな行動が抑制される。
- 強迫的行動:「手を洗わないと不潔だ」という負の予測に対する重みが、実際のリスクに関わらず固定されて手洗いが最優先の行動となる。
負に過大な重み変数(ネガティブ・バイアス):抑うつ
損失やリスクに対する重みが異常に大きくなり、計画が成り立たなくなる。そうなれば、脳PDCAも正常に回らなくなる。
- 抑うつ:失敗する可能性や他者からの批判という「コスト」の重みが極端に増大し、あらゆる目標の価値が小さくなって行動の優先順位が立てられず、外から見ると意欲が減退したように見える。
まとめのようなもの
Planステージに潜む脳バグを洗い出してみたら、随分な量になった。ヤバくね?
注意事項(責任逃れ)
私は脳科学・神経科学の専門家どころか、体系的な勉強もしたことがありません。デタラメを書こうとはしていませんが、エビデンスや基礎理解の不足は否定できません。
また、脳は複数の領域がネットワークとして協調して機能を実現しているという立場から、脳の部位について、極力言及しないようにしています。