この一年は、AIのことを考えない日も、AIを使用しない日も無かった印象です。
昨年末の2022年11月30日にOpenAIからChatGPT-3.5がリリースされ、IT企業を経営している身として
最初は希望という感情より、絶望という感情の方が近かったと思います。

「ゲームチェンジが来た。」

そこそこ生きてきていますので、ビジネス面でのゲームチェンジは色々見てきた気がします。
私が生まれた後での社会的に顕著なゲームチェンジを思い返すと

バブルの崩壊
携帯電話の普及
インターネットの普及
スマートフォンの普及
グローバル化
SNSの登場
Eコマースの拡大

こんな感じでしょうか？
バブルの崩壊は、まだ社会に出ていなかったので個人的に実感はありません。

グローバル化は、1995年に設立されたWTO（世界貿易機関）の影響による貿易の自由化や、外資系投資銀行の影響力の増加など、産業や農業などの経済面での変化と、マイクロソフト、グーグル、アップル、アマゾンなどのIT系の変化との広い分野でのゲームチェンジが含まれますが、全体を通しての社会的な顕著なゲームチェンジというと、ほぼITの進化によるものとわたしは感じています。

しかしこれは、わたしがITに携わる人間なので、バイアスがかったポジショントークの可能性はあります。
もしわたしが思いついた以外にビジネス面での顕著なゲームチェンジがあったら勉強になりますのでコメントください。

そんな中、新たなゲームチェンジがAIの進化です。
ITに携わらない人であれば、ChatGPT-3.5を触った時に、これ使える、これ使えないというような、その時点での判断をする人が多いと思いますし、それが当然だと思います。

しかし、ITに携わる人であれば、ChatGPT-3.5を触った時点で、その先に見える進化に震えを感じたと思います。もちろんそれは希望でもあり、絶望でもあり、何とも表現できない感情を経験されたのではないでしょうか？

少し話を進めます。

AIの進化による、民主化の加速。
わたしたちは、民主主義の国に生まれ育っています。

民主主義の代名詞といえば「平等」だと思います。
個人的には、平等より公平の方が大切だと思っていますが、人類に複雑な問題解決が出来るようになるまでは、正しい公平判断は不可能に近いので、平等で行くしか致し方ないと思っています。

AIの進化により、教育や芸術、そして技術。
これらのものが平等化されていきます。

今までの世界は、
お金を持っている人がより良い教育を受けられ
才能を持っている人が芸術を創造し
努力をした人が技術を習得する。

これらの当たり前だった常識に変化が現れると思っています。
これをわたしは民主化の加速と呼んでいます。

いつでも誰でもAIを通じて
良い教育を受けられ
音楽や画像や映像などの芸術を創造し
データ化された技術により、技術習得というステップをジャンプして結果につなげる。

前回のビートルズのお話での ”AIの登場による芸術のフラット化” とは
この思想からの言葉となります。

差別化することにより価値を見出してきた資本主義と
平等を謳う民主主義の相性の悪さがあからさまに見えてくるのではないでしょうか？

この結果が、良いことになるか、悪いことになるかは後の社会が判断すると思いますが
AIによって、さまざまな分野のフラット化が進むのは、現状の技術から簡単に予測できます。

ではなぜ、現状でもAIの技術が存在するのに、2024年から民主化が加速するのか？
現状で人類がうまくAIを活用しきれていないという部分もありますが
答えは簡単で、AIも進化するからということになります。

前置きが少し長くなりましたが、ここからが本題になります。
少し難しい話も出てきますが、結構重要なお話になるかと思います。

2022年の11月30日にChatGPT-3.5がリリースされました。
2023年の3月15日にChatGPT-4.0がリリースされました。

もうお分かりですよね？
そうです。
当然2024年も新しいバージョンがリリースされると考えられます。

そうなると、当然気になるのは、何の機能か追加されるか？ということだと思います。
細かいアップデートは色々あると思いますが、目玉となるのは断然
Q*（Q-Star）だと思います。

Qと聞いて、Qアノンを連想する陰謀論好きの人もいると思いますがそれじゃないです（笑）「Qは計算が得意」という情報が流れているので、Q*の「Q」は「Q学習」のQである可能性が最も高い。

Q学習とは、AI（人工知能）や機械学習の分野における重要なアプローチである強化学習の中のひとつであり、「強化学習」とはエージェントが環境との相互作用を通じて、目標達成に向けて最適な行動を学習する方法になります。

ちょっと分かりずらいですよね。
簡単にいうと強化学習はシュミレーションが得意です。
つまり、一番得する方法教えるYO!
といった感じです。
みんな大好き、待ちに待った機能が追加されるわけです。
でも、勘違いしちゃダメですよ。
あなただけが、一番得する方法を知れる訳じゃないんです。
民主化の加速ですから、みんなが一番良い方法を知れるってことです。

では、もう少し強化学習を深掘りします。
強化学習には３つのアプローチの方法があります。
それが
・Q学習
・SARSA（State-Action-Reward-State-Action）
・モンテカルロ法
になります。
厳密にはもうひとつ動的計画法というのがあるのですが、あまり使われないので省きました。

だいぶ難しくなってきましたね。
強化学習を理解するには、まず基本的な概念を理解する必要があります。
基本的な概念とは以下になります。

エージェント：学習するシステム（例：ロボット、ソフトウェアプログラム）。
環境：エージェントが操作する世界やコンテキスト。
報酬：エージェントが目標に近づいた際に受け取る正の報酬または負の報酬。
方策：ある状況で、どのような行動をとるかを決定するエージェントの戦略。

これを理解したら３つのアプローチの違いです。

Q学習（Q-Learning）とは
タイプ: オフポリシー（Off-policy）
特徴:
・行動価値関数（Q関数）を更新するために、最適な行動を選ぶ。
・現在の方策（policy）とは別に、最適な方策を学習する。
・環境のモデルを必要としない。

SARSA（State-Action-Reward-State-Action）とは
タイプ: オンポリシー（On-policy）
特徴:
・現在の方策に基づいて次の行動を選ぶ。
・学習中に使用される方策と同じ方策を用いて、行動価値関数を更新する。
・環境のモデルを必要としない。

モンテカルロ法とは
タイプ: オンポリシー（On-policy）
特徴:
・エピソード全体を完了させた後に、報酬を用いて価値を更新する。
・一連の経験（エピソード）を通じて、報酬の実際の結果に基づいて学習する。
・一つのエピソードの完了が必要で、途中の状態での学習ができない。
・更新は、訪れた状態と行動のペアの平均報酬に基づく。

こんな感じです。
では、オンポリシーとオフポリシーとはなんぞや？という点です。
オンポリシーとは、エージェントは現在の方策に従って行動を選択し、その経験を利用して同じ方策を改善します。
オフポリシーとは、エージェントはある方策に従って行動を選択する一方で、別の方策を学習および改善します。

そうなると、Q学習はオフポリシーになりますので、異なる方策を同時に探索する柔軟性があるわけです。
つまり、３つ前のレポートでお話ししたダボス会議で、今後必要とされるスキル1位の「複雑な問題解決」という人類にはまず無理であろうスキルを獲得するステップに一歩近づくことになります。

ちなみにQ学習の「Q」は、何かの略ではありません。
Qは行動価値関数を表しており、数学で未知数や変数を表す「x」と同じです。

また、Amazon Qの「Q」はQuick sightのQです。
Amazon QはAWSをゴリゴリに利用してるところならメリットはあるかもしれませんが、AWS同様に従量制なのと、Microsoft Copilotの対抗馬という感じなので、メジャーにはならない印象です。

そして12月7日、GoogleからGeminiがリリースされました。
GoogleのAIといえばBardなのですが、Bardは裏で動いているAIモデルが変わっていて
最初がLaMDA、次にPaLM、PaLM2と置き換わって、今回Geminiに変わりました。

Googleの底力を感じましたね。
まだ全ての機能は使えず、Gemini Proの部分的な機能ですが、使ってみたところ言語の部分では、ChatGPT-4.0よりちょこっと優秀な印象です。

近日中にGemini Ultraが使える予定のようなので、これには期待大です。
強化学習のAlphaGOが統合されたりするんですかね？
そしたら無敵のAIの完成かもしれません。

Geminiには軽量版のGemini nanoもあり、これがGoogle Pixelに搭載されるようです。
そうなると圧倒的に不利になるのはAppleです。
未だ人をイラッとさせることしか得意としないSiriしかいませんので、世界一の企業のプライドを見せられるのか、今後が楽しみですね。

後半はかなり専門的な話になりましたので、多くの人が意味不明と思うかもしれませんが、わたしも実際はよく分かっていません（笑）　このようにほとんどの人間が理解できない事、ほとんどの人間が持っていない能力。これがAIに搭載されるとなると、それはもうAGIと呼んでもいいと思います。AGIは2025年かと思っていましたが、2024年にAGIに進化する可能性が高くなってきました。

先日のOpenAIのサム・アルトマン氏の退任劇は、現状のChatGPT-4.0の話ではなく、GPT-5.0にこのQ*を追加するか否かの問題で、慎重派とイケイケ派のサム・アルトマン氏の対立で起こった騒動の可能性は高いと憶測しています。

サム・アルトマン氏が勝った今、GPT-5.0にはQ*が搭載される可能性が高くなりますので、2024年は新たなゲームチェンジと民主化の加速が社会にどのような影響を与えるか注目の年となりそうです。

それではみなさま、佳いお年をお迎えください。
来年もよろしくお願いいたします。

Just be hopeful

[1994-2002]
ITベンチャーの幹部として、8年間で数名の企業を500名以上の企業に成長させることに貢献。95年より独学でwebデザインを学ぶ。

[2002-2023]
米国法人のwebデザイン会社のCEOを務め数々の賞を受賞。

[2023〜]
AI事業開始に伴い、つくば市を拠点として株式会社RESONIXを起業。

2026/04/12

ホームページ制作

社外CTOサービス

グラフィックデザイン

ロゴマークデザイン

動画編集・撮影

コンプライアンス・倫理基準

リスクマネジメント

企業理念

代表者メッセージ

会社概要

プライバシー・ポリシー

ホームページ制作

社外CTOサービス

グラフィックデザイン

ロゴマークデザイン

動画編集・撮影

コンプライアンス・倫理基準

リスクマネジメント

企業理念

代表者メッセージ

会社概要

プライバシー・ポリシー

【NO.118】OpenAIのQ*とGoogleのGeminiによって2024年は加速する民主化とゲームチェンジ

【NO.146】AGIが来た日、私たちは静かに準備していた

【NO.145】バイバイ、チャッピー

【NO.144】英語の壁、AIでぶっ壊せる。 「わかりやすい日本語にして」のひと言が最強だった件

【NO.143】たぶん、OpenAIの噂のデバイスはこれ。「画面のないAI」が目指す未来

【NO.142】国産AIが必要だと思う、たった一つの理由

【NO.141】「人手不足」の正体は少子高齢化ではなく「IT化不足」

【NO.140】音楽の業界で起こるイノベーションは、その後に他の業界でも起こる

【NO.139】AIで社会は開かれるのに、なぜ政治は保守化するのか？

【NO.138】陰謀論・スピリチュアル・マルチ商法の危険な共通点とは

【NO.137】AIリストラは対岸の火事？　AI時代に価値の上がる人、下がる人。

【NO.136】「誰でもわかるプルラリティ」多様性ではなく、多元性

【NO.135】「AI 2027」科学的根拠を持つ仮説シナリオ　まとめ

【NO.134】「2025年版」社会人が押さえておくべきAIリテラシートップ10

【NO.133】「AI＆ロボット時代」10年後に選択幅を持つために、ここ5年は人間は本気になった方が良いかもしれない。