ChatGPT4が進化! プラグインで計算能力をどれほど上げたのか検証!

将棋神ラー
将棋神ラー

先日、AI知力オリンピックの絶対王者ChatGPT4にプラグインが導入されたようじゃ。そこで、計算能力がどこまで上がったのか検証してみよう。

読者
読者

それは面白い!

ということで、今回は、ChatGPT4のプラグイン(Wolfram)を入れてAI知力オリンピックの計算テストを解かせてみます。

プラグインによって、どのぐらい点数が変わるのか見ていきましょう。

このページは、以下の構成で書いていきます。


出題する計算問題&過去のAI達の結果

将棋神ラー
将棋神ラー

出題する計算問題と過去のAI達の結果を再掲するぞい。

①次の計算をしなさい。853×7489=
②次の計算をしなさい。1+1+1+6+1+1+1+1+1+2+1+1+1+1+3+1+1+1=
③次の計算の商と余りを求めなさい。また、分数でも答えを記載しなさい。(28×86)÷118=
④次の計算をしなさい。(0.564+0.77)×6.1-2.8=
⑤次の計算をしなさい。2×(44/121÷11/100)=
⑥次の式が成り立つとき、aの値を求めなさい。5(a+8)/2=15
⑦次の式が成り立つとき、x,yの値を求めなさい。12x-27y=183,-5x+8y=-60
⑧次の式が成り立つとき、zの値を求めなさい。3z^2-2z-4=z
⑨次のxについての不等式を解きなさい。x^2-(a+2)x+2a<0
⑩cosθ=2/3のとき、sinθとtanθの値を求めなさい。
⑪3276を素因数分解しなさい。
⑫次の2次方程式を解きなさい。x^2-2x+9+2√15=0
⑬次の2次式を因数分解しなさい。2x^2-5xy+2y^2+x+y-1
⑭次の連立方程式を解きなさい。x+y=3,x+y+xy=-7
⑮x^9+1をx^2-1で割った余りを求めなさい。
⑯次の方程式を解きなさい。4x^3+3x-2=0
⑰0≦x<2πのとき、次の方程式を解きなさい。cos2x=cosx
⑱a=log23(底は2),b=log35(底は3)とするとき、log2080(底は20)をa,bで表しなさい。
⑲次の値を求めなさい。Σ(上がn,下がk=1)(3k-1)^2
⑳次の極限を求めなさい。lim(n→∞)(√(n+5)-√(n+3))/(√(n+1)-√n)
㉑次の関数を微分しなさい。y=x/(x^2-x+1)
㉒次の関数を微分しなさい。y=√(1+(sinx)^2)
㉓次の関数を微分しなさい。y=(tanx)^sinx (0<x<π/2)
㉔次の不定積分を求めなさい。∫(5^x-e^x)dx
㉕次の不定積分を求めなさい。∫xlog(x^2-2)dx
㉖次の定積分を求めなさい。∫(上が2、下が1)x^4・logxdx
㉗3,4,6,6という4つの数字を1回ずつ使って10を作りなさい。
㉘1という数字を4つ使って24を作ってください。
㉙18÷3(1+2)を計算しなさい。
㉚次の方程式を解きなさい。3x+4y+z=10,2x+4y-z=16

この問題の解答や過去のAIがどのように問題に取り組んだかを見たい方は、下記のリンクから前回の計算バトルの記事をご覧ください。

過去の計算テストの結果は以下でした。

ランキングAIモデル得点得点率
1ChatGPT-414/3046.67%
2ChatGPT-3.57.5/3025.00%
3BingAI5.5/3018.33%
4Google Bard4.5/3015.00%
読者
読者

14問以上正解できるかな?


プラグイン入りChatGPT4の回答&答え合わせ

将棋神ラー
将棋神ラー

さぁ、GPT4!
プラグインの力を解き放つのじゃ!

プラグイン入りChatGPT4の回答は以下でした。
※途中式は、省略しました。また、途中式で部分点を上げた問題もあるため、答えが違うのに△になっている場合があります。適宜、回答形式の誘導をしています。

①6,388,117
②26
③20余り48、1204/59
④5.3374
⑤800/121
⑥a の値は -2
⑦x の値は 4、y の値は -5
⑧(1/6)(3-√57)、(1/6)(3+√57)
⑨(a < x < 2) および (a < 2)、(2 < x < a) および (a > 2)
⑩sinθ=√5/3、tanθ=√5/2
⑪2^2・3^2・7・13
×⑫x=1-i√2(4+√15)、1+i√2(4+√15)
⑬(x-2y+1)(2x-y-1)
⑭1.x=-2、y=5 2.x=5、y=-2
⑮1+x
⑯x=1/2、-(1/4)i(√15-i)、(1/4)i(√15+i)
⑰x=0、2π/3、4π/3
×⑱すみませんが、log2080(底は20)をa=log23(底は2),b=log35(底は3)で表すことはできません。これらの値は互いに独立しており、一方を他方で表現することはできません。
⑲(1/2)n(6n^2+3n-1)
⑳2
㉑(1-x^2)/(x^2-x+1)^2
㉒sinxcosx/√(1+sinx^2)
㉓(cosxlog(tanx)+1/cosx)(tanx)^sinx
㉔5^x/log5-e^x+C
㉕(1/2)((x^2-2)log(x^2-2)-x^2)+C
㉖-31/25+32log(2)/5
×㉗6−6+4+3=10
×㉘1!×1!×1!×1!=24
㉙18
x=2+8ny=2−5nz=−4−4n

結果は。。。

24.5/30問!!!

読者
読者

うっわ!凄!

将棋神ルー
将棋神ルー

進化早いな。前回測定してから1ヶ月も立ってないぞ(笑)

将棋神ラー
将棋神ラー

よくやった。GPT4!
これで、お主が不動の絶対王者であることが改めて示された。
じゃが、本当は満点取って欲しかったぞい。。。


まとめ

将棋神リー
将棋神リー

GPT4はプラグインで凄い進化したね!
結果をまとめたよ!

ランキングAIモデル得点得点率
1ChatGPT-4 (Wolfram)24.5/3081.67%
2ChatGPT-414/3046.67%
3ChatGPT-3.57.5/3025.00%
4BingAI5.5/3018.33%
5Google Bard4.5/3015.00%

現在最強AIであるChatGPT4がWolframプラグインを使うと、得点率が8割を超え、圧倒的な結果を残しました。

今まで大きな弱点の1つであった計算能力も備えたChatGPT4は、まさに鬼に金棒で無敵と言えます。

そしてこれは、かなりの大きな進歩で、計算能力なら理系偏差値でも60はあると思います。
私の現役時代とほぼ同じレベルの数学力ですね(笑)

また、㉚に関しては恥ずかしながら解が存在していることに気づきませんでした。
なので、ChatGPT4さんに一本取られてしまった形になってしまいました(笑)

とはいえ、満点にはあと一歩届かなかったので、ChatGPT4はもう一段レベルアップする必要があるといえますね!

このように、どんどんAIが進化しているのを見るのはとても楽しいです!
これからの進化が本当に楽しみです!

将棋神ルー
将棋神ルー

ここまでくると、あと一歩で計算もシンギュラリティきそうだな。
となると、あとは数学だけだな。

将棋神ラー
将棋神ラー

そうじゃな。
また、素晴らしいプラグインが出たら試してみよう。

コメント

  1. papu より:

    記事に関して、企画、文章、結論全てにおいて非常に面白かったです!
    今回はGPT4プラグイン(Wolfram)で計算力を検証されておりましたが、是非とも数学での検証記事も見てみたいです!

    • shogishinrar より:

      返信遅くなってしまってすみません。
      とても励みになるコメントありがとうございます!
      Wolframプラグインを使うことで、計算能力は向上したのですが、数学能力は上がっていないようだったので記事にはしていませんでした。
      GPT-5など、さらに高度なモデルが発表されたらまた検証したいと思うので、楽しみに待っててください!
      これからもよろしくお願いします。

タイトルとURLをコピーしました