AIと対決!「人間」vs「ChatGPT4」:計算バトル誰が勝つ?

将棋神ラー
将棋神ラー

今回は、AIに計算問題を解かせてみよう。

人間とどっちができるかのぅ。

読者
読者

ChatGPTは、計算苦手って聞くから勝ちたいな!

ということで、今回は2023年4月現在の最新AIであるChatGPT4さんに、計算問題を出題してみました。問題もバリエーションに富んだものにしてあるので、かなり楽しめる内容になっていると思います。

貴方とどちらが計算力があるのか、ぜひ対決してみてください!
また、現在最新のAIがどこまで解けるのかにも注目です!

このページは、以下の構成で書いていきます。


出題する計算問題

将棋神ラー
将棋神ラー

出題する計算問題は以下にしよう。まず、人間代表として挑戦してみてくれ。
AIの能力を測るために、かなり難しい問題も出題しておるから、解けない問題が合っても落ち込まないで良いぞい。

①次の計算をしなさい。853×7489=
②次の計算をしなさい。1+1+1+6+1+1+1+1+1+2+1+1+1+1+3+1+1+1=
③次の計算の商と余りを求めなさい。また、分数でも答えを記載しなさい。(28×86)÷118=
④次の計算をしなさい。(0.564+0.77)×6.1-2.8=
⑤次の計算をしなさい。2×(44/121÷11/100)=
⑥次の式が成り立つとき、aの値を求めなさい。5(a+8)/2=15
⑦次の式が成り立つとき、x,yの値を求めなさい。12x-27y=183,-5x+8y=-60
⑧次の式が成り立つとき、zの値を求めなさい。3z^2-2z-4=z
⑨次のxについての不等式を解きなさい。x^2-(a+2)x+2a<0
⑩cosθ=2/3のとき、sinθとtanθの値を求めなさい。
⑪3276を素因数分解しなさい。
⑫次の2次方程式を解きなさい。x^2-2x+9+2√15=0
⑬次の2次式を因数分解しなさい。2x^2-5xy+2y^2+x+y-1
⑭次の連立方程式を解きなさい。x+y=3,x+y+xy=-7
⑮x^9+1をx^2-1で割った余りを求めなさい。
⑯次の方程式を解きなさい。4x^3+3x-2=0
⑰0≦x<2πのとき、次の方程式を解きなさい。cos2x=cosx
⑱a=log23(底は2),b=log35(底は3)とするとき、log2080(底は20)をa,bで表しなさい。
⑲次の値を求めなさい。Σ(上がn,下がk=1)(3k-1)^2
⑳次の極限を求めなさい。lim(n→∞)(√(n+5)-√(n+3))/(√(n+1)-√n)
㉑次の関数を微分しなさい。y=x/(x^2-x+1)
㉒次の関数を微分しなさい。y=√(1+(sinx)^2)
㉓次の関数を微分しなさい。y=(tanx)^sinx (0<x<π/2)
㉔次の不定積分を求めなさい。∫(5^x-e^x)dx
㉕次の不定積分を求めなさい。∫xlog(x^2-2)dx
㉖次の定積分を求めなさい。∫(上が2、下が1)x^4・logxdx
㉗3,4,6,6という4つの数字を1回ずつ使って10を作りなさい。
㉘1という数字を4つ使って24を作ってください。
㉙18÷3(1+2)を計算しなさい。
㉚次の方程式を解きなさい。3x+4y+z=10,2x+4y-z=16

読者
読者

微分積分まであるのか、、、


問題の解答&他のAI達の結果

将棋神ラー
将棋神ラー

どうじゃったかのぅ。
一応今回は高校範囲までの問題にしたが、受験生以外だともう難しい問題が多かったじゃろう。

将棋神リー
将棋神リー

解答は以下だよ!挑戦した方は、答え合わせしてみてね!

①6388117(自作問題)
②26(自作問題)
③商:20,余り:48,分数表記:1204/59(自作問題)
④5.3374(自作問題)
⑤800/121(自作問題)
⑥a=-2(自作問題)
⑦x=4,y=-5(自作問題)
⑧(3±√57)/6(自作問題)

a<2のときa<x<2,a=2のとき解はない,a>2のとき2<x<a
(4STEP数Ⅰ、大問214から出題)

sinθ=√5/3、tanθ=√5/2
(4STEP数Ⅰ、大問240から出題)

2^2・3^2・7・13
(4STEP数A、大問219から出題)

x=1±(√5+√3)i
(4STEP数Ⅱ、大問89から出題)
⑬(x-2y+1)(2x-y-1)
(4STEP数Ⅱ、大問117から出題)
⑭(x,y)=(-2,5),(5,-2)
(4STEP数Ⅱ、大問118から出題)
⑮x+1
(4STEP数Ⅱ、大問131から出題)
⑯1/2,(-1±√15i)/4
(4STEP数Ⅱ、大問138から出題)
⑰0,2/3π,4/3π
(4STEP数Ⅱ、大問299から出題)
⑱(4+ab)/(2+ab)
(4STEP数Ⅱ、大問357から出題)
⑲1/2n(6n^2+3n-1)
(4STEP数B、大問202から出題)
⑳2
(4STEP数Ⅲ、大問182から出題)
㉑y´=(-x^2+1)/(x^2-x+1)^2
(4STEP数Ⅲ、大問267から出題)
㉒y´=sin2x/2√(1+(sinx)^2)
(4STEP数Ⅲ、大問281から出題)
㉓y´=(tanx)^sinx{(cosx)log(tanx)+1/cosx}
(4STEP数Ⅲ、例題24から出題)
㉔5^x/log5-e^x+C
(4STEP数Ⅲ、大問372から出題)
㉕1/2・(x^2-2)log(x^2-2)-1/2・x^2+C
(4STEP数Ⅲ、大問380から出題)
㉖32/5・log2-31/25
(4STEP数Ⅲ、大問414から出題)
㉗{(4*6)+6}/3
㉘(1+1+1+1)!(中国の大学入試)
㉙「定義不足で求められない」が正解。18や2は△。
(元の問題は6÷2(1+2)だが、記憶されている可能性があるので数字を変えた。)
x=2+8ny=2−5nz=−4−4n(自作問題)

将棋神ルー
将棋神ルー

㉘の階乗は、マジで天才の発想だな!(笑)

ちなみに私は数学が一番の得意科目だったので、受験直前期なら8割はおそらく解けたと思います。

ただ、今は大分忘れてしまっているのでもう半分も怪しいぐらいです、、、皆さんはどうでしたか?

9割以上正解した!という方は、私の受験生時代よりも数学力があると思います(笑)

では、さっそくChatGPT4さんに解いて貰いたいところなんですが、その前に参考結果としてChatGPT3.5さんとBingAIさんにも解かせてみましょう!

結果は。。。

ChatGPT3.5:7.5/30問
BingAI:5.5/30問

でした!!!

※点数が小数点になっているのは、惜しかった問題を0.5点換算としたためです。AI達の回答と採点は3ページ目に参考資料として載せておくので興味がある方は見てみてください。

将棋神ルー
将棋神ルー

いやいや、点数低すぎだろ(笑)


ChatGPT4の回答&答え合わせ

読者
読者

ChatGPT4は、何点取れるかな?
10点はいって欲しいな、、、

最新AIであるChatGPT4の回答は以下でした。
※途中式が長いためここには答えのみを記載しました。省略した途中式は次ページに載せました。また、途中式で部分点を上げた問題もあるため、答えが違うのに△になっている場合があります。㉘は一度「四則演算じゃなくても良い」という誘導をしています(3.5とBingはそれでも全く解けなかった。)。

×①6390937
×②1 + 1 + 1 + 6 + 1 + 1 + 1 + 1 + 1 + 2 + 1 + 1 + 1 + 1 + 3 + 1 + 1 + 1 = 24
③「商:20、余り:48」、「20 24/59」
④5.3374
⑤800/121
⑥a の値は -2
⑦x = 4、y = -5
⑧z の値は (3 + √57) / 6 および (3 – √57) / 6
⑨a < x < 2 または 2 < x < a のいずれかで成立する
⑩sinθ = √5/3 および tanθ = √5/2
⑪3276 = 2^2 × 3^3 × 7 × 13
×⑫x = 1 ± √(8 + 2√15) i
×⑬因数分解することはできません
×⑭この連立方程式には解がありません
×⑮x^9 + 1 を x^2 – 1 で割った余りは 2
×⑯残念ながら、代数的な解法でこの方程式の解を見つけることは困難
⑰x = 0, 2π/3, 4π/3, 2π
×⑱log₂₀(80) = 5 / (2a)
×⑲Σ(k=1からnまで)(3k – 1)^2 = 3n(n + 1)(2n – 3) + n
×⑳ 0
㉑(dy/dx) = (-x^2 + 1) / (x^2 – x + 1)^2
㉒(dy/dx) = (sinx * cosx) / √(1 + (sinx)^2)
㉓y’ = (sin(x))(tan(x))^(sin(x)-1)[(1/cos^2(x)) + ln(tan(x))]
㉔(5^x / ln(5)) – e^x + C
×㉕(1/2)x^2 * log(x^2 – 2) – ∫x^3 / (x^2 – 2) dx + C
㉖32/5 * log(2) – 31/25
×㉗見つかりませんでした。ごめんなさい。
㉘1の階乗を4回加算して4を作り、その後4の階乗を計算して24を得ることができます。
㉙18
㉚解を持たないか、無数の解を持つ。具体的な解を求めるためには、少なくとももう1つの方程式が必要。

結果は。。。

14/30問!!!

将棋神ルー
将棋神ルー

ChatGPT4、圧倒的じゃん!
㉘の階乗の発想分かったのマジですげえ!

将棋神ラー
将棋神ラー

うーむ、、ChatGPT3.5とBingAIが酷すぎるせいでそう見えるだけじゃな。
ChatGPT4も単純な計算を間違えていたり、点数的にも決して褒められるものではないからのぅ。。。


まとめ

将棋神リー
将棋神リー

挑戦した方はお疲れ様!
でも、漢字より挑戦者はずっと少ないよね(苦笑)
今回もAI達の結果を表でまとめたよ!

ランキングAIモデル得点得点率
1ChatGPT-414/3046.67%
2ChatGPT-3.57.5/3025.00%
3BingAI5.5/3018.33%

AI達の計算テスト結果を比較すると、最新AIであるChatGPT4が漢字テスト同様、最も高い点数を取りました。

しかし、点数的にはまだまだ感がありますよね、、、

個人的に㉘で階乗を使えばできるかもしれないと提案してきた時は、思わず「こいつすげえ」と言ってしまいました(笑)

今回はこんな感じの結果でしたが、近い将来、AIに計算機が統合されると思うので次のモデルは飛躍的に計算能力が上がる可能性が高いです。とても楽しみですね!

将棋神ルー
将棋神ルー

Bing、2連続最下位だけど、マジで無能なんじゃね?(笑)
ChatGPT4は、漢字以上に他2つのAIを突き放した結果になったな。

将棋神ラー
将棋神ラー

Bingは、現状確かに期待外れではあるのぅ。。。

最新情報以外はChatGPTシリーズの方が優秀なのかもしれぬな。
次は数学力対決をさせよう。

数学バトルはこちら

コメント

タイトルとURLをコピーしました