今回は、AIに数学の問題を解かせてみよう。
人間とどっちができるかのぅ。
数学は、計算以上に苦戦するんじゃないかな?
ということで、今回は2023年5月現在の最新AIであるChatGPT4さんに、数学の問題を出題してみました。問題もバリエーションに富んだものにしてあるので、かなり楽しめる内容になっていると思います。
貴方とどちらが数学力があるのか、ぜひ対決してみてください!
また、現在最新のAIがどこまで解けるのかにも注目です!
このページは、以下の構成で書いていきます。
- 出題する数学の問題←人間代表としてぜひ挑戦してみて!
- 問題の解答&他のAI達の結果
- ChatGPT4の回答&答え合わせ
- まとめ
出題する数学の問題
出題する数学の問題は以下にしよう。まず、人間代表として挑戦してみてくれ。
AIの能力を測るために、かなり難しい問題も出題しておるから、解けない問題が合っても落ち込まないで良いぞい。
①表面は、4mと6mの長方形に半径3mの半円がくっついている形をしている長さ8mのビニールハウスがあった。このビニールハウスの体積を求めなさい。なお、円周率は3.1とする。
②草村で正11角形の石版を見つけた。この石版の内角の和は【ア】度、一つの内角の大きさは【イ】度、対角線は【ウ】本引けることがわかる。【ア】【イ】【ウ】に適切な数字を入れなさい。なお、整数で答えられない場合は分数で答えなさい。
③長さ240mの普通列車と、秒速30mの快速列車が走っている。普通列車と快速列車の長さの比は4:1、速さの比は2:3である。このとき以下の問いに答えなさい。
a)普通列車と快速列車が向かい合って走っている時、すれ違うのに何秒かかるか。
b)普通列車と快速列車が同じ方向で走っている時、快速列車が普通列車に追いついてから追い越すまでに何秒かかるか。
④2%の食塩水300gに9%の食塩水を混ぜて7%の食塩水を作りたい。9%の食塩水を何g混ぜれば良いか。
⑤6種類の色珠を1個ずつつないで輪になるキーホルダーを作る。このとき以下の問いに答えなさい。
a)輪になるキーホルダーの作り方は何通りあるか。
b)特定の2種を隣り合わせにすると作り方は何通りあるか。
⑥ある決まりに従って、数を次のように並べていく。
1,2,3,6,5,10,7,14,9,18,11,…
このとき以下の問いに答えなさい。
a)左から99番目にはどの数を並べれば良いか。
b)左から50番目と51番目の数の差を求めなさい。
c)はじめに30が出るまでの数の和を求めなさい。
⑦原価96円の布の粘着テープと原価75円の白いビニールテープを合わせて520個仕入れた。布の粘着テープには25%、白いビニールテープには12%の利益を見込んで定価をつけた。完売だと7680円の利益になる。白いビニールテープは何個仕入れたか。
⑧3人が何日か働いて仕事全体の3/5を終えた。残りは4人で2日かかった。この仕事は全部で何日かかったか。
⑨放物線y=-2x^2+5xを平行移動した曲線で、点(1,-3)を通り、頂点が直線y=-2x+3上にある放物線の方程式を求めなさい。
⑩2次関数y=x^2+2x+m,y=x^2+mx+m+3のグラフが、ともにx軸と共有点をもつとき、定数mの値の範囲を求めなさい。
⑪三角形ABCにおいて、a=√7,b=2,c=3とする。線分BCの中点をMとするとき、AMの長さを求めなさい。
⑫円に内接する四角形ABCDにおいて、AB=3,BC=1,CD=3,DA=4とするとき、四角形ABCDの面積を求めなさい。
⑬白玉3個、赤玉5個、青玉4個が入っている袋から、4個の玉を取り出すとき、取り出した玉の色が2色である確率を求めなさい。
⑭1個のさいころを3回続けて投げるとき、出る目の最大値が4である確率を求めなさい。
⑮AとBの試合で、A,Bの勝つ確率がそれぞれ1/3,2/3であるとする。この試合を繰り返すとき、AがBよりも先に3回勝つ確率を求めなさい。
⑯鋭角三角形ABCの辺BC、CA、ABの中点をそれぞれL,M,Nとする。△ABCの外心Oは△LMNについてどのような点か。
⑰5桁の自然数43□8□の□に、それぞれ適当な数を入れると、9の倍数になる。このような自然数で最大のものを求めなさい。
⑱200以下の自然数のうち、正の約数が10個である数の個数を求めなさい。
⑲15/22,20/33のいずれに掛けても積が自然数となる分数のうち、最も小さいものを求めなさい。
⑳x+2y+3z=12を満たす自然数の組を全て求めなさい。
㉑3点A(3,-2),B(-1,0),Cを頂点とする三角形が正三角形となるとき、点Cの座標を求めなさい。
㉒円x^2+y^2=4と円(x-5)^2の共通接線の方程式を求めなさい。
㉓2点A(-1,0),B(4,0)と点Pを頂点とする△PABがPA:PB=1:4を満たしながら変化するとき、点Pの軌跡を求めなさい。
㉔OA=2√2,OB=√3,OAベクトル・OBベクトル=2である。△OABの垂心をHとする。OAベクトル=aベクトル,OBベクトル=bベクトルとするとき、OHベクトルをaベクトルとbベクトルを用いて表しなさい。
㉕平行六面体OADB-CEGFにおいて、辺DGのGを越える延長上にGM=2DGとなるように点Mをとり、直線OMと平面ABCの交点をPとする。OAベクトル=aベクトル,OBベクトル=bベクトル,OCベクトル=cベクトルとするとき、OPベクトルをaベクトル,bベクトル,cベクトルを用いて表しなさい。
㉖第10項が24,第30項が64である等差数列について、初項から第何項までの和が初めて200より大きくなるか求めなさい。
㉗nは自然数とする。座標平面上の3点(0,0),(2n,0),(0,n)を頂点とする三角形の周および内部にある格子点(x座標、y座標がともに整数である点)の個数を求めなさい。
㉘次の条件によって定められる数列{an}の一般項を求めなさい。a1=0,a2=1,a(n+2)+a(n+1)-6an=0
㉙aは正の定数とする。中心の極座標が(a,0)で、極Oを通る定円をCとし、Pを極Oを除くC上の動点とする。線分OPを2:1に内分する点Qの軌跡の極方程式を求めなさい。
㉚π/4≦x≦(5/4)πの範囲で、2つの曲線y=sinx,y=cosxで囲まれた部分を、x軸の周りに一回転させてできる立体の体積Vを求めなさい。
単純な計算問題がない、、、
問題の解答&他のAI達の結果
どうじゃったかのぅ。
前回は計算能力を測ったから、今回は数学力を測るためにそこまで計算が複雑ではないものを多めに選んだつもりじゃ。
解答は以下だよ!挑戦した方は、答え合わせをしてみてね!
①303.6m^3(自作問題)
②【ア】:1620、【イ】:1620/11、【ウ】:44(自作問題)
③a)6秒、b)30秒(SPI本)
④750g(SPI本)
⑤a)60通り、b)24通り(SPI本)
⑥a)99、b)47、c)192(SPI本)
⑦320個(SPI本)
⑧6日(SPI本)
⑨y=-2x^2-4x+3、y=-2x^2+8x-9
(4STEP数Ⅰ、大問167)
⑩m≦-2
(4STEP数Ⅰ、例題27)
⑪AM=√19/2
(4STEP数Ⅰ、例題40)
⑫15√3/4
(4STEP数Ⅰ、例題44)
⑬73/165
(4STEP数A、大問88)
⑭37/216
(4STEP数A、例題19)
⑮17/81
(4STEP数A、例題21)
⑯垂心
(4STEP数A、例題25)
⑰43983
(4STEP数A、大問223)
⑱5個
(4STEP数A、大問226)
⑲66/5
(4STEP数A、例題32)
⑳(7,1,1),(5,2,1),(3,3,1),(1,4,1),(4,1,2),(2,2,2),(1,1,3)
(4STEP数A、例題32)
㉑(1+√3,1-2√3),(1-√3,1+2√3)
(4STEP数Ⅱ、例題14)
㉒3x±4y=10,x±2√6=10
(4STEP数Ⅱ、例題20)
㉓中心の点(-4/3,0),半径が4/3の円、ただし、2点(0,0),(-8/3,0)を除く。
(4STEP数Ⅱ、大問211)
㉔OHベクトル=1/10aベクトル+3/5bベクトル
(4STEP数B、例題6)
㉕OPベクトル=1/5aベクトル+1/5bベクトル+3/5cベクトル
(4STEP数B、例題11)
㉖第12項
(4STEP数B、例題17)
㉗(n+1)^2
(4STEP数B、例題23)
㉘an=2^(n-1)-(-3)^(n-1)/5
(4STEP数B、例題25)
㉙r=(4/3)acosθ(ただし、r≠0)
(4STEP数Ⅲ、例題13)
㉚π(π+6)/4
(4STEP数Ⅲ、例題38)
ちなみに私は数学が一番の得意科目だったので、受験直前期なら7割程度はおそらく解けたと思います。
でも、計算同様に今は大分忘れてしまっているのでもう半分も怪しいぐらいです、、、皆さんはどうでしたか?
8割以上正解した!という方は、私の受験生時代よりも数学力があると思います(笑)
では、さっそくChatGPT4さんに解いて貰いたいところなんですが、その前に参考結果としてChatGPT3.5さんとBingAIさんにも解かせてみましょう!
結果は。。。
ChatGPT3.5:1/30問
BingAI:1.5/30問
でした!!!
また、ChatGPT3.5に関しては、完答は0問でした、、、
※点数が小数点になっているのは、惜しかった問題を0.5点換算としたためです。AI達の回答と採点は3ページ目に参考資料として載せておくので興味がある方は見てみてください。
えー、壊滅じゃん!!!
ラー難易度設定ミスったんじゃない?
標準~やや難問題を中心に出題したつもりじゃったが、、、
目も当てられぬ成績じゃな。
GPT4が何とかしてくれることを祈るしかないのぅ。
ChatGPT4の回答&答え合わせ
GPT4、頼むぞ。。。
最新AIであるChatGPT4の回答は以下でした。
※途中式が長いためここには答えのみを記載しました。省略した途中式は次のページに載せました。また、途中式で部分点を上げた問題もあるため、答えが違うのに△になっている場合があります。
〇①303.6立方メートル
△②【ア】1620、【イ】147 + 3/11、【ウ】44
×③a)8秒、b)32秒
〇④750g
×⑤a)120通り、b)48通り
×⑥a)50、b)24、c)465
〇⑦320個
×⑧3日
×⑨ y = -2(x – 1/2)^2 + 5(x – 1/2) + 2
△⑩ 1 ≦ m ≦ 2
×⑪4√(42) / 3
×⑫円に内接する四角形ABCDを作ることはできません。
×⑬170 / 495
〇⑭37 / 216
×⑮24.62%
×⑯外心Oはオイラー線上の他の点と共に位置する
×⑰43830
×⑱3個
×⑲1/66
×⑳(1, 1, 2)と(6, 1, 1)
×㉑(0, -3) または (2, 1)
×㉒y = 0
×㉓円 x^2 + y^2 = 1 と点 (0, 0)
×㉔OHベクトル = 3/2 bベクトル
×㉕OPベクトル = aベクトル
×㉖第10項
×㉗n(n+2)
×㉘an = (3/5)(2^n) + (2/5)(-3^n)
×㉙r = 2 * a * cos(θ)
×㉚V = π * (π – 2)
結果は。。。
5/30問!!!
流石!!!
ChatGPT3.5とBingAIとは格が違うね!
しかしGPT4を持ってしても、正答率16%か。。。
数学はまだまだということじゃな。
まとめ
どうだったかな?
今回は、AI達の得点がみんな低かったね。。
下にAI達の結果をまとめたよ!
ランキング | AIモデル | 得点 | 得点率 |
---|---|---|---|
1 | ChatGPT-4 | 5/30 | 16.6% |
2 | BingAI | 1.5/30 | 5.0% |
3 | ChatGPT-3.5 | 1/30 | 3.3% |
AI達の数学テスト結果を比較すると、最新AIであるChatGPT4が予想通り、最も高い点数を取りました。
ただ、今回の得点は全体的に低いといえますね。。。
この結果からAIにとって、数学、特に高校以上の数学は、まだ難しいということがわかりました。
次に出てくるモデルは、今回AI達が大苦戦した数学のテストで何点取れるようになるか楽しみですね!
BingAIは初めて最下位を脱出したな(笑)
にしても、数学弱すぎだな。
でも、このテストで満点取れるなら偏差値70近くいくはずだから東大合格も見えてくるよなぁ。
そうじゃのぅ。
次は、資格試験を解かせてみよう。
資格試験バトルはこちら
コメント