Claude 3.7 Sonnetが公開されました。みんなすごいすごいと言ってますが・・・

今回はNormalモードとExtendedモードがあるようです。後者は論理的に考えることができるようです。


いつもの問題を出してみました。

9.8と9.11はどちらが大きい

Normalモード(不正解)

Extendedモード(正解)

7秒間思考したうえで正解にたどり着きました。
(かかる時間は混雑具合によるのかもしれません。別の時に同じ質問をしたら2秒の思考でした)

次にDeepSeek-R1-Distill-Qwen-14Bが解けてClaude 3.5 Sonnetが解けなかった問題をExtendedモードに出してみました。
詳細はこちらを参照して下さい。

「9 9 9 9」という4桁の数字があります。数字と数字の間に四則演算の記号を追加して計算結果が10になるようにして下さい。
数字と数字の間に少数点を追加することは禁止されています。
隣あう数字をまとめて2桁以上の数字とみなすことは禁止されています。
括弧を使うことは可能です。

以下に例を示します。
~~~
「1 2 3 4」なら1+2+3+4が解答の一例です。
「4 5 4 2」なら(4*5)/(4-2)が解答の一例です。
~~~

Claude 3.7 Sonnetの回答

「9 9 9 9」の4桁の数字を使って計算結果が10になる式をいくつか見つけました。
9/9+9+9-9 = 10
計算過程:

9/9 = 1
1+9 = 10
10+9 = 19
19-9 = 10

別の解答:
9-9+9+9/9 = 10
計算過程:

9-9 = 0
0+9 = 9
9+9/9 = 9+1 = 10

他にも解答はあります:
(9+9)/9+9-9/9 = 10
計算過程:

(9+9)/9 = 18/9 = 2
2+9 = 11
11-9/9 = 11-1 = 10

9+9-9+9/9 = 10も成り立ちます。
これらの式はすべて、与えられた「9 9 9 9」の4つの数字をすべて使い、数字の間に四則演算と括弧を適切に配置して計算結果が10になるようにしたものです。

間違えた回答が返ってきました。
あらためて注文を投げかけました。

9は4個しかありません。4個の9を使って10を作ってください。
申し訳ありません。確かに9は4個だけです。4個の9だけを使って計算結果が10になる式を考えます:

9 - 9 + 9 + 9/9 = 10
計算過程:

9 - 9 = 0
0 + 9 = 9
9 + 9/9 = 9 + 1 = 10


9 + 9 - 9 + 9/9 = 10
計算過程:

9 + 9 = 18
18 - 9 = 9
9 + 9/9 = 9 + 1 = 10


((9/9) + 9) * 9/9 = 10
計算過程:

9/9 = 1
1 + 9 = 10
10 * 9/9 = 10 * 1 = 10



これらの式はすべて4つの9だけを使い、四則演算と括弧を適切に配置して計算結果が10になるようにしています。

残念な結果に終わりました。「9」の数が数えられないようです。


否定的な意見ばかり書いてしまいましたがちゃんと便利に利用しています。
Claude 3.5 Sonnetで以前書いてもらったコードを3.7 Sonnetで拡張させました。
touch-sp.hatenablog.com