つづき

今回話題になっているエルデシュの問題の728番は、1975年にエルデシュらによって提唱された階乗の整除性に関する数論の問題で、「十分小さい定数Cとεが存在する時、『a!b!がn!(a+b-n)!を割り切る』かつ『a+bがn+C*log nよりも大きい』を満たすような整数(a,b,c)は無限に存在するか」というものです。ただし、タオ氏によれば当初の問題文は表現が曖昧で、例えば定数Cが小さい定数として意図されたのか、大きい定数として意図されたのかが判然としなかったと述べています。

この問題の解決については、GPT-5.2 Pro ProとAristotleというAIツールが主導的な役割を果たしました。

RedditユーザーのThunderBeanage氏は、これまでさまざまなLLMを用いて数学の証明を試みてきました。しかし、ThunderBeanage氏によれば、従来のLLMにインターネット検索を許すと、問題が未解決だと気づいて「解けない」と判断してしまい、解法探索を止めてしまうことがあったとのこと。そのため、プロンプトでネット検索しないように指示したりネット遮断でその挙動を避けたりしたそうです。また。ネットを遮断しても、今度は幻覚や致命的な飛躍が頻発し、正しい証明にならないことが大きな障害だったとThunderBeanage氏は述べています。

しかし、2025年12月に登場したGPT-5.2 Proは、証明を作る途中で埋め切れない補題がある場合に、無理にでっち上げず「ここが未解決だ」と正直に言う傾向があり、全体の骨格はかなりの割合で正しかったとのこと。そこで、ThunderBeanage氏は最終的に「ネットありのGPT-5.2で問題の意図と方針を整理し、LaTeXで記述した短いプロンプトを作る」→「別インスタンスのGPT-5.2にネットを禁止した上でそのプロンプトを与えて証明を書かせる」→「別インスタンスに検算と修正をさせる」という方法を考案しました。

1月4日にはGPT-5.2 Proが制約つきの証明を出力。ただし、この時は問題の曖昧さが原因で、正しく解決したと見なされなかったため、「a,b≦(1-ε)n」というより厳しい条件を課した解釈で解決を図ることとなりました。

ChatGPT - Erdos factorial divisibility

https://chatgpt.com/s/t_695bdbf3047c8191af842d03db356b1a

つづく