Cameron Wong
804 posts

Cameron Wong
@TheCamdar
graduate student, functional programmer, PL guy webmaster @ https://t.co/Am98rGGYu0 https://t.co/7G3wY7Zc4z https://t.co/vTt5kgaSR9

「数学はもう終わりだ」——研究レベルの問題が、AIによって毎月1%ずつ侵食されている。数学は、人間の抽象思考の頂点の一つだった。人類が最も誇ってきた知的領域に、機械知能が持続的に踏み込んでいるということだ。この曲線が続くなら、発見の主体は根本から変わる。 アレクサンダー・ウィスナー=グロス「2つ目のポイントですが、これらの中で私が最も重視しているベンチマークはFrontier Math Tier 4です。Frontier Math Tier 4は、たしか新年に賭けまでしたもので、今年の後半にもう一度見直す必要があると思いますが、AIが数学におけるプロレベルの研究問題を解ける能力を測る、最良の代替指標の一つです。 そこで何が起きているのか。GPT-5.4 Proから5.5 Proにかけて、およそこの2カ月で約2%の飛躍が見られます。これは何を意味するのか。フロンティアAIによる研究レベル数学の能力が、現在、月あたり約1%向上しているということです。そして、Frontier Math Tier 4の問題のおよそ半分が解かれるところに近づいています。 ここから外挿すると、現在のペースがそのまま続くだけでも——そして私はそうはならない、つまり加速すると断言しますが——現在のペースだけで見ても、今後4〜5年でFrontier Math Tier 4のほぼすべて、つまりプロの研究レベルの数学問題が解かれることになります。つまり、数学はもう終わりです。 もう一度言います。数学はもう終わりです。他にも終わりつつあるものはたくさんあります。しかし、物事はあまりにも速く進んでいて、月ごとに見ても、最難関のベンチマークが毎月1%ずつ上がっているのが確認できるのです。だから、もう長くはありません」

POV: you clicked on a recipe link on Pinterest


I trust the process here. Models didn't write more than 5-10 pages at a time, there was always a verifier/reviewer model looking over individual additions for correctness. Finally the orchestrator mapped out the arguments and check them too. I didn’t check all the computations myself, but I've read through the strategy and some individual pieces in more detail. That said, I expect there will be more than one correction to be made in the end - as is the case with any human written paper too of that size.

What's something that experts/practitioners in your field universally agree upon, but that remains a "hot take" among the general public?

Does anyone have any random fun facts about a very niche subject. I'm bored and love learning random things

















