
Hourglassと MEGABYTEを引用しているのに新規を主張するのは研究倫理的にまずいです。階層型Trasnformerの先行研究論文は数多くある中で階層をinference primitiveとして扱う最初のモデルであると主張することは出来ません。
PHOTON のRecGen の核であるtop-level KVだけ持って下層は local 再構成で済ますのはYOCOそのもの。L段に拡張した点だけが差分。これを引用していないのは knowingly omitting the closest prior workです。
Hourglass (2022), MEGABYTE (2023), YOCO(2024) という直接的な先行研究を引用または無視した上で、本質的に同型のアーキテクチャを "vertical scanning という新パラダイム"として提示するのは研究倫理に欠けます
日本語



