あお / ao
11.3K posts

あお / ao
@urora_blue
data scientist at 製造業🏭/ 2児のパパ / kaggle comp& discussion expert 🥈×2🥉×4/ 興味 : CV, 物理×機械学習 / 社会人博士🎓🐊



深層学習がすべてを置き換える。 私もそう思っていました。 画像、自然言語、音声。 あらゆる分野で圧倒的な成果を出してきた深層学習。 だからこそ、ビジネスの予測モデルでもいずれ主役になると。 しかし、現実は少し違います。 顧客データや売上データのような「表形式データ」の世界では、 精度の高い予測モデルを作りたいというとき、 いまだにXGBoostやLightGBMなど、ツリー系のモデルが一般的に使われます。 なぜ、最も進化しているはずの深層学習が、 ここでは勝てないのでしょうか? 答えはシンプルです。 データの構造が違うからです。 深層学習が得意なのは: 画像(空間的な構造) テキスト(順序・文脈) のように、意味のある構造を持つデータです。 一方で、表形式データはどうか? 年齢 収入 購買履歴 地域 これらは単なる「変数の集合」であり、画像や言語のような構造はありません。 つまり、 深層学習がうまく機能する前提そのものが、存在していないのです。 逆に、 XGBoostやLightGBMといったツリー系モデルの場合は、 「年齢 > 30 かつ 購買回数 > 3 なら…」 といった、 ルールベースのパターンを見つけるのが得意です。 そして現実のビジネスデータは、まさにこうしたルールの集合でできています。 アルゴリズムに優劣があるのではなく、 データに適材適所がある。 AIがどれだけ進化しても、この原則は変わりません。 むしろ今は、 「どのモデルを使うか」よりも 「どんなデータを扱っているか」を理解する方が重要です。 もしあなたが、 とりあえず深層学習を使って、一般的なビジネスデータに対して 予測モデルを作ろうとしてるが、精度が伸び悩んでいる のであれば、一度立ち止まってみてください。 そのデータ、本当に深層学習向きですか? このテーマについて、 より詳しく整理した記事を書きました。 qiita.com/KanNishida/ite…


【侵害続報】下記パッケージにマルウェアが仕込まれています。インストールがないか、是非確認ください🙇 ・PyPI の lightning 2.6.2 及び 2.6.3(PyTorch 関連で利用されている。Quarantine 中) ・npm の intercom-client 7.0.4(ヘルプデスク、チャットボット系。未テイクダウン) 複数筋で TeamPCP に帰属され、共に月間10万超以上のDLがあります。なお Takumi Guard でもブロック済&ユーザーには実害がないことを確認してあります。 IoC (Exfil): zero[.]masscan[.]cloud

codex appからssh先のGPUサーバーのコンテナに接続できたぞ!









