
Suguru | データサイエンティスト
1.9K posts

Suguru | データサイエンティスト
@st_data_science
データ分析・データ活用の推進をしています。英国王室公認統計家。東工大 (副総代)→ LSE (MSc Data Science with Distinction)。ビッグデータラボ代表理事。ポストはあくまで一観点でのお気持ち表明で、客観的な目線での否定や賛同はしていません。


なぜ今データエンジニアが大事か。 データ分析も、フロントもバックエンドも、今はインフラでさえも、コードで管理ができる。だからgitを使って復旧ができる。 ただデータベースは例外。一度消したデータは復旧できない。だからAIに任せるのがリスクで、データ基盤の知識を持つ人材が必須になる。

AIの出すデータには不足、そしてソースを必ず求める。 探求心と、探究心を追い求める人が功を奏する世界が構築されようとしている。 裾野が広がった分、無慈悲にも選別が行われている。

これ賛成してる人多くいるけど、自分はあまり共感できない。仮説出しの際、AIはむしろかなり有用と思う。 私はもっと単純に、「理解することを諦めない」ことが一番重要だと思っている。AIは膨大なタスクを短時間でこなして、ユーザーに情報共有と意思決定をかつてないペースで迫る。この報告内容には当然、ユーザーが知らない内容も多く含まれる。 「理解負債」と言われているように、この報告を理解して適切に伴走するのは決して容易ではない。 厄介なことに、AIは「一見論理的な説明をすること」が人智を超えたレベルで上手い。ユーザーは、これに対して常に批判的に考えて、抜け漏れや誤りを都度指摘する必要がある。東大主席の頭脳は味方にもなるけど、敵にもなる。 AIへの指摘を放棄して任せきりにすると、とんでもないしっぺ返しを喰らう。最近だと大量の顧客情報を誤って削除してしまったなんてニュースがあったけど、これはその良い例だと思う。自身で理解することを放棄した時点で、AIはもう使いこなせない。

文系が余剰になって、理系が不足する。これからはデータサイエンスの能力が必要とされる。という記事が話題だけど、データに携わる者としてはっきり言います。 データサイエンスはAIの発達で再現性が極限まで高まり、差別化がしにくくなってきています。その中で、本当に差別化するのに重要な能力が一つだけあります。 それは「仮説力」です。 これには文系も理系も関係ありません。では、どんな要素が必要か? それは現場経験です。 とにかく現場で、血の通った仕事を行ってきた人にしか、良質な仮説は生み出せません。 これからの時代は文系でも理系でもなく、現場人材が勝ちます。


「AIエンジニアは需要がある」って言われるけど、社内DXやってる人なら分かるだろ。社内の人間は動かない。PoCは通っても本開発には進まない。きらびやかな肩書きの割に、成果が出ない構造になってる。だから俺は副業を始めた。 社内DXが進まない構造的理由を5つに分解する。 ①社内政治: PoCは部長案件、本開発は別部門の評価軸、責任の所在が曖昧 ②予算プロセス: 年度予算で動く社内開発は、AI技術の進化スピードに追いつけない ③現場の抵抗: 既存業務を変えたくない現場マネジャーが、優先順位を後ろに回す ④定量効果の証明: 「業務効率化」を金額換算できないと予算が下りない ⑤外注前提の文化: 大手は内製より外注を選ぶ、内製AIエンジニアの居場所がない この5重の壁を越えるのは、エンジニア個人の頑張りでは無理ゲー。 対処は3つ。 ①諦めて転職: スタートアップ・ユニコーンに移る、内製文化のある会社へ ②諦めて副業: 社内動かない時間を、自分の事業に投資する ③諦めてスペシャリスト化: 社内DXを諦めて、技術を外部発信・商品化する どれを選んでも、社内DXに固執するより遥かに楽になる。きらびやかな肩書きの裏で消耗するのは、もうやめよう。 社内DXの構造的限界は、AIエンジニア個人の能力の問題ではない。組織設計の問題で、解は組織変更(転職)か独立しかない。消耗を続ける選択は、自分の市場価値を毎月削る選択だ。今夜、転職サイトを開くのが第一歩だ。 諦めは敗北ではなく、合理的な経営判断だ。組織の問題を個人で解こうとするのは、スコープの設定ミス。スコープを正しく設定し直す、それだけで人生が軽くなる。

データ系の職種、色々あってややこしいけど、 上流から下流までのデータの流れの どこでその職種が関わるのかまとめてみました。 違うよとか、ここはこうだよとか ご意見あればぜひ教えてください。




Kaggleは全然評価されると思います。あと、昨日挙げた総務省のデータ分析コンペ参加とかも、より実務らしくて良いと思います。 ただ正直、『社内をKaggle受賞者で固めてます!』という宣伝に関しては私は懐疑的です。これは以前よく海外でシェアされた画像で、AIプロジェクトにおいて、機械学習が占める割合は「極わずか」というもの。本当にその機械学習エンジニアを活躍させられる体制があるのだろうか? あと最近は、資格が再評価される時代なのかな?とも思いますね。「生成AI抜きでどこまで知ってるか?」は、今後採用者として気になるところ。




データサイエンス系の転職で kaggleって評価されるんだろうか? 転職に役立ったという話も、 採用側からはマイナスという話も聞いたことがある。 個人的には実務経験の方が評価されると思っているけど、実際どうなんだろ。

DS協会がこう認識しているのは悲しいところ。生成AIが出てきてデータ分析が自動化されるからと言って、その知識が不要になるかというと全くそう思えない。司令塔であるユーザーに分析の知識がなければ、生成AIに任せても、それらしいものが得られるだけで、良い結果は得られない。

DS協会がこう認識しているのは悲しいところ。生成AIが出てきてデータ分析が自動化されるからと言って、その知識が不要になるかというと全くそう思えない。司令塔であるユーザーに分析の知識がなければ、生成AIに任せても、それらしいものが得られるだけで、良い結果は得られない。

データサイエンティスト協会がスキル・タスクリストをAI時代に合わせて大幅刷新。生成AIで従来の分析領域が自動化され、分析のコモディティ化が進む今、DSに求められる役割が「価値創造・組織変革リーダー」へシフトしている xtech.nikkei.com/atcl/nxt/mag/n…
