Suguru | データサイエンティスト

1.9K posts

Suguru | データサイエンティスト banner
Suguru | データサイエンティスト

Suguru | データサイエンティスト

@st_data_science

データ分析・データ活用の推進をしています。英国王室公認統計家。東工大 (副総代)→ LSE (MSc Data Science with Distinction)。ビッグデータラボ代表理事。ポストはあくまで一観点でのお気持ち表明で、客観的な目線での否定や賛同はしていません。

Sumali Aralık 2020
1K Sinusundan5.8K Mga Tagasunod
Suguru | データサイエンティスト
なぜ今データエンジニアが大事か。 データ分析も、フロントもバックエンドも、今はインフラでさえも、コードで管理ができる。だからgitを使って復旧ができる。 ただデータベースは例外。一度消したデータは復旧できない。だからAIに任せるのがリスクで、データ基盤の知識を持つ人材が必須になる。
日本語
0
3
40
3K
Suguru | データサイエンティスト nag-retweet
愚者のグノスター
愚者のグノスター@sIT1Wvta4k13201·
AIの出すデータには不足、そしてソースを必ず求める。 探求心と、探究心を追い求める人が功を奏する世界が構築されようとしている。 裾野が広がった分、無慈悲にも選別が行われている。
Suguru | データサイエンティスト@st_data_science

これ賛成してる人多くいるけど、自分はあまり共感できない。仮説出しの際、AIはむしろかなり有用と思う。 私はもっと単純に、「理解することを諦めない」ことが一番重要だと思っている。AIは膨大なタスクを短時間でこなして、ユーザーに情報共有と意思決定をかつてないペースで迫る。この報告内容には当然、ユーザーが知らない内容も多く含まれる。 「理解負債」と言われているように、この報告を理解して適切に伴走するのは決して容易ではない。 厄介なことに、AIは「一見論理的な説明をすること」が人智を超えたレベルで上手い。ユーザーは、これに対して常に批判的に考えて、抜け漏れや誤りを都度指摘する必要がある。東大主席の頭脳は味方にもなるけど、敵にもなる。 AIへの指摘を放棄して任せきりにすると、とんでもないしっぺ返しを喰らう。最近だと大量の顧客情報を誤って削除してしまったなんてニュースがあったけど、これはその良い例だと思う。自身で理解することを放棄した時点で、AIはもう使いこなせない。

日本語
0
2
4
1.6K
Suguru | データサイエンティスト
データサイエンティストって、その業界内での認識と、メディアでのイメージに乖離があるので、将来性を語る際は少し気をつけたい。 一般だと、統計・数学を駆使して生成AIを自ら構築できて、IT領域を理論から体系的に全領域把握している人みたいなイメージされてるように思う。良くも悪くも。
日本語
1
0
11
1.5K
Suguru | データサイエンティスト
これ賛成してる人多くいるけど、自分はあまり共感できない。仮説出しの際、AIはむしろかなり有用と思う。 私はもっと単純に、「理解することを諦めない」ことが一番重要だと思っている。AIは膨大なタスクを短時間でこなして、ユーザーに情報共有と意思決定をかつてないペースで迫る。この報告内容には当然、ユーザーが知らない内容も多く含まれる。 「理解負債」と言われているように、この報告を理解して適切に伴走するのは決して容易ではない。 厄介なことに、AIは「一見論理的な説明をすること」が人智を超えたレベルで上手い。ユーザーは、これに対して常に批判的に考えて、抜け漏れや誤りを都度指摘する必要がある。東大主席の頭脳は味方にもなるけど、敵にもなる。 AIへの指摘を放棄して任せきりにすると、とんでもないしっぺ返しを喰らう。最近だと大量の顧客情報を誤って削除してしまったなんてニュースがあったけど、これはその良い例だと思う。自身で理解することを放棄した時点で、AIはもう使いこなせない。
渡邉 貴志@VITAL DESIGN代表@kodo202006

文系が余剰になって、理系が不足する。これからはデータサイエンスの能力が必要とされる。という記事が話題だけど、データに携わる者としてはっきり言います。 データサイエンスはAIの発達で再現性が極限まで高まり、差別化がしにくくなってきています。その中で、本当に差別化するのに重要な能力が一つだけあります。 それは「仮説力」です。 これには文系も理系も関係ありません。では、どんな要素が必要か? それは現場経験です。 とにかく現場で、血の通った仕事を行ってきた人にしか、良質な仮説は生み出せません。 これからの時代は文系でも理系でもなく、現場人材が勝ちます。

日本語
0
8
78
27.2K
Suguru | データサイエンティスト
東大主席以上の知能を持つと話題の生成AI、なぜか現場では「画像やPDFを読み込ませても期待した精度が出ない」みたいなことが頻繁している。 実は、特定のタスクをさせた際の精度は、従来の機械学習に全然勝てない問題がある。 そして実務でしばしば重要になるのが、思いの外この「特定タスクで高い精度を持つこと」であって、「良い感じの文章を返してくれる」のはむしろ精度を高いと誤認させてくる危険な側面がある。 だから意外にも、少なくとも現状では、生成AIは機械学習エンジニアの仕事を置き換えられない。 news.nicovideo.jp/watch/nw191927…
日本語
0
0
7
1.2K
Suguru | データサイエンティスト
これはもう本当にその通りというか、AI・DXに関わる方は是非読んでみてほしい。 こういった理由の転職は少なからずあるんだろうなと。現場目線の本音が赤裸々に語られていて、中々他人事として見れない。 誰が悪いという話でなく「構造的に無理がある」と、才能も志もある人が見切りをつけてしまう。
しろふく@AIエンジニアのキャリア@ai_career_hack

「AIエンジニアは需要がある」って言われるけど、社内DXやってる人なら分かるだろ。社内の人間は動かない。PoCは通っても本開発には進まない。きらびやかな肩書きの割に、成果が出ない構造になってる。だから俺は副業を始めた。 社内DXが進まない構造的理由を5つに分解する。 ①社内政治: PoCは部長案件、本開発は別部門の評価軸、責任の所在が曖昧 ②予算プロセス: 年度予算で動く社内開発は、AI技術の進化スピードに追いつけない ③現場の抵抗: 既存業務を変えたくない現場マネジャーが、優先順位を後ろに回す ④定量効果の証明: 「業務効率化」を金額換算できないと予算が下りない ⑤外注前提の文化: 大手は内製より外注を選ぶ、内製AIエンジニアの居場所がない この5重の壁を越えるのは、エンジニア個人の頑張りでは無理ゲー。 対処は3つ。 ①諦めて転職: スタートアップ・ユニコーンに移る、内製文化のある会社へ ②諦めて副業: 社内動かない時間を、自分の事業に投資する ③諦めてスペシャリスト化: 社内DXを諦めて、技術を外部発信・商品化する どれを選んでも、社内DXに固執するより遥かに楽になる。きらびやかな肩書きの裏で消耗するのは、もうやめよう。 社内DXの構造的限界は、AIエンジニア個人の能力の問題ではない。組織設計の問題で、解は組織変更(転職)か独立しかない。消耗を続ける選択は、自分の市場価値を毎月削る選択だ。今夜、転職サイトを開くのが第一歩だ。 諦めは敗北ではなく、合理的な経営判断だ。組織の問題を個人で解こうとするのは、スコープの設定ミス。スコープを正しく設定し直す、それだけで人生が軽くなる。

日本語
0
2
22
2.7K
Suguru | データサイエンティスト
5.はむしろ「継続的な効果検証」でしょうか。逆にビジネス提案は最初に来ることも多いかなと。外部から入ると『データの中身も分析結果も不明』な段階で提案する必要のある難しい状況はよくあります。なので、理想を言えばDSは、データを見る前に分析結果の分岐や活用ビジョンまで見えてると嬉しい。
TsK|データエンジニア@メガベン@HardModeDE

データ系の職種、色々あってややこしいけど、 上流から下流までのデータの流れの どこでその職種が関わるのかまとめてみました。 違うよとか、ここはこうだよとか ご意見あればぜひ教えてください。

日本語
1
1
19
2K
Suguru | データサイエンティスト
生成AI活用、成果が出ていない企業は1%未満。多くの企業が生成AIによって恩恵を得ているのは、ディープラーニング時代と明確に異なりますね。逆に8割以上が「データの品質や整備状況」のため推進が難航しており、この状況はその時代からほとんど改善がないように見える。 これは体感を含めたが、大手企業は結局のところ未だにほぼデータ基盤が未整備なのではないだろうか。つまり未だにデータエンジニアが必要とされる前段階にいる状況なのかもしれない。 news.nicovideo.jp/watch/nw191927…
日本語
0
1
9
796
Suguru | データサイエンティスト nag-retweet
みお|データサイエンティスト採用担当の本音
私が発信を始めた理由、お話しします。 採用担当をしていて一番もったいなく感じるのが、優秀な学生・転職希望者が「自分なんて」と諦めて応募すらしてくれないことです。業界は深刻な人材不足なのに、です。 経産省の発表では、AI人材は2030年に約12万人不足するとされていて、私の肌感でも採用予算はあるのに採り切れていない会社がほとんど。 一方で、候補者側は「DSは天才がなるもの」「学歴が必要」「Kaggleメダルがないと無理」という幻想を持っていて、自己評価を過剰に下げている方が多い。このギャップを埋めたくて、内側からの情報を出しています。 私が見てきた内定者は、別に天才ではなく、「自分の強みを知り、それを企業の必要に接続できる人」でした。特別な才能より、自己分析と企業理解、それを言語化する訓練。この3つが揃えば、多くの方にチャンスがあります。だから私はXで、採用担当の本音を書き続けます。 諦める前に、一度だけ内側の声を聞いてみてほしいです。そして迷ったら、DMで相談してください。具体的な一歩として、まず自分の強みリストを20個書き出してみてください。大したことないと感じるものも含めて全部。 その中から、DS職と接続できるものを3つ選び、それを軸に自己PRを作ると、説得力が劇的に上がります。業界に入る前に「諦める」選択をしないでほしい。人材不足と自己評価の低さというダブルの非対称が今の採用市場の歪みで、これを解くのが私の発信のゴールです。 あなたの価値、内側は気づいていますよ。業界を広げる一助になれたら嬉しいです。
日本語
1
1
30
2.9K
Suguru | データサイエンティスト
ITの文脈で「人材不足」というのはよく聞きますが、なんとこの少子化の時代に「人材余り」... 生成AI時代、IT人材の需要がどうなるのか気になるところではありますが、活躍のハードルが下がることで、「1億総データサイエンティスト時代」になるという考え方もあるんですね。 nikkei.com/article/DGXZQO…
日本語
0
0
9
1.3K
Suguru | データサイエンティスト nag-retweet
みお|データサイエンティスト採用担当の本音
「データサイエンティスト」と「機械学習エンジニア」の違い、企業によって全然違うんです。私が困惑するのは、同じ「データサイエンティスト」という求人タイトルでも、ある会社では分析業務中心(SQL・BI・レポート作成)、別の会社ではモデル実装と運用(Python・MLOps・本番リリース)、さらに別の会社ではビジネス提案まで(データで経営に提言)と、全く違う業務を指している点です。タイトルだけで判断すると入社後に後悔します。応募前にチェックすべきは3点。①求人票の業務内容(「分析」「実装」「提案」のどれに力点があるか)②使用技術スタック(SQL中心なら分析寄り、Python・Docker・Kubernetesが並ぶなら実装寄り)③所属組織(事業部所属なら分析・提案寄り、データ基盤チーム所属なら実装寄り)。これらでミスマッチを避けられます。年収レンジも違っていて、分析中心のDSは500〜900万、実装まで出来るMLEは700〜1500万が相場。自分がどちらのキャリアを歩みたいのかを決めた上で、求人タイトルではなく業務内容で選んでくださいね。面接での見極め方も知っておくと役立ちます。面接で「一日の業務の流れを教えてください」と聞いて、SQLクエリ・ダッシュボード作成の話が多ければ分析寄り、デプロイ・障害対応の話が多ければ実装寄りです。入社後のキャリアパスも違います。分析寄りのDSは事業部との距離が近く、マネジメントやビジネス側への異動ルートがあります。実装寄りのMLEは技術を深めてテックリードやアーキテクトを目指すルートが主流です。ここを外すと、入社後に「やりたい仕事じゃなかった」が起きます。
日本語
0
13
214
36.2K
TsK|データエンジニア@メガベン
ありがとうございます!欲しかった情報です。 やはり転職で評価されるんですね。 私もそのギャップには違和感を持っていて、実際、機械学習を使う機会って全体の仕事量の割合としては少ないかと どの現場でも、がっつりビジネスに適用できるところってそんなにあるか?と思っています。 また、データの問題や使いどころを見つけるのに時間を要するケースが多いのではと
日本語
1
0
3
1.3K
Suguru | データサイエンティスト
Kaggleは全然評価されると思います。あと、昨日挙げた総務省のデータ分析コンペ参加とかも、より実務らしくて良いと思います。 ただ正直、『社内をKaggle受賞者で固めてます!』という宣伝に関しては私は懐疑的です。これは以前よく海外でシェアされた画像で、AIプロジェクトにおいて、機械学習が占める割合は「極わずか」というもの。本当にその機械学習エンジニアを活躍させられる体制があるのだろうか? あと最近は、資格が再評価される時代なのかな?とも思いますね。「生成AI抜きでどこまで知ってるか?」は、今後採用者として気になるところ。
Suguru | データサイエンティスト tweet media
TsK|データエンジニア@メガベン@HardModeDE

データサイエンス系の転職で kaggleって評価されるんだろうか? 転職に役立ったという話も、 採用側からはマイナスという話も聞いたことがある。 個人的には実務経験の方が評価されると思っているけど、実際どうなんだろ。

日本語
1
10
200
27.8K
Suguru | データサイエンティスト
総務省が「統計データ分析コンペティション2026」を開催するそうです。応募は5月11日~8月7日。大学生・一般の部と、高校生の部があるようです。受賞者は総務大臣賞、統計数理賞などの授賞や、統計専門誌への掲載など。GW前で丁度良いタイミングですね。 reseed.resemom.jp/article/2026/0…
日本語
0
21
134
6.6K
Suguru | データサイエンティスト nag-retweet
Suguru | データサイエンティスト nag-retweet
倉持英一/採用は泥臭い。
エンジニアが技術を理解してクロードコードでシステムを作るのと、非エンジニアがクロードコードでシステムを作るのは、結果全く別物ですもんね。 セキュリティ面もそうですし、細かい部分でも大きく差が出ると思いますね。 今後AIでなくなる議論が増え続けるが、専門性があれば入れ替わらず共存できると思ってます。AIを伴走者できる人なのかが大切ですね!
Suguru | データサイエンティスト@st_data_science

DS協会がこう認識しているのは悲しいところ。生成AIが出てきてデータ分析が自動化されるからと言って、その知識が不要になるかというと全くそう思えない。司令塔であるユーザーに分析の知識がなければ、生成AIに任せても、それらしいものが得られるだけで、良い結果は得られない。

日本語
0
1
8
1.2K
Suguru | データサイエンティスト
DS協会がこう認識しているのは悲しいところ。生成AIが出てきてデータ分析が自動化されるからと言って、その知識が不要になるかというと全くそう思えない。司令塔であるユーザーに分析の知識がなければ、生成AIに任せても、それらしいものが得られるだけで、良い結果は得られない。
高橋光 | 著書『データ分析力を高める ビジネスパーソンのためのSQL入門』@light940

データサイエンティスト協会がスキル・タスクリストをAI時代に合わせて大幅刷新。生成AIで従来の分析領域が自動化され、分析のコモディティ化が進む今、DSに求められる役割が「価値創造・組織変革リーダー」へシフトしている xtech.nikkei.com/atcl/nxt/mag/n…

日本語
0
11
139
31K