Murawaki

2.6K posts

Murawaki

@murawaki

Native of Kobe; NLP and Computational Linguistics

Kyoto, Japan Katılım Nisan 2009

100 Takip Edilen887 Takipçiler

Murawaki@murawaki·26 Mar

言語地図を作るのに調査地点の緯度経度を特定する必要があるのだけど、面倒なので生成AIで自動化できませんかね、というほのぼのとした相談を受けている間に、米国は爆撃地点の選定を生成AIで自動化し、しかも誤って女学校を標的にして子供を爆殺しまくっているという現実。何か根本的に発想が違う。

日本語

725

Murawaki@murawaki·17 Mar

書いた。というか、Grok に調べさせて ChatGPT にまとめさせた。平山優は弥助問題で科学コミュニケーションに失敗した njump.me/nevent1qqspfqs…

日本語

1.2K

Murawaki@murawaki·15 Mar

このままエネルギー危機が続くと、AI 研究のための大型計算機利用なんて真っ先に止められるんちゃうの。

日本語

274

Murawaki@murawaki·19 Şub

『現代社会を生きるための AI×哲学』 amzn.to/3MrUrM9 著者のご恵贈にあずかった。講義の教科書にするという話。AI の本を書くということは一瞬で陳腐化するリスクと向き合うこと。比較的長持ちしそうな基礎を抑えている印象。批判的な議論は Nostr の方で。 njump.me/nevent1qvzqqqq…

日本語

762

Murawaki@murawaki·26 Oca

NAACL が 2024 年に North American Chapter から Nations of the Americas Chapter に名前を変更していたのに今更気づいた。2025 年の予稿集を確認していて。 naacl.org/posts/2024-10-…

日本語

1.4K

Murawaki@murawaki·20 Oca

山ほど仕事を積んだうえで、「仕事をしないとお前の共著を desk reject するぞ」と脅す、脅迫ドリブン査読。すでに死に体の査読システムを維持するために頑張っているのはわかるが、もう限界やろという気分が強まる。

日本語

1.7K

Murawaki@murawaki·16 Ara

@nlp_colloquium @KyotoU_News このタイミングに合わせたわけではありませんが、言語ステガノグラフィの最近の研究のサーベイをとりあえずプレプリントで公開しました。researchgate.net/publication/39…

日本語

1.5K

NLPコロキウム@nlp_colloquium·4 Ara

🚀次回の #NLPコロキウムのお知らせ講演者: 村脇有吾さん @murawaki (@KyotoU_News) 日時: 12/17 (水) 12:00–13:00 JST 言語モデルで出力した一見自然なテキストに秘密のメッセージを忍ばせる『言語ステガノグラフィ』の基本、実用化の壁、展望について紹介いただきます🔐nlp-colloquium-jp.github.io//schedule/2025…

日本語

Murawaki@murawaki·8 Ara

ここ1か月ほど、自分や研究室内外の同僚や学生が次々とインフルにかかって、いろいろ支障が出ていた。ここまでの流行はちょっと記憶にない。

日本語

354

Murawaki@murawaki·11 Kas

一昨日、昨日と熊が岩倉を徘徊してららしいんやけど kurashi.yahoo.co.jp/kyoto/26103/in…

日本語

957

Murawaki@murawaki·10 Kas

この日本にシベ語母語話者の夫婦が住んでいて、家庭内で日常的にシベ語を使っているという衝撃の報告。動画内で突然シベ語会話が始まってテンション爆上げ。動画を上げている子供には継承されていない。 youtube.com/watch?v=vvoBca…

YouTube

日本語

4.2K

Murawaki@murawaki·29 Eki

もう少し詳しい説明は Nostr に書いた。njump.me/nevent1qvzqqqq…

日本語

246

Murawaki@murawaki·28 Eki

arxiv.org/abs/2510.20075 いくらプレプリントで、専門が言語処理でもセキュリティでもないといっても、従来研究に気づかないままこの長さの原稿を書けるものなのか? 無駄に凝った手法 (Meteor) を引用しているのも謎。本来引用すべき Fang et al. (2017) や Ziegler et al. (2019) まで1ホップなのに。

日本語

3.3K

Murawaki@murawaki·31 Ağu

EMNLP Main に採択。LLM が生成したトークン列を detokenize し、もう一度 tokenize したとき、元のトークン列が再現されない現象がそれなりの頻度で起きる。この現象はステガノグラフィのでは致命的。ウォーターマーキングでも検出力が低下。両タスクに応じた解法を提案。arxiv.org/abs/2508.20718

日本語

12.7K

Murawaki@murawaki·17 Ağu

@s5yata ちょうど私も先月同じ問題にはまりました。私の場合は Queue を SimpleQuque に置き換えたら解決したっぽいです。

日本語

110

Susumu Yata@s5yata·15 Ağu

wikiextractor に jawiki のダンプを入れると途中で出力が止まってしまう問題に対して，とりあえずの回避策を見つけられたみたい．以前は 3.3G で止まっていたけど，今見たら，まだ処理中なのに 6.6G になっている． github.com/s-yata/wikiext…

日本語

218

Murawaki@murawaki·7 Ağu

『統計的テキストモデル』第2刷 p.151 脚注87: GPT-3のような現在の強力なマスク化言語モデル -> BERT? このあたりの議論にふんわりと結びつけようとしているのかなと推測 kyunghyuncho.me/bert-has-a-mou…

日本語

556

Murawaki@murawaki·17 Tem

ジョチがチンギス・ハンの実子であることと整合的な結果が遺跡個体のゲノム解析から得られたという報告。いろいろ不確定要素があって断定は避けているが。biorxiv.org/content/10.110…

日本語

541

Murawaki@murawaki·5 Haz

Manning が長年講義してきたことで有名な Stanford CS224N だが、今年はついに constituency parsing が完全消滅した。去年までは Socher の recursive モデルの説明のためにかろうじて生き残っていたのに。web.stanford.edu/class/cs224n/

日本語

2.5K

Murawaki@murawaki·21 Nis

Nostr は NLP にも使えそう。とにかく人がいないのでネットワーク解析系は駄目だけど、被験者実験のために SNS のモックアップを雑に作りたいといった用途なら、smart client/dumb server モデルの恩恵を受けられるはず。

日本語

395

Murawaki@murawaki·21 Nis

Nostr、マスに届くことは絶対にないなと思いつつ、問題に対して単純な解を提供するところが気に入っていて、肩入れしたくなる。少なくとも Bluesky に移住するくらいなら Nostr の方が良い。

日本語

454

Murawaki@murawaki·21 Nis

雑に不穏なことを書くと、ブログに書くには短く、X 無料版の字数制限には引っかかる微妙な長さになりがち。そういうのは最近は Nostr に投げておしまいにしている。

日本語

542

Keşfet

@nlp_colloquium @KyotoU_News @s5yata @elonmusk @BarackObama @taylorswift13 @cristiano @BillGates