Murawaki

2.6K posts

Murawaki banner
Murawaki

Murawaki

@murawaki

Native of Kobe; NLP and Computational Linguistics

Kyoto, Japan Katılım Nisan 2009
100 Takip Edilen887 Takipçiler
Murawaki
Murawaki@murawaki·
言語地図を作るのに調査地点の緯度経度を特定する必要があるのだけど、面倒なので生成AIで自動化できませんかね、というほのぼのとした相談を受けている間に、米国は爆撃地点の選定を生成AIで自動化し、しかも誤って女学校を標的にして子供を爆殺しまくっているという現実。何か根本的に発想が違う。
日本語
0
2
8
725
Murawaki
Murawaki@murawaki·
書いた。というか、Grok に調べさせて ChatGPT にまとめさせた。 平山優は弥助問題で科学コミュニケーションに失敗した njump.me/nevent1qqspfqs…
日本語
0
3
8
1.2K
Murawaki
Murawaki@murawaki·
このままエネルギー危機が続くと、AI 研究のための大型計算機利用なんて真っ先に止められるんちゃうの。
日本語
0
0
2
274
Murawaki
Murawaki@murawaki·
『現代社会を生きるための AI×哲学』 amzn.to/3MrUrM9 著者のご恵贈にあずかった。講義の教科書にするという話。AI の本を書くということは一瞬で陳腐化するリスクと向き合うこと。比較的長持ちしそうな基礎を抑えている印象。 批判的な議論は Nostr の方で。 njump.me/nevent1qvzqqqq…
日本語
0
0
0
762
Murawaki
Murawaki@murawaki·
NAACL が 2024 年に North American Chapter から Nations of the Americas Chapter に名前を変更していたのに今更気づいた。2025 年の予稿集を確認していて。 naacl.org/posts/2024-10-…
日本語
0
5
10
1.4K
Murawaki
Murawaki@murawaki·
山ほど仕事を積んだうえで、「仕事をしないとお前の共著を desk reject するぞ」と脅す、脅迫ドリブン査読。すでに死に体の査読システムを維持するために頑張っているのはわかるが、もう限界やろという気分が強まる。
日本語
0
3
5
1.7K
NLPコロキウム
NLPコロキウム@nlp_colloquium·
🚀次回の #NLPコロキウム のお知らせ 講演者: 村脇有吾さん @murawaki (@KyotoU_News) 日時: 12/17 (水) 12:00–13:00 JST 言語モデルで出力した一見自然なテキストに秘密のメッセージを忍ばせる『言語ステガノグラフィ』の基本、実用化の壁、展望について紹介いただきます🔐nlp-colloquium-jp.github.io//schedule/2025…
日本語
2
11
30
9K
Murawaki
Murawaki@murawaki·
ここ1か月ほど、自分や研究室内外の同僚や学生が次々とインフルにかかって、いろいろ支障が出ていた。ここまでの流行はちょっと記憶にない。
日本語
0
1
0
354
Murawaki
Murawaki@murawaki·
この日本にシベ語母語話者の夫婦が住んでいて、家庭内で日常的にシベ語を使っているという衝撃の報告。動画内で突然シベ語会話が始まってテンション爆上げ。動画を上げている子供には継承されていない。 youtube.com/watch?v=vvoBca…
YouTube video
YouTube
日本語
0
10
25
4.2K
Murawaki
Murawaki@murawaki·
arxiv.org/abs/2510.20075 いくらプレプリントで、専門が言語処理でもセキュリティでもないといっても、従来研究に気づかないままこの長さの原稿を書けるものなのか? 無駄に凝った手法 (Meteor) を引用しているのも謎。本来引用すべき Fang et al. (2017) や Ziegler et al. (2019) まで1ホップなのに。
日本語
1
2
12
3.3K
Murawaki
Murawaki@murawaki·
EMNLP Main に採択。LLM が生成したトークン列を detokenize し、もう一度 tokenize したとき、元のトークン列が再現されない現象がそれなりの頻度で起きる。この現象はステガノグラフィのでは致命的。ウォーターマーキングでも検出力が低下。両タスクに応じた解法を提案。arxiv.org/abs/2508.20718
日本語
0
12
72
12.7K
Murawaki
Murawaki@murawaki·
@s5yata ちょうど私も先月同じ問題にはまりました。私の場合は Queue を SimpleQuque に置き換えたら解決したっぽいです。
日本語
1
0
0
110
Susumu Yata
Susumu Yata@s5yata·
wikiextractor に jawiki のダンプを入れると途中で出力が止まってしまう問題に対して,とりあえずの回避策を見つけられたみたい.以前は 3.3G で止まっていたけど,今見たら,まだ処理中なのに 6.6G になっている. github.com/s-yata/wikiext…
日本語
2
0
1
218
Murawaki
Murawaki@murawaki·
『統計的テキストモデル』第2刷 p.151 脚注87: GPT-3のような現在の強力なマスク化言語モデル -> BERT? このあたりの議論にふんわりと結びつけようとしているのかなと推測 kyunghyuncho.me/bert-has-a-mou…
日本語
0
0
2
556
Murawaki
Murawaki@murawaki·
ジョチがチンギス・ハンの実子であることと整合的な結果が遺跡個体のゲノム解析から得られたという報告。いろいろ不確定要素があって断定は避けているが。biorxiv.org/content/10.110…
日本語
0
0
4
541
Murawaki
Murawaki@murawaki·
Manning が長年講義してきたことで有名な Stanford CS224N だが、今年はついに constituency parsing が完全消滅した。去年までは Socher の recursive モデルの説明のためにかろうじて生き残っていたのに。web.stanford.edu/class/cs224n/
日本語
0
3
18
2.5K
Murawaki
Murawaki@murawaki·
Nostr は NLP にも使えそう。とにかく人がいないのでネットワーク解析系は駄目だけど、被験者実験のために SNS のモックアップを雑に作りたいといった用途なら、smart client/dumb server モデルの恩恵を受けられるはず。
日本語
0
0
0
395
Murawaki
Murawaki@murawaki·
Nostr、マスに届くことは絶対にないなと思いつつ、問題に対して単純な解を提供するところが気に入っていて、肩入れしたくなる。少なくとも Bluesky に移住するくらいなら Nostr の方が良い。
日本語
1
0
0
454
Murawaki
Murawaki@murawaki·
雑に不穏なことを書くと、ブログに書くには短く、X 無料版の字数制限には引っかかる微妙な長さになりがち。そういうのは最近は Nostr に投げておしまいにしている。
日本語
2
0
0
542