Sabitlenmiş Tweetかんぱさんだ@kampersanda·23 AğuMeCab互換で、より高速なRust製形態素解析器Vibratoをリリースしました!2倍以上の速度性能を記録しており、大規模なテキストデータをRustで高速に処理したい場合などにお使いいただけます。 github.com/daac-tools/vib…Çevir 日本語03231.2K0196
かんぱさんだ@kampersanda·16hdaachorseはジャーナルにも採択されてるので、技術仕様に興味がある人は読んでみて下さい。 arxiv.org/abs/2207.13870Çevir 日本語02161.7K10
かんぱさんだ retweetlediOdashi@odashi_t·16hdaachorseの開発者は全員シェルパに在籍しています。こういった高速処理や、データ処理の実際に向き合うのに興味のある方を歓迎します。 herp.careers/v1/cierpa0905/…Çevir 日本語1271.4K
かんぱさんだ retweetlediOdashi@odashi_t·16hdaachorseがHugging Face tokenizersの実装(added vocabの分析部分)に導入されました。条件次第で30倍も速くなるらしいです。daachorseは最近になって基礎ライブラリとしての採用が一気に増えたように思います。 github.com/huggingface/to…Çevir 日本語110535.7K19
かんぱさんだ@kampersanda·16hdaachorseがhuggingface/tokenizersに採用された。やったぜ。 github.com/huggingface/to…Çevir 日本語0115395
かんぱさんだ retweetledi水先案内人@江戸川@vbkaisetsu·17hHugging Faceのtokenizersで、高速パターンマッチのdaachorseが使われるようになった。 github.com/huggingface/to… もともと日本語形態素解析器のVaporettoから分離したライブラリだけど、ここまで使われるようになるとは。Çevir 日本語14311.7K4
かんぱさんだ retweetledi水先案内人@江戸川@vbkaisetsu·6d数年前にリリースした高速パターンマッチアルゴリズムのdaachorseがLLM業界で使われ始めていて、最近だとfastokenというtransformers向けの高速トークナイザーにも使われている github.com/Atero-ai/fasto…Çevir 日本語011594.6K32
かんぱさんだ@kampersanda·1 Nisふと気付いたけど、Linderaでdaachorse使ってくれてる! github.com/lindera/linderaÇevir 日本語0262.3K3
かんぱさんだ@kampersanda·1 Nis4/22にSansan×シェルパでアノテーションに関する共同勉強会を開催します!データ作成や評価に関心がある方々、是非ご参加下さい! sansan.connpass.com/event/387085/Çevir 日本語0364301
かんぱさんだ retweetlediシェルパ・アンド・カンパニー株式会社@cierpa_and_co·30 Mar4/22開催|Sansan × Cierpa共催勉強会📝 生成AIの精度を支える「データアノテーション」にフォーカスします。実運用に耐える評価データ設計や品質担保の実践知を各社が紹介!当社からはAI事業部の神田と櫻田が登壇します。 🗓️4/22(水)19:30〜 📍Sansan本社 ※Zoom配信あり sansan.connpass.com/event/387085/Çevir 日本語036453
かんぱさんだ retweetlediSansanTech@SansanTech·30 Mar4/22(水)19:30 より、シェルパ・アンド・カンパニー株式会社と共催で「高品質なAIを支えるアノテーション実践知の共有」を開催します! 「データアノテーション」に着目し、高品質なデータを効率よく生み出すための実践知をご紹介します✨️ 📍会場:Sansanオフィス(オンライン配信有り) sansan.connpass.com/event/387085/Çevir 日本語0771.9K2
かんぱさんだ@kampersanda·26 Marエンジニアリングインターンの浅野さんが #NLP2026 の参加レポートを書いてくれました!是非ご覧ください! tech.cierpa.co.jp/entry/2026/03/…Çevir 日本語03152.5K3
かんぱさんだ retweetlediシェルパ・アンド・カンパニー株式会社@cierpa_and_co·26 MarCierpaエンジニアブログ更新✏️ AI事業部インターンメンバーによる #NLP2026 参加レポートを公開しました。当社が発表した2件の研究の要点や注目論文も紹介しています。 天候❄️とは対照的な現地の熱気が伝わる記事です。 ぜひご覧ください! tech.cierpa.co.jp/entry/2026/03/…Çevir 日本語08114.2K2
かんぱさんだ retweetlediShinsuke Sugaya@shinsuke_sugaya·11 Mar久しぶりにFessの話で、今取り組んでいるAI検索モードの話をしようと思います。| Search Engineering Tech Talk 2026 Spring search-tech.connpass.com/event/385890/ #searchtechjpÇevir 日本語05111.1K2
かんぱさんだ@kampersanda·9 Mar#NLP2026 では以下の2件に関わってます。シェルパもゴールドスポンサーとして協賛してます。どうぞよろしくお願いします。 ・C2-24: Omni-JDocVQA: 多種多様な文書を含んだ日本語視覚文書理解ベンチマークの構築 ・Q4-10: ESG-QA: 日本語ESG文書を対象としたマルチモーダル質問応答ベンチマークの構築Çevir 日本語02162.7K1
かんぱさんだ retweetlediシェルパ・アンド・カンパニー株式会社@cierpa_and_co·9 Mar【#NLP2026 開催🚀】本日より栃木県宇都宮市で開催される言語処理学会で、当社はゴールドスポンサーを務めます。また、学会内では2件の研究論文の発表およびポスター掲示を行います。 cierpa.co.jp/posts/20260309Çevir 日本語024461