Super PINTO

42.4K posts

Super PINTO banner
Super PINTO

Super PINTO

@PINTO03091

Hobby Programmer. Caffe, Tensorflow, NCS, RaspberryPi, Latte Panda, ROS, DL, TPU, OpenVINO. Intel Software Innovator. The remarks are my personal opinion.

Aichi, Japan Katılım Ekim 2018
97 Takip Edilen14K Takipçiler
Super PINTO
Super PINTO@PINTO03091·
Googleニュースを見て寝る。日本はもう午前0時過ぎだ。
日本語
1
0
5
2.2K
Super PINTO
Super PINTO@PINTO03091·
@_artursemh Check out my post from yesterday. I'm planning to try it with the next generation of models.
English
1
0
2
92
artur
artur@_artursemh·
@PINTO03091 did you annotate the hands landmarks too?
English
1
0
0
86
Super PINTO
Super PINTO@PINTO03091·
だいぶ良くなってきた。オーグメンテーションを有効にしたまま学習を終えたほうが良い状態になるのかもしれない。
Super PINTO tweet media
日本語
5
5
82
8.2K
Super PINTO
Super PINTO@PINTO03091·
@Kumar4Vruddhi47 Yes. This is because I want to prevent data ownership issues from arising and release it as open-source software with an easy-to-use license.
English
0
0
0
89
Kumar
Kumar@Kumar4Vruddhi47·
@PINTO03091 And it is all for open source ? Salute 🫡
English
1
0
0
82
Super PINTO
Super PINTO@PINTO03091·
ちなみに目安として、僕が画像7枚をアノテーションするのに必要だった作業時間は4時間30分です。
日本語
3
1
51
9.1K
Super PINTO
Super PINTO@PINTO03091·
@fng_z This model doesn't confuse left and right even in first-person view. The purple square represents the right, and the green square represents the left. However, I think there is still a lack of test patterns and training data. x.com/PINTO03091/sta…
Super PINTO@PINTO03091

@pzoltowski I'm creating data to destroy all past models.

English
0
0
0
81
fabi
fabi@fng_z·
@PINTO03091 Sorry if this was asked before — if I feed your model a first-person POV video (seeing the user’s own body/hands), will it still label body parts correctly, or can the unusual / mirror-like perspective flip left-right labels?
English
1
0
0
78
Super PINTO
Super PINTO@PINTO03091·
学習中の重みで 7500枚 のテスト画像を目視検査して後処理のキーポイント接続判定の実装が不十分だったので一部調整した。距離的に手前に居るインスタンス上に遠方側のオクルージョンしているインスタンスのキーポイントを透視できてしまうモデルのため、キーポイントペアの選択順序が若干面倒。
Super PINTO tweet media
日本語
1
1
31
4.3K
Super PINTO
Super PINTO@PINTO03091·
精度高く綺麗に骨格検出することなんて最初から目的としていないです。目的は、データフォーマットを全て cx, cy, w, h のみで定義し、あらゆるアーキテクチャで同じデータを流用してアーキテクチャサーフィンすることです。どうせ3カ月に1回ぐらいの頻度でSOTAを主張する論文が出るんだから。
日本語
0
1
49
3.7K
Super PINTO
Super PINTO@PINTO03091·
僕は、本業ではチームワークをとても重視する考え方を持つタイプだということを一応伝えておく。職人技はその次。
日本語
0
2
41
3.4K
Super PINTO
Super PINTO@PINTO03091·
I created everything manually. Outsourcing would have increased the cost of reviewing the finished product. I wanted to create it myself from the start, incorporating my own biases. In the process of generating and verifying the model step by step, I revised the data creation criteria more than three times and redid the annotations many times. If I had reviewed someone else's work, my criticisms would have been so detailed that the worker would have gone crazy. This isn't about monetary or time costs. I'm only interested in creating the highest quality data.
English
0
0
2
202
Kumar
Kumar@Kumar4Vruddhi47·
@PINTO03091 where do you obtain the training data from ? isnt it cheaper to ask data annotation companies to do this for you as they have cheap labour ?
English
1
0
0
152
Super PINTO
Super PINTO@PINTO03091·
スタックチャンの勢いが凄すぎるのは気の所為だろうか… あと、半角カタカナの表現が正しいの?在庫が無いっていう悲鳴がたくさん聞こえるけど、持っているのに遊んでないのは僕だけかもしれない…
日本語
2
1
19
3.6K
Super PINTO
Super PINTO@PINTO03091·
うーん、NVIDIA B300 VRAM 288GB が欲しい。
日本語
3
2
41
4.8K
Super PINTO
Super PINTO@PINTO03091·
トップダウン方式のインスタンスセグメンテーションのほうが精度が高いのは当たり前なんだけど、インスタンス数に応じて推論時間が大幅に変わるのが許容できなかった。だからボトムアップ方式なおかつ3タスク合成のユニファイドモデルにしている。
日本語
0
2
20
4.1K
Super PINTO
Super PINTO@PINTO03091·
@pengadaptasian All joint areas of the human body were created using only bounding boxes (cx, cy, w, h). Instance masks were created using a custom-built CNN via a different path than the bounding boxes, and then synthesized using a data loader during training.
English
2
0
1
214
Super PINTO
Super PINTO@PINTO03091·
@Jun_Ohashi ノイズからノイズを生成するループになるので、僕はあまり良策ではないと判断しました。
日本語
1
1
8
1.1K
Jun Ohashi 
Jun Ohashi @Jun_Ohashi·
@PINTO03091 VLMでデータセットを作るのにトライ中ですが、ぜんぜん思うように行ってくれないです LLMでコード書いてても、もういい俺がやる!てなるし、AI向いてないかもしれません
日本語
1
0
5
1.1K
Super PINTO
Super PINTO@PINTO03091·
VLMでできる、と主張している人は、1ピクセル未満のサブピクセルレベルのアノテーションを試してから言ったほうが良い。
日本語
2
9
136
13.2K
Super PINTO
Super PINTO@PINTO03091·
@airkatakana @giffmana @skalskip92 In my case, the original image resolution needed to be less than VGA. VLM couldn't handle that. Width x Height = 480x360 Left: Original image at 1x magnification Right: Image enlarged 11 times
Super PINTO tweet mediaSuper PINTO tweet media
English
3
2
108
4.8K
Super PINTO
Super PINTO@PINTO03091·
物体検出だけでこういうのができるのはかなり凄いことだと思うけど、ほぼ良さは伝わらないだろうな。
Super PINTO tweet media
日本語
13
35
889
142.3K
Super PINTO
Super PINTO@PINTO03091·
さぁ、月曜日。仕事するよ。
日本語
0
0
11
6.3K