Alysson

58.2K posts

Alysson banner
Alysson

Alysson

@leastsquared_

personal account. nlp. ai/ml. optimization. researcher. literature.

Internet Sumali Mart 2011
7.5K Sinusundan1.3K Mga Tagasunod
Naka-pin na Tweet
Alysson
Alysson@leastsquared_·
"Torna-te quem tu és."
Alysson tweet media
Português
0
1
1
259
Alysson nag-retweet
ThePrimeagen
ThePrimeagen@ThePrimeagen·
all the CEOs sacrificing sleep at the alter of productivity, is most certainly going to back fire. So much of decision making degrades as you get less sleep and no, you don't get "use to it." You just remain in a perpetual bad state.
English
69
41
878
24K
Scarlet
Scarlet@scarletrosedev·
Aqui na @growlyoficial temos um agente que periodicamente realiza testes em staging e produção como um usuário real, identifica falhas, gera um report e cria issues caso algo esteja errado. Como vocês estão fazendo?
Scarlet tweet mediaScarlet tweet media
Português
8
4
64
3.8K
Alysson
Alysson@leastsquared_·
Daria ainda pra ir mais a fundo e fazer uma análise metacognitiva pra identificar ONDE e o QUE começou a causar a resposta errada/não seguir o comportamento esperado analisando os logits do output da LLM 😁
Alysson@leastsquared_

Sobre o eval: - relevância: embedding das frases, e calcula sim(si, O)/somatório(SJ, O); - redundância: sim(si, sj) para todos os s em S - informatividade: entropia da relevância O = centro ou média do embedding de todo o texto, é um "resumo" temático S = conjunto de frases

Português
0
0
0
131
marília hacker de goianinha
me digam músicas brasileiras pra eu apresentar pra meus amigos russos e mudar a vida deles
marília hacker de goianinha tweet media
Português
13
0
16
803
Alysson
Alysson@leastsquared_·
Ah, e sim = similaridade de cosseno
Português
0
0
0
7
Alysson
Alysson@leastsquared_·
São métricas da tarefa de resumo extrativo de texto que podem ser aplicadas pra reduzir/alterar prompts pra ter melhores resultados sem o trabalho de corno de trocar um "a", testa 1x e vê se melhorou/piorou
Português
1
0
0
18
Alysson
Alysson@leastsquared_·
Sobre o eval: - relevância: embedding das frases, e calcula sim(si, O)/somatório(SJ, O); - redundância: sim(si, sj) para todos os s em S - informatividade: entropia da relevância O = centro ou média do embedding de todo o texto, é um "resumo" temático S = conjunto de frases
Alysson@leastsquared_

Diante disso fiz: - avaliador a priori de prompts, usando métricas de relevancia, redundância e informatividade sobre as frases; - avaliador a posteriori ou experimental, pra gerar ≥ 35 resultados com o prompt antes/depois e avaliar com true/false se teve o resultado esperado

Português
1
0
0
181
Alysson
Alysson@leastsquared_·
@vittheactivist O Ecchi é "necessário", mas infelizmente só mostra pq isso lá pra reta final nos últimos episódios.
Português
0
0
0
16
Alysson
Alysson@leastsquared_·
@renatarsilvax Usam geralmente na academia *as vezes*, e uns random fora. É bem nichada. No site tem mt info sobre essas coisas tb
Português
0
0
0
34
Maki
Maki@renatarsilvax·
Alguém trabalha ou já trabalhou, com a linguagem Julia?
Português
32
6
103
26K
Alysson
Alysson@leastsquared_·
Infelizmente, ninguém tá nem aí pra resultado objetivo e estatisticamente significativo
GIF
Português
1
0
3
46
Alysson
Alysson@leastsquared_·
Daí vejo se a alteração melhorou de fato e tenho artefatos pra mostrar quantitativamente e até visualmente Diferente desses avaliadores SUBJETIVOS de frameworks como langsue, que simplemente chama um modelo e fala "ah, de uma nota aí de 0 a 10 se a resposta foi correta rsrs"
Português
1
0
4
69
Alysson
Alysson@leastsquared_·
@Atsushi_Ohkubo おめでとうございます!素晴らしかったです!
日本語
0
0
0
21
大久保篤/Atsushi Ohkubo
大久保篤/Atsushi Ohkubo@Atsushi_Ohkubo·
アニメの制作に携わった皆様お疲れさま! そして何より、 炎炎ノ消防隊に最後まで付き合ってくれたファンや別にファンじゃなかった方もガチでお疲れさま! そして僕もお疲れ! また炎炎のプロジェクトやら別件でなんかあったら、いつもみたいに宣伝しに現れるねー! そん時はよろしく!バイバイ!!
日本語
514
5.2K
36.1K
1.2M