Seapy

5.4K posts

Seapy banner
Seapy

Seapy

@seapy

Co-founder & CTO at 당근(Karrot)

Korea Katılım Şubat 2009
610 Takip Edilen1.6K Takipçiler
Seapy
Seapy@seapy·
Unsloth의 Gemma4 MTP GGUF 소식을 보고, DGX Spark에서 실제로 얼마나 빨라지는지 테스트해봤습니다. - 12B Dense: 1.92x - 26B-A4B MoE: 1.16x - 31B Dense: 2.22x MTP는 dense 모델에서 효과가 컸고, 26B-A4B는 MoE라 이미 빠른 편이라 추가 이득이 작았습니다. 번역 제목 벤치에서는 품질 저하도 거의 안 보였습니다. seapy.com/gemma4-mtp-den…
한국어
0
0
1
66
Seapy
Seapy@seapy·
DGX Spark 에서 만만한 Gemma 4 가지고 실험하는거 말고 좀더 큰것들도 해보고 싶다. Gemma 4 는 실험하고 마는거고 Kimi 나 MiniMax 같은거는 실 사용도 해보면서 경험 할수 있을거 같은데 로컬이나 클라우드에 직접 돌렸다가는 가성비도 안나오고 속도도 느리겠지
한국어
1
1
12
619
Seapy
Seapy@seapy·
@nacyotKim Codex 모델 성능 잘나오면 코덱스 200 오르는건가요.
한국어
1
0
0
110
Daegwon Nacyot Kim
Daegwon Nacyot Kim@nacyotKim·
아내가 코덱스를 샀다고 하길래... 응? 응? 뭘 샀다고? 코덱스 200 😂 아... 그것도 코덱스였지.
한국어
3
1
12
1K
Seapy
Seapy@seapy·
다양한 LLM 모델을 써본다는 게 생각보다 쉽지 않다. 벤치마크도 참고는 되는데 결국 내가 직접 느껴봐야 하고, 그러려면 같은 일을 여러 모델에 반복해서 시켜봐야 한다. 근데 이게 은근히 어렵다. 차이가 미묘하면 이게 진짜 차이인지도 잘 모르겠고. 그래서 대부분은 그냥 사람들이 좋다고 하는 모델을 몇 개 써보고 마는 것 같다. 반대로 계속 여러 모델을 써보는 사람들은 모델의 변화에 대한 감각을 조금씩 쌓아가는 느낌이고. 요즘 내가 느끼는 건, 일정 수준 이상의 모델이라면 모델 자체의 차이도 있지만 사람이 스티어링을 잘하면 결과가 꽤 비슷해지는 경우도 많다는 점이다. 그런데 Hermes 같은 에이전트 시스템을 쓰다 보면, 앞으로는 그 스티어링의 일부도 사람이 아니라 시스템이 해주게 될 것 같기도 하다.
한국어
0
3
18
1.1K
Seapy
Seapy@seapy·
X API로 글을 쓰는 비용, 공식 pay-per-use 기준으로 일반 포스트는 $0.015(약 23원), URL 포함 포스트는 $0.200(약 303원)입니다. 참고로 이 글도 API로 올렸으니 방금 23원 썼습니다. 💸
한국어
0
2
6
733
Seapy
Seapy@seapy·
이번 주에 안 그래도 DJI Pocket 4P 예약 진행한다는 문자를 받았는데, 예전처럼 그냥 출시 후 사는 게 아니라 예약을 받는 걸 보니 물량이 부족한 건지, 수요를 가늠하려는 건지 좀 궁금하네요. dpreview.com/news/488902391…
한국어
0
0
2
595
Brian Hong
Brian Hong@serialx_net·
@seapy @Outsideris 훈련 데이터 공유 동의하셨으면 주행영상도 중간중간 올리는거 같더라고요.
한국어
1
0
0
24
Seapy
Seapy@seapy·
테터링 30기가 까지 제대로 사용해본적이 없어서 30기가 테터링 되는게 필요한가 싶었는데, 오늘 테슬라 업데이트할때 Mudi 7에 테터링으로 하니까 10기가 금방 넘고, 외부에서도 무료 와이파이 안쓰고 Mudi 7 사용하니까 조금씩 사용량이 높아짐. 크기만 좀 작았으면 Mudi 7 참 좋은데...
한국어
1
0
5
1.5K
Seapy retweetledi
AICodeKing
AICodeKing@aicodeking·
GLM-5.2 on KingBench (3). Thoughts: The model has superb taste. It is greater at UX than UI. The code is always very clean. It is great at One-shot wonders. I asked it to fine-tune a whole local model and it did it in 30mins! This is just a great model to use all-round. 1/n
AICodeKing tweet media
English
53
103
1.5K
172.7K
Seapy
Seapy@seapy·
@Outsideris 평소에는 운전을 짧게해서 업데이트 잘 안되더니 주차하고 안에 mudi7 넣고 나가니까 잠겨 있을때 오히려 꾸준하고 빠르게 다운로드 받는거 같더라고요.
한국어
1
0
0
256
Outsider
Outsider@Outsideris·
@seapy 오! 테슬라 업데이트할 때 편하겠군요. 핸드폰을 놔두고 올수는 없어서 평소에 귀찮았는데요.
한국어
1
0
0
900
Seapy
Seapy@seapy·
@subicura 미국으로 가도 미국인 아니면 안되는거 아닌가요?
한국어
0
0
1
287
Seapy
Seapy@seapy·
모델 몰아서 나오는 시즌이네. 마침 Fable5 사용도 불가능해졌는데 GLM 5.2, Kimi 2.7, MiniMax 3 같은거 나와서 사람들 관심은 어차피 못쓰는 Fable5 보다는 GLM 쪽 해볼것도 같고요.
Max For AI@MaxForAI

刚刚 @Zai_org 发布了GLM5.2🔥🔥🔥 GLM-5.2 是智谱迄今能力最强的开源模型,支持真正可用的 1M 上下文,并在长程任务中继续保持领先。 它也依旧是我们心中最强的中国 Coding 模型。 今晚 5:21(北京时间)GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite / Pro / Max / 团队版。 GLM-5.2 API 将于下周上线,模型下周正式开源,遵循 MIT 协议。 在一些前沿模型突然变得不可用的时刻,他们选择相信另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。 它应该开放、可用、可构建,并服务于每一位开发者。 🫡真正的人类之光

한국어
3
1
22
3.5K
Seapy
Seapy@seapy·
@samyeonggu gpt 가 우선 그렇고 claude 는 조금은 좋은데 api 로 볼 방법이 없었는데 지금은 개선이 되는것 같기도 하고요.
한국어
0
0
0
35
Hugh
Hugh@samyeonggu·
@seapy 어떤 서비스인데 안 나오나요?
한국어
1
0
0
8
Seapy
Seapy@seapy·
아오 정말 LLM 종량제 엔터프라이즈 힘드네요. 개인별 리밋, 조직 전체 리밋 도달 알림 계속 오고... 리밋 걸린거 요청이나 메일 올때마다 그냥 DGX Spark 한대씩 가지고 무제한으로 알아서 쓰는게 고민 덜할거 같다 싶은데, 아직 모델들이 그정도 수준이 안되는거 같고, 오픈 모델들이 잘되야 가격경쟁도 되서 이런 고민 덜할듯해서 계속 지켜보는중
한국어
6
1
57
8K