한동안 못봤는데 금요일에 재밌는 논문이 나왔습니다
FinTradeBench: A Financial Reasoning Benchmark for LLMs
현재의 LLM은 금융 내러티브(공시, 뉴스)를 해독하는 데는 전문가 수준에 도달했으나, 가격이 움직이는 물리적 동력(Time-series, Numerical dynamics)을 추론하는 데는 구조적인 결함이 있다.
대중들이 LLM에 주가 데이터를 프롬프팅하여 투자 결정을 내리려는 시도는 극도로 위험한 행동이다.
-----
저도 같은 생각이었습니다 언어추론모델이라서 생각과 많이 다르더군요 그래서 다른식으로 접근했습니다
바로 파이썬이죠
@choejy@nameEO 그런 논지에는 동의 합니다. 다만, 정확히는 RFP를 봐야 알겠지만 애당초 사례가 없는 걸 미리 잘될 거라고 가정하고 예산을 쳐내는 것도 위험하고 그렇다고 진행하면서 인력 줄어드는 게 투명하게 평가가 되어서 업체가 스스로 예산을 줄이는 게 가능할 지도 의문이네요. 기사로는 후자 같긴 한데요.
@choejy@nameEO 클로드 같은 모델이 어디까지 해 줄 수 있는지 잘은 몰라 조심스럽긴 합니다만 통상 코볼을 자바로 변환하는 게 텍스트 간 변환으로 충분하지 않을 것 같고 결국 사람이 변환된 코드 읽고 추가적인 검증, 고민을 해야 하는 거 아닌가 하는 의심이 들어서요.
Codex가 모델도 있고 코딩 에이전트도 있어서 개념이 헷갈릴 수 있는데 이 글이 너무 잘 설명한 것 같다.
또 Codex를 넘어 Agent, Harness라는 단어를 말하게 되고 Reasoning이 무엇이고 Reasoning Effort가 무엇인지 쉽게 설명해주는 좋은 글.