starting github discussion for easier elicitation of expert opinion #20
Replies: 1 comment 3 replies
-
sbc가 잘 되면 외부 환경적 요소를 무시할만하다로 결론을 낼수도 있다 생각했는데, sbc가 잘 안 나와서 고민이 많았거든요. 그럼 역으로 잔차에 해당하는 환경적 요소를 현재 y와 sbc를 통과하는 y에 해당하는 부분으로 역산하는게 가능할까요? 잔차를 역으로 계산해서 데이터에서 제거하는거죠
음 general한 논리인데요, 보통 통계모델이 데이터를 잘 설명했는지를 잔차분석을 이용해 하거든요. 보통은 잔차가 등분산성을 따르지 않으니 이 통계모델은 데이터를 잘 설명하지 못함. 이라는 결론을 내는데, 이를 역으로 생각하면, 이 기준으로 model comparison을 하거나 더 맞는 모델로 업데이트하는 기작으로 이용할수도 있어요. 즉 링크의 여러 기준 (선형성, 등분산성 등)을 혼합해 "바람직한 잔차의 정도"를 수치화해, 여러 candidate 통계모델 (e.g. feature engineering 할때 처럼요)중 가장 나은걸 고르는 작업은 충분히 가능해요. 이 아이디어를 아래 bayesian workflow에 적용하면, 세개의 test (그림의 t1,t2, t3) 를 통과한 모델을 "쓸만한다"고 생각할수 있는데, t1: prior predictive check: t2: simulation-based calibration: t3: y와 이 테스트를 모두 통과한 (통계모델, 데이터) pair는 쓸만하다 인정해줍니다. 그래서 제 제안은 t1, t2, t3가 통과하게 하는 방향으로 통계모델을 업데이트 시켜보자는 뜻이었어요. 현재 t2 (sbc)통과 안되는게 가장 큰 문제니까요. |
Beta Was this translation helpful? Give feedback.
-
👋 Welcome!
We’re using Discussions as a place to connect with other members of our community. We hope that you:
build together 💪.
To get started, comment below with an introduction of yourself and tell us about what you do with this community.
modularizing
Seoyeon_revisionproposal.pdf
is one attempt
Beta Was this translation helpful? Give feedback.
All reactions