본문 바로가기

Statistics4

CLAIM Your Data: Enhancing Imputation Accuarcy with Contextual Large Language Models https://arxiv.org/abs/2405.17712 CLAIM Your Data: Enhancing Imputation Accuracy with Contextual Large Language ModelsThis paper introduces the Contextual Language model for Accurate Imputation Method (CLAIM), a novel strategy that capitalizes on the expansive knowledge and reasoning capabilities of pre-trained large language models (LLMs) to address missing data challengarxiv.org Abstract 사전 훈련된.. 2024. 6. 12.
Missing Data Imputation with Uncertainty-Driven Network https://dl.acm.org/doi/pdf/10.1145/3654920  Keywords: Missing Data Imputation, Neural Network Gaussian Process 데이터셋의 완전성을 달성하기 위해 누락된 데이터를 대치하는 것을 목표로 하는 데이터 품질 영역의 기본 작업인 누락 데이터 대체 문제를 연구한다. 비록 최근의 분포 모델링 기반 기술 (분포 생성 및 분포 매칭)은 대치 정확도 측면에서 최첨단 성능을 달성할 수 있지만, (1) 누락된 데이터 대체에 과적합되는 경향이 있는 정교한 딥러닝 모델을 배포하는 점과 (2) 지역정보(local information)을 간과하면서 전역정보 (global information) 에 직접적으로 의존한다는 점을 주목한다. 누락된 데.. 2024. 6. 10.
등회귀 (Isotonic Regression) Intro X와 Y의 관계가 선형이 아닌, 비선형(non-linear) 문제는 어떻게 해결해야할까? 비선형 회귀의 종류는 다음과 같다. 등회귀(Isotonic Regression) 비선형이고, x가 커질 때 y도 같이 커지는(monotonous increase) 경우 다항회귀(Polynomial Regression) 비선형이고, non-monotonous일 경우 국소 회귀(Local Regression) 비선형이지만 국소 지역에 한해서 선형 관계를 띈다고 가정할 경우 이번 포스팅에서는 등회귀(Isotonic regression)에 대해 알아보자. 등회귀와 PAVA 등회귀의 isotonic의 어원을 살펴보자. “iso” 는 ‘동일하다’ 는 그리스어에서 파생되었고, “tonos” 는 ‘잡아늘이다’ 라는 뜻이.. 2023. 12. 15.