본문 바로가기

분류 전체보기55

CLAIM Your Data: Enhancing Imputation Accuarcy with Contextual Large Language Models https://arxiv.org/abs/2405.17712 CLAIM Your Data: Enhancing Imputation Accuracy with Contextual Large Language ModelsThis paper introduces the Contextual Language model for Accurate Imputation Method (CLAIM), a novel strategy that capitalizes on the expansive knowledge and reasoning capabilities of pre-trained large language models (LLMs) to address missing data challengarxiv.org Abstract 사전 훈련된.. 2024. 6. 12.
Missing Data Imputation with Uncertainty-Driven Network https://dl.acm.org/doi/pdf/10.1145/3654920  Keywords: Missing Data Imputation, Neural Network Gaussian Process 데이터셋의 완전성을 달성하기 위해 누락된 데이터를 대치하는 것을 목표로 하는 데이터 품질 영역의 기본 작업인 누락 데이터 대체 문제를 연구한다. 비록 최근의 분포 모델링 기반 기술 (분포 생성 및 분포 매칭)은 대치 정확도 측면에서 최첨단 성능을 달성할 수 있지만, (1) 누락된 데이터 대체에 과적합되는 경향이 있는 정교한 딥러닝 모델을 배포하는 점과 (2) 지역정보(local information)을 간과하면서 전역정보 (global information) 에 직접적으로 의존한다는 점을 주목한다. 누락된 데.. 2024. 6. 10.
[NLP] DPR: Dense Passage Retrieval for Open-Domain Question Answering 현재 Retrieval 쪽을 공부할 일이 생겨서 오랜만에 논문 리뷰 글을 써본다. 이번 게시물에서는 DPR을 제안한 논문인 Dense Passage Retrieval for Open-Domain Question Answering 논문이다. https://arxiv.org/abs/2004.04906 Dense Passage Retrieval for Open-Domain Question AnsweringOpen-domain question answering relies on efficient passage retrieval to select candidate contexts, where traditional sparse vector space models, such as TF-IDF or BM25, are .. 2024. 5. 26.