본문 바로가기

전체 글55

GPU, CUDA, cuDNN 버전 확인 GPU 버전 확인윈도우 명령 프롬프트에서 nvidia-smi을 입력하면 설치된 gpu version을 확인할 수 있다.nvidia-smi정리NVIDIA-SMI : nvidia-smi의 버전Driver Version : nvidia driver 버전 = GPU 버전CUDA Version : nvidia driver에 사용되기 권장되는 CUDA 버전(현재 버전이 아님)GPU : GPU에 매겨지는 번호로 0부터 시작Fan : GPU에 부착된 Fan이 가동되는 속도Temp : GPU의 온도(섭씨로 표기됨)Perf: GPU 성능 수준으로 P0부터 P12까지 존재, P0에 가까울수록 성능이 높아짐Pwr Usage / Cap : GPU가 현재 사용중인 전력 / GPU가 최대로 사용할 수 있는 전력Bud-Id : GP.. 2024. 7. 25.
[Git] Github License 적용하기 깃허브에서 repository를 만들면 처음에 라이선스를 만들 수 있다. 하지만 후에 직접 추가할수도 있다. 라이센스를 등록하는 이유코드 사용의 권한을 명확히 하고, 오픈소스에 대한 신뢰를 주는 수단사용, 복제, 수정, 배포 등의 행위에 대한 규칙을 명시개발자는 저작권을 지킬 수 있고, 다른 개발자가 사용 및 수정하는 것을 허용도 가능다음으로 License를 적용하는 방법을 알아보자. License 파일을 만들면 되는데 자세한 방법은 아래와 같다.  1. 먼저 저장소에 들어가서 "Add file"을 클릭해서 "Create new file"을 클릭한다.  2. License라고 파일명을 적는다.  License"라고 적으면 아래에 "Choose a license template"라는 새로운 버튼이 생긴다... 2024. 7. 22.
[PyTorch] torch.tensor.detach() https://pytorch.org/docs/stable/generated/torch.Tensor.detach.html torch.Tensor.detach — PyTorch 2.3 documentationShortcutspytorch.org  파이토치에서 Tensor 객체의 detach() 메소드는 현재 Tensor 객체와 동일한 데이터를 가지지만 연산 그래프(Computational Graph) 에서 분리된 새로운 Tensor 객체를 생성한다. 즉, 이 메소드는 일반적으로 Tensor 객체를 다른 Tensor 객체로 변환하고자 할 때 사용된다.  자세히 설명해보면, 주어진 Tensor 객체에 대한 연산의 결과로 생성된 새로운 Tensor 객체가 있을 때, 이 새로운 Tensor 객체를 사용하여 추가적인.. 2024. 7. 17.
[Git] gwarning: adding embedded git repository: 에러 메시지git add . 중 다음과 같은 에러를 마주했다.warning: adding embedded git repository: not-MIWAE/dimvaehint: You've added another git repository inside your current repository.hint: Clones of the outer repository will not contain the contents of hint: the embedded repository and will not know how to obtain it. hint: If you meant to add a submodule, use: hint: hint: git submodule add not-MIWAE/dimvae hint: .. 2024. 7. 17.
[ML] SMOTE 를 알아보자 현실 세계의 데이터는 생각보다 이상적이지 않다.  데이터에서 각 클래스의 개수가 현저하게 차이가 난 상태로 모델을 학습하면, 다수의 범주로 패턴 분류를 많이하게 되는 문제가 생기고 이는 곧 모델의 성능에 영향을 끼치게 된다.  이번에는 불균형 데이터 (imbalanced data) 의 문제를 해결할 수 있는 SMOTE(Synthetic Minority Oversampling TEchnique)에 대해서 설명해보고자 한다. 0. Undersampling vs. Oversampling SMOTE는 대표적인 오버 샘플링 기법 중 하나이므로 먼저 오버 샘플링과 언더 샘플링의 개념을 알아보고자 한다. 언더 샘플링과 오버 샘플링은 클래스 불균형을 해결하기 위한 기법 중 하나이다. 언더 샘플링(Undersamplin.. 2024. 7. 8.
[sklearn] KNNImputer https://scikit-learn.org/stable/modules/generated/sklearn.impute.KNNImputer.html KNNImputerGallery examples: Release Highlights for scikit-learn 0.22 Imputing missing values before building an estimatorscikit-learn.orghttps://github.com/scikit-learn/scikit-learn/blob/2621573e6/sklearn/impute/_knn.py#L20 scikit-learn/sklearn/impute/_knn.py at 2621573e60c295a435c62137c65ae787bf438e61 · scikit-lear.. 2024. 6. 23.
CLAIM Your Data: Enhancing Imputation Accuarcy with Contextual Large Language Models https://arxiv.org/abs/2405.17712 CLAIM Your Data: Enhancing Imputation Accuracy with Contextual Large Language ModelsThis paper introduces the Contextual Language model for Accurate Imputation Method (CLAIM), a novel strategy that capitalizes on the expansive knowledge and reasoning capabilities of pre-trained large language models (LLMs) to address missing data challengarxiv.org Abstract 사전 훈련된.. 2024. 6. 12.
Missing Data Imputation with Uncertainty-Driven Network https://dl.acm.org/doi/pdf/10.1145/3654920  Keywords: Missing Data Imputation, Neural Network Gaussian Process 데이터셋의 완전성을 달성하기 위해 누락된 데이터를 대치하는 것을 목표로 하는 데이터 품질 영역의 기본 작업인 누락 데이터 대체 문제를 연구한다. 비록 최근의 분포 모델링 기반 기술 (분포 생성 및 분포 매칭)은 대치 정확도 측면에서 최첨단 성능을 달성할 수 있지만, (1) 누락된 데이터 대체에 과적합되는 경향이 있는 정교한 딥러닝 모델을 배포하는 점과 (2) 지역정보(local information)을 간과하면서 전역정보 (global information) 에 직접적으로 의존한다는 점을 주목한다. 누락된 데.. 2024. 6. 10.
[NLP] DPR: Dense Passage Retrieval for Open-Domain Question Answering 현재 Retrieval 쪽을 공부할 일이 생겨서 오랜만에 논문 리뷰 글을 써본다. 이번 게시물에서는 DPR을 제안한 논문인 Dense Passage Retrieval for Open-Domain Question Answering 논문이다. https://arxiv.org/abs/2004.04906 Dense Passage Retrieval for Open-Domain Question AnsweringOpen-domain question answering relies on efficient passage retrieval to select candidate contexts, where traditional sparse vector space models, such as TF-IDF or BM25, are .. 2024. 5. 26.