분류 전체보기55 [NLP] TF-IDF (Term Frequency - Inverse Document Frequency) 가 이번에 해커톤을 준비하면서 새롭게 알게 된 개념인데, 여튼 시작해보자. 텍스트를 컴퓨터가 이해할 수 있도록 재표현해주는 text representation 방법 중에서 vectorization approaches 의 하나로서 TF-IDF (Term Frequency - Inverse Document Frequency)이 무엇인지 그리고 수식에 대해서 알아보고, 간단한 예제 텍스트를 사용해서 이해해보자. TF-IDF (Term Frequency - Inverse Document Frequency) 개념 및 예시 먼저, 대표적으로 vectorization apporached 의 text representation 방법으로는 - One-Hot Encoding - Bag of Words (BoW) - Bag o.. 2023. 11. 7. [DL] Ground-Truth 개념 Intro Ground-truth는 기상학에서 유래된 용어로 어느한 장소에서 수집된 정보를 의미한다. Ground-truth는 보통 '지상 실측 정보'로 해석되며 인공위성과 같이 지구에서 멀리 떨어져서 지구를 관찰하였을 때 지구의 전체적인 관점을 보는 것에는 넓은 시야를 가질 수 있지만 실제 지면의 구조를 세밀하게 보는 것은 빛이 구름이나 대기를 통과하게 되면서 실제 모습이 왜곡되어 제대로 파악하는 것은 어렵다. 이러한 상황에세 지상 정보를 직접 측정한다면 보다 정확한 정보를 얻을 수 있고, 이러한 정보에 인공위성에서 관측된 데이터를 참조하여 사용한다면 좀 더 정확한 데이터를 얻을 수 있게 된다. ML에서의 Ground-Truth 예시 기계학습의 관점에서 보았을때 Ground-truth는 학습하고자 하는.. 2023. 11. 7. [Error] JVMNotFoundException: No JVM shared library file (jvm.dll) found. Try setting up the JAVA_HOME environment variable properly. 에러 konlpy를 이용하여 텍스트 분석 코딩을 하는도중 아래와 같은 에러를 만났다. 이 에러는 JAVA_HOME 경로에 jvm.dll 파일이 없어서 발생한 에러인데, 비교적 간단하게 해결할 수 있다. 해결과정 우선 JDK를 다운로드 받아야 한다. 아래 사이트로 이동해서 본인의 사양에 맞게 JDK를 다운로드 하세요. https://www.oracle.com/java/technologies/downloads/#java8 Download the Latest Java LTS Free Subscribe to Java SE and get the most comprehensive Java support available, with 24/7 global access to the experts. www.oracle.c.. 2023. 11. 7. 이전 1 ··· 6 7 8 9 10 11 12 ··· 19 다음