본문 바로가기

전체 글

(17)
자연어처리, 임베딩, 원핫벡터, 워드투벡터 개념 정리 One-hot vector와 Word2vec은 모두 자연어 처리 분야에서 사용되는 기법입니다. One-hot vector는 단어를 숫자로 인코딩하는 방법입니다. 예를 들어, 문장에는 I love apples와 I love bananas가 있는 경우, 단어 love를 인코딩하는 방법은 love가 등장하는 위치에만 1로 표시된 벡터를 만드는 것입니다. 이 방법은 단어의 의미나 문맥 정보를 고려하지 않기 때문에, 단순한 통계 기반 처리 모델에 적합합니다. 반면에 Word2vec은 단어 임베딩 방법론 중 하나로, 단어의 의미와 문맥 정보를 파악하는 방법입니다. Word2vec 모델은 주변 단어와의 관계를 학습하여 단어를 벡터 공간에 매핑합니다. 이 방법은 단어 간 의미 관계를 파악할 수 있어, 단순한 통계 기반..
시그모이드, 소프트맥스, 하이퍼볼릭탄젠트 등 활성화 함수 개념 총 정리 활성화 함수(Activation Function)는 인공 신경망에서 입력 신호를 전달받아 가중치를 적용한 후, 출력 값을 결정하는 함수입니다. 즉, 신경망의 출력 값을 결정하는 핵심적인 역할을 합니다. 인공 신경망에서 주로 사용되는 활성화 함수에는 선형 함수와 비선형 함수가 있습니다. 선형 함수는 입력 값에 대해 일정한 비율로 결과값이 변하는 함수로, 예를 들어 입력 신호가 2배가 되면 출력값도 2배가 됩니다. 따라서, 선형 함수는 다층 퍼셉트론(Multi-Layer Perceptron, MLP)에서는 효과적이지 않습니다. 비선형 함수는 함수 그래프가 직선이 아닌 함수로, 입력 값에 대해 비선형적으로 출력 값을 결정합니다. 비선형 함수를 사용하면 신경망의 출력 값을 더 복잡하게 만들 수 있으며, 이를 통..
원 핫 인코딩, 형태소 분석, 패딩, 자연어 처리 관련 용어 정리 자연어 처리는 인간이 사용하는 언어를 컴퓨터가 이해하고 처리하는 기술입니다. 주로 텍스트 데이터를 처리하는 기술로써, 인간의 언어적 이해와 처리를 모델링하고 구현함으로써 사람들이 사용하는 자연어를 기계가 이해하고 처리할 수 있습니다. 자연어 처리 기술은 인공지능, 기계학습, 통계학 등의 분야에서 활용되며, 다양한 응용 분야에서 활발하게 사용됩니다. 자연어 처리 기술은 크게 언어 이해와 생성 두 가지 분야로 나눌 수 있습니다. 언어 이해는 텍스트를 분석하여 의미를 추출하고, 정보 추출, 감성 분석, 문서 분류, 문장 표현 등의 작업을 수행하는 분야입니다. 반면 생성은 기계가 인간처럼 자연스러운 방법으로 텍스트를 생성하는 분야로서, 기계 번역, 문서 요약, 대화 시스템, 챗봇 등의 응용 분야에서 사용됩니다...