전체 글

8. 다층 퍼셉트론(MLP)8.1 다층 퍼셉트론의 등장 XOR 문제를 극복하기 위해 퍼셉트론 두 개를 각각 처리하는 은닉층(hidden layer)을 만드는 기발한 아이디어 착안은닉층을 도입함으로써 구하고자 하는 출력값을 얻을 수 있게 됨 x1, x2를 두 연산으로 각각 전달첫 번째 연산에서는 NAND 처리 두 번째 연산에서는 OR 처리 2,3을 통해 구한 결괏값으로 AND 처리8.2 다층 퍼셉트론의 설계 점선으로 표시한 부분이 은닉층x1, x2에 가중치(w)를 곱하고 바이어스(b)의 합한 결과 값이 모이는 곳이 노드(node)은닉층에 취합된 값은 활성화 함수(ex. 시그모이드)를 통해 다음 노드로 전달됨두 식의 결괏값이 출력층 방향으로 보내지고, 마찬가지로 활성화 함수를 사용해 y 예측 값을 정하게 됨..
7장 퍼셉트론과 인공지능의 시작7.1 인공지능의 시작을 알린 퍼셉트론 인공신경망은 '뉴런처럼 인공적으로 생각하는 무엇인가를 만들 수 있지 않을까?'라는 생각에서 출발한 연구퍼셉트론(perceptron)은 인공신경망을 이루는 가장 기본적인 단위로 여러 개의 입력값에 가중치를 조절하여 출력을 만듦퍼셉트론에 경사하강법을 도입한 것이 아달라인(adaline)7.2 퍼셉트론의 과제하나의 직선으로 흰색 점과 검은색 점을 나눌 수 없는 상황 존재 7.3 XOR 문제 - 퍼셉트론의 한계AND 와 OR 게이트는 직선을 그어 1(검은색 점)인 값을 구별할 수 있지만 XOR의 경우 불가능 다층 퍼셉트론(multilayer perceptron), 오차 역전파(back propagation)로 퍼셉트론의 한계를 해결
사이킷런에서 제공하는 fetch_20newsgroups() API를 이용한 20 뉴스그룹 분류 실습텍스트 분류는 학습 데이터를 통해 특정 문서 분류 모델을 생성한 뒤 다른 문서의 분류를 예측하는 것텍스트를 먼저 정규화 한 뒤 피처 벡터화를 적용하고 로지스틱 회귀 알고리즘을 적용해 분류를 학습/예측/평가사이킷런의 Pipeline 객체를 통해 피처 벡터화 파라미터와 GridSearchCV기반의 하이퍼 파라미터 튜닝을 한꺼번에 수행1. 텍스트 정규화 데이터 로딩 후, 데이터 세트의 key 값 확인from sklearn.datasets import fetch_20newsgroupsnews_data = fetch_20newsgroups(subset='all', random_state=156)print(news_d..
NLP(자연어 처리) : 머신이 인간의 언어를 이해하고 해석TA(텍스트 분석) : 비정형 데이터에서 의미있는 정보를 추출→ NLP 는 텍스트 분석을 향상하게 하는 기반 기술 [머신러닝에 기반한 텍스트 분석 기술 종류]텍스트 분류감성 분석텍스트 요약텍스트 군집화1. 텍스트 분석 이해텍스트 분석은 비정형 데이터인 텍스트를 분석머신러닝 알고리즘은 숫자형의 피처기반 데이터만 입력받을 수 있기 때문에 ‘비정형 텍스트 데이터를 어떻게 피처 형태로 추출하고 추출된 피처에 의미있는 값을 부여하는가’ 하는 것이 매우 중요한 요소피처 벡터화, 피처 추출 : 텍스트를 벡터값을 가지는 피처로 변환하는 것1.2 텍스트 분석 프로세스텍스트 전처리 : 텍스트를 피처로 만들기 전 클렌징 작업, 토큰화 작업, 어근 추출 등의 텍스트 ..
만서다