AI

[DEEP LEARNING] 자연어처리 - 토큰화
자연어처리자연어는 자연 언어라고도 부르며 사람들이 쓰는 언어활동을 위해 자연히 만들어진 언어를 의미한다. 자연어 처리는 컴퓨터가 인간의 언어를 이해하고 해석 및 생성하기 위한 기술을 의미한다. 자연어 처리 모델을 개발하기 위해서는 모호성, 가변성, 구조 문제를 해결해야 한다. 위와 같은 문제를 이해하고 구분할 수 있는 모델을 만들기 위해서는 말뭉치(Corpus)를 일정한 단위인 토큰(Token)으로 나눠야 한다. 말뭉치는 뉴스 기사, 사용자 리뷰 등에서 목적에 따라 구축되는 텍스트 데이터를 의미한다. 토큰은 개별 담어나 문장부호 같은 텍스트를 의미하며 말뭉치보다 더 작은 단위다. 말뭉치를 토큰 단위로 나누는 것을 토큰화라고 한다. 토큰화를 위해 토크나이저라는 것을 사용한다. 이 과정을 익히기 위해 파이썬..

[MACHINE LEARNNG] 04 Multi-variable Linear Regression
목차 1. Multi-variable Linear Regression 2. Hypothesis Using Matrix 1. Multi-variable Linear Regression(다중 선형 회귀) 우리가 지금까지 배웠던 Linear Regression은 변수 X가 한 개, 변수 Y가 한 개 있는 Regression이었다. 하지만 실제로 사용할 데이터에서는 위 사진의 데이터와 같이 변수 X가 여러 개인 경우가 많다. 이럴 때 사용하는 Regression을 Multi-variable Linear Regression(다중 선형 회귀)이라고 한다. 명칭 그대로 독립 변수가 여러 개 일 때 Y를 예측하는 것을 말한다. 2. Hypothesis Using Matrix Multi-variable Linear Re..

[MACHINE LEARNING] 03 Gradient Descent Algorithm
목차 1. Gradient Descent Algorithm 2. Convex Function 1. Gradient Descent Algorithm(경사 하강 알고리즘) Linear Regression의 목표는 Cost를 최소화하는 Weight, bias를 찾는 것이다. cost를 최소화하는 방법으로는 보통 Gradient Descent Algorithm(경사 하강 알고리즘)을 사용한다. 이는 (0, 0) 원점 또는 어떤 값에서 시작하여 Weight나 bias를 조금씩 바꿔가면서 Cost를 줄이고 경사도를 계산하는 과정을 계속 반복하여 Cost의 최솟값을 가지는 Weight와 bias의 값을 찾는 방법이다. 경사도는 미분을 이용하여 계산할 수 있다. 미분을 쉽게 하기 위해서 Cost Function의 분모..

[MACHINE LEARNING] 02 Linear Regression
목차 1. Regression 2. Hypothesis 3. Cost Function 4. Minimize Cost 1. Regression 그림을 살펴보며 이해해 보자. 간단한 데이터를 왼쪽에 준비했다. 여기서 x는 feature라고도 하는 예측하기 위한 기본적인 자료, y는 예측해야 할 대상이다. 이 데이터를 간단하게 그래프에 그려보면 오른쪽 그림과 같다. 2. Hypothesis Regression 모델을 학습할 때는 하나의 가설을 세울 필요가 있다. 이때 'Linear 한 모델이 우리가 가지고 있는 데이터에 적합할 것이다.'라고 가설을 세우는 것이 Linear Regression이다. 다르게 말해서 데이터가 주어졌을 때 그 데이터에 맞는 Linear 한 선을 찾는 것이라고 설명할 수 있다. 위의 ..

[MACHINE LEARNING] 01 Machine Learning, Tensor
목차 1. 머신러닝 2. 비지도 학습 vs 지도학습 3. 지도 학습의 유형 4. Tensorflow 5. Data Flow Graph 6. Tensor Rank, Shape, Type 1. Machine Learing(머신러닝) 쉽게 말해서 개발자가 일일이 프로그래밍하지 않고 자체적으로 데이터를 학습한 후 적용하는 프로그램을 기계학습이라고 한다. 1959년, 아서 사무엘은 기계가 일일이 코드로 명시하지 않은 동작을 데이터로부터 학습하여 실행할 수 있도록 하는 알고리즘을 개발하는 연구 분야라고 정의했다. 2. Unsupervised Learning(비지도 학습) vs Supervised Learning(지도 학습) 머신러닝을 학습 방식에 따라 Unsupervised Learning(비지도 학습), Supe..

[DEEP LEARNING] 1. 딥러닝이란 무엇인가 ?
✅ Deep learning이란 ? [Deep learning > Representation Learning > machine learning > AI] ➰ Deep learning은 머신러닝(machine learning)의 안에 들어가는 개념이다. 머신러닝(machine learning)은 쉽게 말해서 기계를 학습시키는 것이며 여기서의 학습은 인간 학습과는 다르다. mitchell은 "한 컴퓨터 프로그램이 어떤 과제류 T에 속하는 과제들을 수행하며 그 수행의 성과를 측정한 측도가 P라고 할 때, 만일 어떤 경험 E 때문에 T의 성과 측도 P가 개선되었다면, 그 컴퓨터 프로그램은 경험 E로부터 학습한다고 말할 수 있다."라고 말했다. 즉 학습은 수학 수식을 개선하는 활동이라는 것이다. 그중에서도 Dee..