목록인공지능 (4)
보안세상
안녕하세요, 여러분! 이번 포스트에서는 딥러닝의 두 가지 주요 방법론인 Supervised Deep Learning(지도 학습)과 Unsupervised Deep Learning(비지도 학습)에 대해 알아보고, 적절한 예시와 설명을 통해 비지도 학습의 대표적인 기법인 Auto-encoder에 대해 깊게 살펴보겠습니다. Supervised Deep Learning (지도 학습) 지도 학습은 라벨이 부착된 데이터를 이용하여 기계가 학습하는 방식입니다. 학습 과정에서 입력 데이터와 정답 라벨이 함께 사용되며, 기계는 이를 통해 주어진 문제를 해결하는 방법을 습득하게 됩니다. 예를 들어, 이미지 분류 작업에서 고양이와 강아지의 이미지와 라벨을 사용하여 기계를 학습시킬 수 있습니다. 지도 학습은 명확한 정답이 있..
최대 가능도 추정 (MLE): MLE은 주어진 데이터를 가장 잘 설명하는 파라미터를 찾는 추정 방법입니다. 이 방법은 관측된 데이터가 주어진 모델과 파라미터에 기반하여 최대한 가능성이 높은 값을 가질 때, 해당 모델과 파라미터를 선택하는 것입니다. MLE는 주어진 데이터만 고려하며, 파라미터의 사전 확률 분포는 고려하지 않습니다. MLE의 과정: 가능도 함수를 정의합니다. 가능도 함수는 관측된 데이터가 주어졌을 때, 모델 파라미터의 확률을 나타냅니다. 가능도 함수를 최대화하는 파라미터 값을 찾습니다. 최대 사후 확률 추정 (MAP): MAP는 MLE와 유사하지만, 파라미터에 대한 사전 확률 분포를 고려합니다. 이 방법은 베이즈 정리를 사용하여 사전 정보와 관측된 데이터를 결합하여 파라미터를 추정합니다. ..
선형 분류는 주어진 데이터를 분류하기 위해 선형 경계를 찾아내는 것입니다. 이때 선형 경계는 데이터 공간에서 데이터를 분류하는 선, 평면 또는 초평면입니다. 이러한 선형 경계를 찾기 위해 우리는 최적화 기술을 사용하여 주어진 입력 데이터를 가장 잘 분류하는 가중치와 절편을 학습합니다. 예를 들어, 2차원 입력 데이터가 있다고 가정해봅시다. 이 데이터는 클래스 0과 클래스 1로 분류됩니다. 이 경우, 선형 분류기는 입력 데이터 공간에서 클래스 0과 클래스 1을 나누는 선을 찾아냅니다. 이때, 선의 방정식은 y = mx + b로 나타낼 수 있습니다. 여기서 m은 기울기, b는 y 절편입니다. 이 기울기와 y 절편을 결정하는 것이 선형 분류기의 목표입니다. 선형 분류기는 입력 데이터의 차원이 증가하면서, 선 ..
랜덤 포레스트(Random Forest)는 의사결정나무(Decision Tree)를 여러 개 결합하여 만든 앙상블 모델입니다. 의사결정나무는 데이터를 기반으로 예측 모형을 만들어내는데, 이 모형은 각각의 변수들이 독립적으로 기여하며 예측을 수행합니다. 그러나 의사결정나무는 과적합(Overfitting) 문제가 발생하기 쉽습니다. 랜덤 포레스트는 이러한 문제를 해결하기 위해 의사결정나무를 여러 개 결합하여 다수결로 최종 예측 결과를 도출하는 방법입니다. 또한 각 의사결정나무를 만들 때, 트리를 구성하는 노드에서 분할할 때 사용하는 변수를 무작위로 선택합니다. 이는 변수의 다양성을 증가시켜 과적합을 방지하고 예측 성능을 향상시키는데 도움을 줍니다. 랜덤 포레스트는 분류(Classification)와 회귀(R..