본문 바로가기

AI12

분류 모델의 성능을 평가 분류 모델의 성능을 평가할 때, F1 Score와 **특이도(Specificity)**는 모델이 얼마나 '균형 잡힌' 판단을 하는지, 그리고 '정답이 아닌 것을 얼마나 잘 걸러내는지'를 확인하는 아주 중요한 지표입니다.이 지표들을 이해하기 위해서는 먼저 **오차 행렬(Confusion Matrix)**의 4가지 개념을 알아야 합니다.TP (True Positive): 양성(1)을 양성으로 잘 맞춤TN (True Negative): 음성(0)을 음성으로 잘 맞춤FP (False Positive): 음성(0)인데 양성으로 잘못 예측 (가짜 양성)FN (False Negative): 양성(1)인데 음성으로 잘못 예측 (가짜 음성)1. 특이도 (Specificity)"정답이 아닌 것을 아니라고 할 수 있는 능력.. 2025. 12. 22.
AI 분류(Classification) 모델 AI 분류(Classification) 모델은 데이터를 미리 정의된 여러 개의 범주(Category) 중 하나로 나누는 지도 학습(Supervised Learning)의 대표적인 방식입니다.쉽게 말해, 컴퓨터가 "이 사진은 고양이인가, 개인가?" 혹은 "이 메일은 스팸인가, 정상인가?"를 판단하도록 만드는 기술입니다.1. 분류 모델의 핵심 개념분류 모델은 데이터의 특징(Feature)을 분석하여 **결정 경계(Decision Boundary)**를 학습합니다.이진 분류 (Binary Classification): 데이터를 두 가지 중 하나로 분류합니다. (예: 예/아니오, 합격/불합격, 스팸/정상)다중 분류 (Multi-class Classification): 세 개 이상의 범주 중 하나로 분류합니다. .. 2025. 12. 22.
머신러닝(Machine Learning)과 딥러닝(Deep Learning) 머신러닝(Machine Learning)과 딥러닝(Deep Learning)은 서로 별개의 개념이 아니라, **딥러닝이 머신러닝의 한 종류(하위 집합)**에 해당합니다.가장 큰 차이점은 **"기계가 데이터를 얼마나 스스로 이해하는가"**에 있습니다.1. 핵심 차이점 비교구분머신러닝 (ML)딥러닝 (DL)정의데이터를 통해 학습하는 AI의 한 분야인공신경망을 층층이 쌓은 머신러닝의 기법특징 추출사람이 직접 특징을 선택 (Feature Engineering)기계가 스스로 특징을 추출 (End-to-End)데이터 양적은 양의 데이터로도 가능대규모 데이터가 있어야 성능이 나옴하드웨어저사양 PC(CPU)에서도 가능고사양 장비(GPU)가 필수적결과 해석왜 그런 결과가 나왔는지 설명하기 쉬움과정이 복잡해 내부를 알기 .. 2025. 12. 22.
인공신경망 중에서 가장 대표적인 두 모델인 CNN과 RNN 1. CNN (Convolutional Neural Network, 합성곱 신경망)"공간을 보는 눈"CNN은 이미지의 공간적인 정보를 유지하면서 특징을 추출하는 데 특화되어 있습니다. 일반적인 신경망은 이미지를 1차원으로 쫙 펼쳐서 입력하기 때문에 "눈과 코의 위치 관계" 같은 정보가 무너지기 쉬운데, CNN은 이를 방지합니다.핵심 원리: **필터(Filter/Kernel)**를 사용합니다. 돋보기를 들고 이미지를 구석구석 훑으며 특징(선, 면, 질감 등)을 찾아내는 방식입니다.주요 구성 요소:합성곱 층(Convolutional Layer): 필터를 거쳐 이미지의 특징 맵(Feature Map)을 생성합니다.풀링 층(Pooling Layer): 데이터의 크기를 줄여 핵심 정보만 남기고 계산량을 줄입니다... 2025. 12. 22.
인공신경망의 구조와 작동 원리 딥러닝의 핵심인 **인공신경망(Artificial Neural Network, ANN)**은 인간의 뇌 구조에서 영감을 받아 만든 수학적 모델입니다. 수많은 데이터를 학습하여 패턴을 찾아내고, 이를 바탕으로 예측이나 분류를 수행하죠. 1. 인공신경망의 기본 구조인공신경망은 크게 세 가지 종류의 층(Layer)으로 구성됩니다.입력층 (Input Layer): 외부로부터 데이터를 받아들이는 층입니다. (예: 이미지의 픽셀 값, 텍스트 데이터 등)은닉층 (Hidden Layer): 입력된 데이터의 특징을 추출하고 복잡한 연산을 수행하는 층입니다. 딥러닝(Deep Learning)이라는 이름은 이 은닉층이 여러 개(Deep) 쌓여 있다는 데서 유래했습니다.출력층 (Output Layer): 최종적인 연산 결과를.. 2025. 12. 22.
AI 에서 텍스트 분류 AI에서 텍스트 분류(Text Classification)는 비정형 데이터인 텍스트를 컴퓨터가 이해할 수 있는 숫자로 바꾸고, 이를 적절한 카테고리로 할당하는 과정입니다. 텍스트 분류를 가능하게 하는 핵심 도구와 기술은 크게 텍스트 전처리, 벡터화, 모델링 세 단계로 나뉩니다.1. 텍스트 전처리 (Preprocessing)컴퓨터가 텍스트의 본질적인 의미에 집중할 수 있도록 노이즈를 제거하는 과정입니다.토큰화 (Tokenization): 문장을 단어, 형태소, 혹은 문자 단위(Token)로 잘게 나누는 작업입니다. 한국어는 KoNLPy(Mecab, Okt 등), 영어는 NLTK, SpaCy 같은 도구가 필수적입니다.불용어 제거 (Stopwords Removal): '은/는', '이/가', 'the', 'a.. 2025. 12. 22.