분류 전체보기 50

[스나이퍼팩토리] 한컴AI아카데미(26.06.24) KNN 알고리즘, GridSearchCV

KNN 알고리즘데이터로부터 거리가 가까운 'k'개의 다른 데이터의 레이블을 참조하여 분류하는 알고리즘 (지도학습)핵심 원리동작 방식: 새로운 데이터가 들어왔을 때, 기존에 학습된 데이터 중 가장 가까운 거리의 데이터 K개를 찾습니다.분류(Classification): 가장 많이 뽑힌(다수결) 클래스로 새로운 데이터를 분류합니다.회귀(Regression): 가장 가까운 K개 데이터들의 평균값을 새로운 데이터의 값으로 예측합니다. K값에 따른 결과 변화 Case 1: K = 3 일 때가장 가까운 3개를 찾았더니 [●, ●, ▲] 가 나왔습니다.결과: 다수결에 따라 A그룹으로 분류합니다.Case 2: K = 7 일 때가장 가까운 7개를 찾았더니 [●, ●, ▲, ▲, ▲, ▲, ▲] 가 나왔습니다.결과: 다수..

학습일지 2026.06.24

[스나이퍼팩토리] 한컴AI아카데미(26.06.23) 머신러닝, (의사결정나무알고리즘)

머신러닝머신러닝(Machine Leraning)이란?머신러닝은 사람이 공부를 통해 지식을 습득하듯이, 컴퓨터에게 데이터를 제공하여 스스로 규칙을 학습하게 만드는 기술머신러닝과 전통적 프로그래밍의 차이점전통적 프로그래밍입력 데이터 ↓ 프로그램(규칙) ↓ 결과머신러닝데이터 + 정답 ↓ 머신러닝 학습 ↓ 모델 생성 ↓ 새로운 데이터 입력 ↓ 예측 결과머신러닝의 종류1. 지도학습(Supervised Learning)정답이 있는 데이터를 학습하는 방식 대표 알고리즘의사결정나무로지스틱 회귀SVM랜덤포레스트사용 예시스팸메일 분류질병 진단주택 가격 예측2. 비지도학습(Unsupervised Learning)정답이 없는 데이터를 학습하는 방식20대 여성 그룹30대..

학습일지 2026.06.23

[스나이퍼팩토리] 한컴AI아카데미(26.06.22) Pandas 그룹화/형변환

형변환(.astype)형변환을 하는 이유데이터가 "무엇인가"에 따라 컴퓨터가 할 수 있는 일이 정해져 있습니다.계산이 필요할 때: 문자열 '100'은 숫자 100과 다릅니다. '100'은 그냥 글자일 뿐이라서 더하기를 하면 오류가 나거나 글자가 이어붙여집니다. 숫자(int/float)로 바꿔야 계산이 가능합니다.분석이 필요할 때: 날짜가 적힌 글자('2026-06-22')는 그냥 글자일 뿐이지만, 날짜 타입(datetime)으로 바꾸면 "오늘이 무슨 요일인지", "지난주와 비교하면 어떤지"를 계산할 수 있습니다.용량 최적화: 메모리를 너무 많이 차지하는 타입을 가벼운 타입으로 바꾸면 대용량 데이터를 다룰 때 훨씬 빠르고 쾌적합니다.정수형- .astype(int) 또는 .astype('int64') ..

학습일지 2026.06.22

[스나이퍼팩토리] 한컴AI아카데미(26.06.19) Pandas 데이터 전처리 정리

Pandas 데이터 전처리 핵심 정리import pandas as pddata = [ ['김민재', 31, 75, 5428000], ['이강인', 22, 57, None], ['박찬호', 50, None, 8428000], ['차범근', 70, 80, 4428000], ['추신수', 43, 100, 4528000], ['손흥민', 31, 72, 7028000], ['황희찬', 28, 69, 2528000]]df = pd.DataFrame(data, columns=['성명', '나이', '몸무게', '급여'])1. sample() : 랜덤 추출행 n개 랜덤 추출df.sample(3)비율로 랜덤 추출train = df.sample(frac=0.7)# 랜덤 (1을 기준 백..

학습일지 2026.06.19

[스나이퍼팩토리] 한컴AI아카데미(26.06.17) Pandas

PandasPandas이란?Pandas는 파이썬에서 데이터 작업에 사용되는 라이브러리로 데이터 분석, 정리, 탐색, 조작을 위한 기능이 포함되어 빅데이터 분석은 물론 통계 이론에 기반한 데이터 분석이 가능합니다.1. 데이터 구조(Data Structures)Series(시리즈): 1차원 배열로, 인덱스(Index)와 값(Value)으로 구성, 하나의 열(Column)데이터라고 생각DataFrame(데이터 프레임): 2차원 표 구조, 여러 개의 시리즈가 모여 만들어지며, 행(Row), 열(Column)로 구성된 데이터 분석의 기본 단위2. 주요 기능데이터 입출력: CSV, Excel, SQL, JSON 등 다양한 형식의 파일을 쉽게 읽고(read) 쓸(to) 수 있습니다.파일형식ReaderWriterCSV..

학습일지 2026.06.17

[스나이퍼팩토리] 한컴AI아카데미(26.06.16) Matplotlib

MatplotlibMatplotlib이란?파이썬에서 정적, 애니메이션, 대화형 데이터 시각화를 만들기 위해 가장 널리 사용되는 오픈소스 플로팅 라이브러리입니다. 2D 및 3D 그래픽을 모두 지원하며, 학술 논문용 고품질 그래프부터 간단한 데이터 탐색용 차트까지 다양한 시각화 결과물을 생성할 수 있습니다. 다양한 그래프 지원: 선 그래프, 산점도, 히스토그램, 막대 그래프, 파이 차트 등을 그릴 수 있습니다.뛰어난 호환성: Numpy 배열이나 Pandas 데이터프레임과 완벽하게 연동됩니다.세밀한 커스터마이징: 축, 라벨, 범례, 색상 등 그래프의 모든 시각적 요소를 직접 제어할 수 있습니다.여러 포맷 저장: 완성된 그래프를 PNG, JPG, PDF, SVG 등의 파일로 내보낼 수 있습니다. 설치pip in..

카테고리 없음 2026.06.17

[스나이퍼팩토리] 한컴AI아카데미(26.06.15) NumPy

NumPy(Numerical Python)1. NumPy란??NumPy는 Numerical Python의 약자로 과학 및 공학 분야에서 사용되는 오픈 소스 파이썬 라이브러리이다.NumPy 라이브러리에는 다차원 배열 및 행렬 데이터 구조가 포함되어있다.NumPy는 배열로 저장된 값에 대한 수학 연산을 수행하는데 사용된다.특징다차원 배열(Array) 지원빠른 수학 연산 가능벡터화(Vectorization) 지원Pandas, Matplotlib 등 데이터 분석 라이브러리의 기반설치pip install numpy 사용import numpy as np 2. 리스트와 NumPy 배열 차이일반 리스트a = [1, 3, 5]b = [2, 4, 6]print(a + b) 결과[1, 3, 5, 2, 4, 6] 리스트는 연..

카테고리 없음 2026.06.15

[스나이퍼팩토리] 한컴AI아카데미(26.06.11) JWT 기반 인증

JWT1. 인증(Authentication)인증은 시스템이나 서비스가 사용자가 누구인지 확인하는 과정 FastAPI에서의 인증 방식세션 기반: Depends와 같은 의존성 주입을 통해 쉽게 구현 가능, 쿠키 기반의 세션 관리를 사용토큰 기반: Bearer토큰(와)과 같은 인증 스키마를 사용해 JWT 기반 인증을 구현 일반적2. JWT이란?JWT는 주로 인증 목적으로 사용되며, 토큰 안에 사용자의 인증 정보를 포함하고 있어 서버가 별도로 상태를 유지할 필요가 없습니다.JWT의 구조Header(헤더): 토큰의 타입(JWT)과 서명 생성에 사용된 암호화 알고리즘(예: HS256) 정보가 담깁니다.Payload(페이로드): 토큰에 담을 실제 정보(사용자 식별 ID, 권한, 토큰 만료 시간 등)가 Key-Valu..

학습일지 2026.06.11

[스나이퍼팩토리] 한컴AI아카데미(26.06.10) Fast API

FastAPI# FastAPI란 무엇인가?FastAPI는 파이썬으로 웹 서버(API)를 만들기 위한 현대적이고 매우 빠른 프레임워크입니다.왜 쓰는가?: 코드가 직관적이고, 실행 속도가 매우 빠르며, 비동기(Async) 처리가 쉬워서 현대적인 웹 서비스 구축에 적합합니다.핵심 개념: @app.get이나 @app.post처럼 데코레이터(@)를 사용해 "이 주소(URL)로 접속하면 이 함수를 실행해라"라고 지정하는 방식입니다.* Flask vs FastAPI구분FlaskFastAPI속도상대적으로 느림 (동기 방식)매우 빠름 (Node.js/Go와 비견됨)비동기 처리지원이 제한적임완벽하게 지원 (Async/Await)데이터 검증직접 구현하거나 외부 라이브러리 필요Pydantic을 통한 자동 검증문서화직접 만들어..

학습일지 2026.06.10

[스나이퍼팩토리] 한컴AI아카데미(26.06.09) 네이버메일보내기자동화(Selenium)

Selenium & PyAutoGUI를 활용한 네이버 메일 자동화목적: 네이버 로그인부터 메일 작성, 내용 입력 및 전송까지의 과정을 자동화. 특히 단순 자동화를 넘어 pyperclip을 이용해 클립보드에 텍스트를 복사한 뒤 Ctrl+V를 수행함으로써, 한글 입력 시 발생할 수 있는 브라우저 매크로 오류를 우회하는 전략을 사용 # 주요 기능 및 라이브러리 역할from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom selenium.webdriver.chrome.options import Optionsfrom webdriver_manager.chrome import ChromeDriverManagerfrom..

학습일지 2026.06.10