분류 전체보기(37)
-
Random Forest and Kmeans
1. Random Forest purpose of random forest: a machine learning algorithm that uses multiple decision trees to classify data into different categories The random forest algorithm employs a technique called bagging (Bootstrap Aggregating) 어떤 데이터를 보냐에 따라 presicion, recall score 같이 봐야함 2. KMeans 데이터를 k개의 군집으로 묶는 알고리즘. Unsupervised learning으로 label 이 사전에 알려져있지 않을 때 사용하는 알고리즘 데이터를 랜덤하게 묶고, 이들의 si..
2024.12.26 -
지수 평활법(Exponential smoothing)
single exponential smoothing future expected value = past real value * a + past predicted value * (1-a) Forecasting Formula:Ft+1F_{t+1}Ft+1: Forecast for the next period.XtX_tXt: Actual value at time ttt.FtF_tFt: Forecast value at time ttt.α\alphaα: Smoothing constant (0 ≤ α\alphaα ≤ 1).Smoothing Constant (α\alphaα):Determines the weight of recent observations versus older ones.A higher α\al..
2024.12.24 -
Decision tree Classifier
gini index : 0.5~ 0 사이, 숫자가 작을수록 한쪽으로 치우쳐진것 변수 이름들만 보면 지금 값에서는 조금 이해하기 힘들기 때문에 파라미터를 바꾸어줄 수 있음 plt.figure(figsize = (20,10))plot_tree(model, feature_names = X_train.columns) Decision tree vs Logistic regression1. non-parametric vs parametric2. eature power x vs Feature Power O3. Categorical value O vs Categorical Value X
2024.12.24 -
엑셀 대시보드 만들기
pivot table 과 슬라이서만 잘 활용해도 비쥬얼라이즈 하는게 크게 어렵지 않음 회사에서 할때는 툴에 의지했다면 툴 없이도 할 줄 알아야 함 이전에 엑셀을 돌릴때는 큰 데이터를 그냥 숫자적으로 추세만 보는 것만 했는데 이렇게 정리하니까 한눈에 볼 수 있어서 좋음 개인용 컴에 빨리 단축키를 잘 설정해놔야겠다.
2024.12.23 -
백준 알고리즘 약수, 소수와 배수 2 (2)
오랜만에 알고리즘 푸니까 안풀린다.. 역시 매일매일 해야한다. 17103 골드바흐 파티션골드바흐 파티션 시간 제한메모리 제한제출정답맞힌 사람정답 비율0.5 초512 MB36315133081024234.562%문제골드바흐의 추측: 2보다 큰 짝수는 두 소수의 합으로 나타낼 수 있다.짝수 N을 두 소수의 합으로 나타내는 표현을 골드바흐 파티션이라고 한다. 짝수 N이 주어졌을 때, 골드바흐 파티션의 개수를 구해보자. 두 소수의 순서만 다른 것은 같은 파티션이다. 입력 첫째 줄에 테스트 케이스의 개수 T (1 ≤ T ≤ 100)가 주어진다. 각 테스트 케이스는 한 줄로 이루어져 있고, 정수 N은 짝수이고, 2 출력각각의 테스트 케이스마다 골드바흐 파티션의 수를 출력한다.예제 입력 1 복사5681012100예제..
2024.12.22 -
KNN (K-Nearest Neighbors) 알고리즘
KNN(K-Nearest Neighbors, 최근접 이웃)은 지도학습(supervised learning)에서 사용되는 분류(classification) 및 회귀(regression) 알고리즘 점 사이의 유클리드 거리를 기반으로 검색 Usage : to filter out potential customers who are likely to be VIP memberspotential churn customers forecast of Diabetes K value: which is used to select the number of neighbors(nearest data points)small K value : reflects the traits of neighbors well, but include h..
2024.12.20