전체 글(37)
-
(2) CSS 디자인 완성!
배포만 남았다. 이런 저런 오류들이 계속 발생해서 오래걸렸다.아직 만져야 할 부분이 있다.1. Pdf저장하면 다운로드는 되는데 한글이 로딩이 안된다. 나만 그런가? 친구한테 공유해서 확인해봐야 한다.2. 카테고리 변경하면 질문도 바로 바뀌어야하는데 한템포 후에 바뀐다.. 계속 고쳐도 안된다. 하아.. 열심히 만든 CSS 코드 body { background-color: #01080c; font-family: 'Arial', sans-serif; color: #ffffff; margin: 0; padding: 20px; min-height: 100vh; position: relative; overflow-x: hidden; background: #000;}h..
2024.12.19 -
Logistic Regression
이진분류를 예측하는 머신러닝 알고리즘 로지스틱 회귀분석은 기본적으로는 종속변수가 두 개의 클래스를 갖는 범주형(binary classification 가능할 때) 일 때 분류기법지금은 0.5 기준으로 이진분류 되어있음 회귀(Regression)input : 연속값, 범주형 모두 가능output :연속값분류(classficiation) input : 연속값, 범주형 모두 가능output : 이산값(범주형) 이진 분류이면 sigmoid함수, 다중분류이면 softmax 함수를 포함해야 함 https://www.youtube.com/watch?v=bfHKPsrwupI수학적 이해를 위해서라면 위 동영상이 설명을 잘해줌... 결측치를 처리하는것 inpute missing value 1. data에 nan 갯수 ..
2024.12.19 -
리니어 리그레션 및 예측
data.drop(['sex','email'], axis =1)import statsmodels.api as samodel = sa.OLS(y_train, X_train) #이모듈은 y값을 먼저 넣어주어야 함model = model.fit() #훈련 시키기리니어 리그레션 모델 r squared: 클수록 좋은 모델 (1에 가까울수록) Adjusted : 변수의 가중치를 가지고 수치를 매겨줌 coefficient : 변수의 영향력(강도와 방향) - 데이터 스케일을 봐야 그 coeefieicnet 가 정말 impact 있는건지 알 수 있음. 숫자가지고는 크다 작다 말할 수 없음 R2 = 평균치, 베이스라인에서의 전체 에러에서 얼만큼 에러를 개선시킨것인가 를 퍼센트로 나타낸 값 (linear ..
2024.12.19 -
data 다루기
1. 기본 라이브러리 설정 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns 2. 데이터 형태, null 값은 없는지 살펴보기data.info()data.describe() max 값과 75% 사이 value gap 이 크면 아웃라이어가 존재하는 것임 데이터 어떻게 처리할지 확인해야 함안쓸 데이터는 drop 시키기 3. 테스트 데이터 셋과 트레인 데이터 셋을 나누기 X_train, X_test, y_train, y_test = train_test_split(X,y, test_size = 0.2, random_state = 100)랜덤 샘플링 plt.figure(figsize=(10,10))sn..
2024.12.18 -
리뷰 질문기 (1) 만든 동기와 목적
나는 다이어리 적는 것을 좋아한다. 특히 매년 이번년도는 어땠는지 질문하는 것을 좋아하는데, 좋은 질문에 좋은 소회가 나올 수 있다고 생각하여그리고 매번 나를 점쳐보는 이 시간이 참 소중하여 다른 사람들도 해봤으면 좋겠다는 생각에 입력하면 다음 질문이 나올 수 있게 만들었다.그리고 이 질문은 매번/매년 업데이트 해보면 좋을 것 같다. https://github.com/ellen-creator/2024chatbot GitHub - ellen-creator/2024chatbot: good questions for wrapping up your 2024(KOR version)good questions for wrapping up your 2024(KOR version) - ellen-creator/2024ch..
2024.12.18 -
파이썬을 활용한 데이터 전처리 1
Numpy 의 데이터 구조1) 인덱싱, 슬라이싱 1.1 2차원 배열의 경우에는 x2= np,.random.random(size = (10,5)) #10행짜리5열의 2차원 배열을 만들어라[column, row] 의 형태 print(x2[0,1]) #0행1렬값 중 하나를 난수로 받음 print(x2[1:4,2 ]) #행은첫번째부터 4번째까지, 열만 2번째 값print(x2[0,2:4]) #열은 0번째. 열은 2번째~4번째 값 1.2 리스트와 유니버셜 함수의 차이 => 효율성#리스트사용해서벡터 덧셈 구현import timeoutput = []for val1, val2 in zip(arr_1, arr_2): output.append(val1+val2)t2 = time.time()print(round(t2-52,..
2024.12.18