분류 전체보기 127

240809_통계학 기초 5주차 상관관계

상관관계5.1 피어슨 상관계수 1) 피어슨 상관계수란 무엇일까?피어슨 상관계수두 연속형 변수 간의 선형 관계를 측정하는 지표피어슨 상관계수 그래프에서 x와 y의 선형 관계를 보여준다.-1에서 1 사이의 값을 가지며1은 완전한 양의 선형 관계-1은 완전한 음의 선형 관계0은 선형 관계가 없음을 의미더보기import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from scipy.stats import pearsonr # 예시 데이터 생성 np.random.seed(0) study_hours = np.random.rand(100) * 10 exam_scores = 3 * study_hours + np..

[코딩연습]프로그래머스_가격대 별 상품 개수 구하기

문제PRODUCT 테이블에서 만원 단위의 가격대 별로 상품 개수를 출력하는 SQL문을 작성하라. 이때 컬럼명은 각각 컬럼명은 PRICE_GROUP, PRODUCT로 지정하고 가격대 정보는 각 구간의 최소금액(10,000원 이상 ~ 20,000 미만인 구간인 경우 10,000)으로 표시하라. 결과는 가격대를 기준으로 오름차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : PRODUCT어떤 컬럼을 이용할 것인가 : PRICE, PRODUCT_ID어떤 조건을 지정해야 하는가 : 최소금액(10,000원 이상 ~ 20,000 미만인 구간인 경우 10,000)으로 표시어떤 함수(수식)을 이용해야 하는가 : GROUP BY, ORDER BY

240808_통계학 기초 4주차

통계학 기초 4주차 - 회귀(Regression) 4.1 단순선형회귀단순선형회귀 : 하나의 독립 변수(X)와 하나의 종속 변수(Y) 간의 관계를 직선으로 모델링하는 방법회귀식 :  Y = β0 + β1X, 여기서 β0는 절편, β1는 기울기(1차함수)특징독립 변수의 변화에 따라 종속 변수가 어떻게 변화하는지 설명하고 예측.데이터가 직선적 경향을 따를 때 사용한다.간단하고 해석이 용이하다.데이터가 선형적이지 않을 경우 적합하지 않다. 단순선형회귀를 사용할 때하나의 독립변수와 종족변수와의 관계를 분석 및 예측광고비(X)와 매출(Y) 간의 관계 분석.현재의 광고비를 바탕으로 예상되는 매출을 예측 가능. 4.2 다중선형회귀다중선형회귀 : 두 개 이상의 독립 변수(X1, X2, ..., Xn)와 하나의 종속 변수..

[코딩연습]프로그래머스_조건에 맞는 사용자와 총 거래금액 조회하기

문제USED_GOODS_BOARD와 USED_GOODS_USER테이블에서 완료된 중고 거래의 총 금액이 70만 원 이상인 사람의 회원 ID, 닉네임, 총 거래금액을 조회하는 SQL문을 작성하라. 결과는 총거래금액을 기준으로 오름차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : USED_GOODS_BOARD, USED_GOODS_USER어떤 컬럼을 이용할 것인가 : USER_ID, NICKNAME, PRICE어떤 조건을 지정해야 하는가 : 완료된 거래, 총 금액이 70만원 이상어떤 함수(수식)을 이용해야 하는가 : JOIN, WHERE, GROUP BY, HAVING, ORDER BY

아티클 분석 및 정리 (8) 240808

오늘 읽은 아티클은 [데이터 시각화 101: ①데이터 시각화는 왜 중요할까?]링크 : https://yozm.wishket.com/magazine/detail/1750/ 요약 : 일상 속에서 시각화된 데이터가 많다. 데이터 시각화는 많은 정보를 시각화 안에 담아 직관적으로 쉽게 이해가 가능하다.주요 포인트 : 네이버 지도나 기상청의 태풍예상 경로 지도와 같이 시각화된 데이터 자료를 흔히 볼 수 있다. 인간은 시각으로 받아들이는 정보가 많기 때문에 시각화된 자료들을 통해 많은 정보를 한 눈에 볼 수 있다. 핵심개념 : 데이터 시각화는 의사결정에 도움을 준다. 데이터 시각화는 많은 양의 데이터와 정보를 담을 수 있다. 데이터 시각화를 이해하는데 특별한 과학이나 통계 등의 교육이 필요하지 않다. 우리의 뇌는 ..

240807_통계학 기초 3주차

유의성검정 A/B 검정 : 두 그룹(A, B)과 비교하는 게 포인트A/B검정은 두 버전(A와 B) 중 어느 것이 더 효과적인지 평가하기 위해 사용되는 검정 방법.마케팅, 웹사이트 디자인 등에서 많이 사용됨.사용자들을 두 그룹으로 나누고, 각 그룹에 다른 버전을 제공한 후, 반응을 비교.일반적으로 전환율, 클릭률, 구매수, 방문 기간, 방문한 페이지 수, 특정 페이지 방문 여부, 매출 등의 지표를 비교.목적 : 두 그룹 간의 변화가 우연이 아니라 통계적으로 유의미한지를 확인. A/B 검정이 실제로 어떻게 적용되어질까?두 개를 비교하여 구매 전환율이 큰 것을 선택 : 온라인 쇼핑몰에서 두 가지 디자인(A와 B)에 대한 랜딩 페이지를 테스트하여 어떤 디자인이 더 높은 구매 전환율을 가져오는지 평가.

[코딩연습]프로그래머스_평균 일일 대여 요금 구하기

문제CAR_RENTAL_COMPANY_CAR 테이블에서 자동차 종류가 'SUV'인 자동차들의 평균 일일 대여 요금을 출력하는 SQL문을 작성하라. 이때 평균 일일 대여 요금은 소수 첫 번째 자리에서 반올림하고, 컬럼명은 AVERAGE_FEE로 지정하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : CAR_RENTAL_COMPANY_CAR어떤 컬럼을 이용할 것인가 : CAR_TYPE, DAILY_FEE어떤 조건을 지정해야 하는가 : 요금은 소수 첫 번째 자리에서 반올림어떤 함수(수식)을 이용해야 하는가 : WHERE, AVG(), ROUND()

240806_통계학 기초 2주차 데이터의 분포

강의 : 통계학 기초 2주차 데이터의 분포 모집단과 표본모집단 : 관심의 대상이 되는 전체 집단표본 : 모집단에서 추출한 일부 표본을 사용하는 이유현실적인 제약비용과 시간: 전체 모집단을 조사하는 것은 비용과 시간이 많이 들기 때문에 대부분의 경우 불가능하거나 비효율적이다. 표본 조사는 이러한 자원을 절약하면서도 유의미한 결과를 도출할 수 있는 방법이다.접근성 : 모든 데이터를 수집하는 것이 물리적으로 불가능한 경우가 많다. 예를 들어, 특정 질병에 걸린 모든 환자의 데이터를 수집하는 것은 어려울 수 있다.대표성표본의 대표성잘 설계된 표본은 모집단의 특성을 반영할 수 있습니다. 이를 통해 표본에서 얻은 결과를 모집단 전체에 일반화할 수 있습니다.무작위로 표본을 추출하면 편향을 최소화하고 모집단의 다양한 ..

[코딩연습]프로그래머스_조건에 맞는 도서 리스트 출력하기

문제BOOK 테이블에서 2021년에 출판된 '인문' 카테고리에 속하는 도서 리스트를 찾아서 도서ID(BOOK_ID), 출판일(PUBLISHED_DATE)을 출력하는 SQL문을 작성하라. 결과는 출판일을 기준으로 오름차순으로 정렬조건어떤 테이블에서 데이터를 뽑을 것인가 : BOOK어떤 컬럼을 이용할 것인가 : BOOK_ID, PUBLISHED_DATE어떤 조건을 지정해야 하는가 : 2021년, 인문어떤 함수(수식)을 이용해야 하는가 : WHERE, ORDER BY, DATE_FORMAT

아티클 분석 및 정리 (7) 20240806

오늘 읽은 아티클은 [엑셀로 온라인 서비스의 RDB 이해하기]링크 : https://yozm.wishket.com/magazine/detail/1721/ 요약 : 우리는 엑셀로 데이터를 다루고 있지만, RDB와는 차이가 있다. 주요 포인트 :우리는 이미 엑셀(Excel)로 데이터를 다루고 있다. 엑셀의 핵심 기능은 데이터의 기록과 관리이다.엑셀과 RDBMS의 DB는 비슷하면서 다르다. 엑셀은 직관적이지만 SQL은 명령어로 진행되기 때문에 같은 작업도 복잡해 보인다. 또 엑셀에서는 사용자가 표를 만들고 데이터를 조회하고 입력하고 수정하고 삭제할 수 있지만 온라인 서비스의 DB에서는 이러한 권한을 나누고 제한한다. 핵심개념 : RDBMS(Relational Database Management System) ..