내배캠_Data_3기 108

240807_통계학 기초 3주차

유의성검정 A/B 검정 : 두 그룹(A, B)과 비교하는 게 포인트A/B검정은 두 버전(A와 B) 중 어느 것이 더 효과적인지 평가하기 위해 사용되는 검정 방법.마케팅, 웹사이트 디자인 등에서 많이 사용됨.사용자들을 두 그룹으로 나누고, 각 그룹에 다른 버전을 제공한 후, 반응을 비교.일반적으로 전환율, 클릭률, 구매수, 방문 기간, 방문한 페이지 수, 특정 페이지 방문 여부, 매출 등의 지표를 비교.목적 : 두 그룹 간의 변화가 우연이 아니라 통계적으로 유의미한지를 확인. A/B 검정이 실제로 어떻게 적용되어질까?두 개를 비교하여 구매 전환율이 큰 것을 선택 : 온라인 쇼핑몰에서 두 가지 디자인(A와 B)에 대한 랜딩 페이지를 테스트하여 어떤 디자인이 더 높은 구매 전환율을 가져오는지 평가.

[코딩연습]프로그래머스_평균 일일 대여 요금 구하기

문제CAR_RENTAL_COMPANY_CAR 테이블에서 자동차 종류가 'SUV'인 자동차들의 평균 일일 대여 요금을 출력하는 SQL문을 작성하라. 이때 평균 일일 대여 요금은 소수 첫 번째 자리에서 반올림하고, 컬럼명은 AVERAGE_FEE로 지정하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : CAR_RENTAL_COMPANY_CAR어떤 컬럼을 이용할 것인가 : CAR_TYPE, DAILY_FEE어떤 조건을 지정해야 하는가 : 요금은 소수 첫 번째 자리에서 반올림어떤 함수(수식)을 이용해야 하는가 : WHERE, AVG(), ROUND()

240806_통계학 기초 2주차 데이터의 분포

강의 : 통계학 기초 2주차 데이터의 분포 모집단과 표본모집단 : 관심의 대상이 되는 전체 집단표본 : 모집단에서 추출한 일부 표본을 사용하는 이유현실적인 제약비용과 시간: 전체 모집단을 조사하는 것은 비용과 시간이 많이 들기 때문에 대부분의 경우 불가능하거나 비효율적이다. 표본 조사는 이러한 자원을 절약하면서도 유의미한 결과를 도출할 수 있는 방법이다.접근성 : 모든 데이터를 수집하는 것이 물리적으로 불가능한 경우가 많다. 예를 들어, 특정 질병에 걸린 모든 환자의 데이터를 수집하는 것은 어려울 수 있다.대표성표본의 대표성잘 설계된 표본은 모집단의 특성을 반영할 수 있습니다. 이를 통해 표본에서 얻은 결과를 모집단 전체에 일반화할 수 있습니다.무작위로 표본을 추출하면 편향을 최소화하고 모집단의 다양한 ..

[코딩연습]프로그래머스_조건에 맞는 도서 리스트 출력하기

문제BOOK 테이블에서 2021년에 출판된 '인문' 카테고리에 속하는 도서 리스트를 찾아서 도서ID(BOOK_ID), 출판일(PUBLISHED_DATE)을 출력하는 SQL문을 작성하라. 결과는 출판일을 기준으로 오름차순으로 정렬조건어떤 테이블에서 데이터를 뽑을 것인가 : BOOK어떤 컬럼을 이용할 것인가 : BOOK_ID, PUBLISHED_DATE어떤 조건을 지정해야 하는가 : 2021년, 인문어떤 함수(수식)을 이용해야 하는가 : WHERE, ORDER BY, DATE_FORMAT

아티클 분석 및 정리 (7) 20240806

오늘 읽은 아티클은 [엑셀로 온라인 서비스의 RDB 이해하기]링크 : https://yozm.wishket.com/magazine/detail/1721/ 요약 : 우리는 엑셀로 데이터를 다루고 있지만, RDB와는 차이가 있다. 주요 포인트 :우리는 이미 엑셀(Excel)로 데이터를 다루고 있다. 엑셀의 핵심 기능은 데이터의 기록과 관리이다.엑셀과 RDBMS의 DB는 비슷하면서 다르다. 엑셀은 직관적이지만 SQL은 명령어로 진행되기 때문에 같은 작업도 복잡해 보인다. 또 엑셀에서는 사용자가 표를 만들고 데이터를 조회하고 입력하고 수정하고 삭제할 수 있지만 온라인 서비스의 DB에서는 이러한 권한을 나누고 제한한다. 핵심개념 : RDBMS(Relational Database Management System) ..

240805_통계학 기초 1주차 데이터의 분석과 통계

통계학 기초 1주차1-1 데이터 분석에 있어서 통계가 중요한 이유데이터 분석하고 이를 바탕으로 결정을 내릴 수 있다.데이터 분석에서 통계는 데이터를 이해하고 해석하는 데 중요한 역할을 한다.데이터를 요약하고 패턴을 발견할 수 있다추론을 통해 결론을 도출화는 과정을 돕는다.즉, 데이터 기반의 의사결정을 내릴 수 있다.결국 기업이 보다 현명란 결정을 내리고 수익을 창출하기 위해 필요하다. 1-2 기술통계와 추론통계1) 기술통계 : 데이터를 요약하고 설명하는 통계 방법주로 평균, 중앙값, 분산, 표준편차 등을 사용한다.데이터를 특정 대표값으로 요약 ex)회사의 매출 데이터를 요약하기 위해 평균 매출, 매출의 표준편차 등을 계산데이터에 대한 대략적인 특징을 간단하고 쉽게 알 수 있음단, 데이터 중 예외(이상치)..

[코딩연습]프로그래머스_루시와 엘라 찾기

문제동물 보호소에 들어온 동물 중 이름이 Lucy, Ella, Pickle,Rogan, Sabrina, Mitty인 동물의 아이디와 이름, 성별 및 중성화 여부를 조회하는 SQL문을 작성하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : ANIMAL_INS어떤 컬럼을 이용할 것인가 : ANIMAL_ID, NAME, SEX_UPON_INTAKE어떤 조건을 지정해야 하는가 : NAME IN ()어떤 함수(수식)을 이용해야 하는가 : WHERE

[코딩연습]프로그래머스_성분으로 구분한 아이스크림 총 주문량

문제상반기 동안 각 아이스크림 성분 타입에 대한 아이스크림의 총주문량을 총주문량이 작은 순서대로 조회하는 SQL문을 작성하라. 이때 총주문량을 나타내는 컬럼명은 TOTAL_ORDER로 지정하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : FIRST_HALF, ICECREAM_INFO어떤 컬럼을 이용할 것인가 : INGREDIENT_TYPE, TOTAL_ORDER어떤 조건을 지정해야 하는가 : 어떤 함수(수식)을 이용해야 하는가 : SUM, WHERE, GROUP BY, ORDER BY

240718_파이썬, PYTHON, WHILE문

while문은 조건문이 참이면 계속해서 반복실행한다.while 문을 사용하여 1부터 10까지의 숫자를 출력하는 프로그램을 작성하기더보기# 방법 1count = 0while count     count = count + 1    print(count)# 방법 2count = 0while True:    count = count + 1    if count>10:        break    print(count)   컴프리핸션 : 코드로 잘난척하기ㅋㅋㅋ장점 코드가 간결해진다.리스트를 만드는 과정이 한 눈에 들어온다더 빠른 실행 속도를 가질 수 있다.단점복잡한 로직을 포함할 경우 가독성이 떨어진다.너무 긴 컴프리핸션은 코드의 이해를 어렵게 한다.# 기존 방식numbers = [1, 2, 3, 4, 5]squ..

아티클 분석 및 정리 (6) 20240717

오늘 읽은 아티클은 [SQL 질문 잘 하는 방법]링크 : https://datarian.io/blog/how-to-ask-good-sql-questions SQL 질문 잘 하는 방법막막함에 부딪혔을 때 이 글이 도움이 되길 바랍니다. 새로운 걸 배우는 모두가 멋있어요.datarian.io  요약 : 문제를 해결하는 두 가지 방법은 인터넷 검색을 하거나 같이 공부하는 사람이나 멘토에게 물어보기가 있다.  주요 포인트 : 질문 전 체크리스트를 점검해보고 해결 되지 않을 때,   인터넷 검색을 하거나 같이 공부하는 사람이나 멘토에게 물어보기.체크리스트코드에 오탈자가 없는가?쿼리 실행 후 에러메세지를 읽어보고 그에 맞는 조치를 취했는가?문제에서 요구하는 조건을 빠짐없이 작성하였는가? 특히 WHERE 절의 필터링..