2024/08 37

아티클 분석 및 정리 (9) 240813

오늘 읽은 아티클은 [데이터 시각화 101 : ②직관적인 데이터 시각화 만들기]링크 : https://yozm.wishket.com/magazine/detail/1792/ 데이터 시각화 101: ②직관적인 데이터 시각화 만들기 | 요즘IT데이터를 시각화하여 전달하면 우리의 뇌는 빠른 속도로 많은 양의 정보를 처리할 수 있고, 데이터 테이블에 비해 트렌드나 패턴, 아웃라이어 등을 쉽게 파악할 수 있습니다. 때문에 데이터를yozm.wishket.com 요약 : 우리의 뇌가 시각 정보를 처리하는 과정을 이해하고, 직관적인 데이터 시각화를 만드는 방법에 대해 얘기한다. 주요 포인트 :콜린 웨어(Colin Ware) 박사:인간의 뇌가 시각 정보를 처리하는 과정 세 단계1단계 뚜렷한 시각 요소 파악하기 : 인간의 ..

240812_머신러닝 기초 1. 머신러닝의 기초

강의 : 머신러닝의 애하와 라이브러리 활용 기초 1. 머신러닝의 기초 머신러닝(Machine Learning, ML)은 기술 통계 등을 통하여 집계된 정보로 의사결정을 했던 과거와 달리 데이터 수집과 처리 기술의 발전으로 대용량 데이터의 패턴을 인식하고 이를 바탕으로 예측, 분류하는 방법론을 말한다. 머신러닝 관련 용어AI : 인간의 지능을 요구하는 업무를 수행하기 위한 시스템Machine Learning :  관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘Deep Learning : 인공신경망을 이용한 머신러닝Data Science : AI를 포괄하여 통계학과 컴퓨터공학을 바탕으로 발전한 융합학문Data Analysis : 데이터 집계, 통계 분석, 머신러닝을 포함한 행위 머신러닝 종류Super..

[코딩연습]프로그래머스_3월에 태어난 여성 회원 목록 출력하기

문제MEMBER_PROFILE 테이블에서 생일이 3월인 여성 회원의 ID, 이름, 성별, 생년월일을 조회하는 SQL문을 작성하라. 이때 전화번호가 NULL인 경우는 출력대상에서 제외시켜 주시고, 결과는 회원ID를 기준으로 오름차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : MEMBER_PROFILE어떤 컬럼을 이용할 것인가 : MEMBER_ID, MEMBER_NAME, GENDER, DATE_OF_BIRTH어떤 조건을 지정해야 하는가 : MONTH=3, TLNO IS NOT NULL, GENDER='W'어떤 함수(수식)을 이용해야 하는가 : WHERE, ORDER BY, DATE_FORMAT

WIL 내배캠 Data 3기 Chapter 3 데이터 분석 입문 주차 240805-240809

https://data3kayla.tistory.com/95 240805_통계학 기초 1주차통계학 기초 1주차1-1 데이터 분석에 있어서 통계가 중요한 이유데이터 분석하고 이를 바탕으로 결정을 내릴 수 있다.데이터 분석에서 통계는 데이터를 이해하고 해석하는 데 중요한 역할을 한data3kayla.tistory.comhttps://data3kayla.tistory.com/98 240806_통계학 기초 2주차강의 : 통계학 기초 2주차 [수업 목표]모집단과 표본에 대해 이해하고 각각에 대해 설명할 수 있다.각각의 분포에 대한 개념과 특징을 설명할 수 있다.표본오차와 신뢰구간에 대해 이해하고 있data3kayla.tistory.comhttps://data3kayla.tistory.com/100 240807_통..

240809_통계학 기초 5주차 상관관계

상관관계5.1 피어슨 상관계수 1) 피어슨 상관계수란 무엇일까?피어슨 상관계수두 연속형 변수 간의 선형 관계를 측정하는 지표피어슨 상관계수 그래프에서 x와 y의 선형 관계를 보여준다.-1에서 1 사이의 값을 가지며1은 완전한 양의 선형 관계-1은 완전한 음의 선형 관계0은 선형 관계가 없음을 의미더보기import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from scipy.stats import pearsonr # 예시 데이터 생성 np.random.seed(0) study_hours = np.random.rand(100) * 10 exam_scores = 3 * study_hours + np..

[코딩연습]프로그래머스_가격대 별 상품 개수 구하기

문제PRODUCT 테이블에서 만원 단위의 가격대 별로 상품 개수를 출력하는 SQL문을 작성하라. 이때 컬럼명은 각각 컬럼명은 PRICE_GROUP, PRODUCT로 지정하고 가격대 정보는 각 구간의 최소금액(10,000원 이상 ~ 20,000 미만인 구간인 경우 10,000)으로 표시하라. 결과는 가격대를 기준으로 오름차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : PRODUCT어떤 컬럼을 이용할 것인가 : PRICE, PRODUCT_ID어떤 조건을 지정해야 하는가 : 최소금액(10,000원 이상 ~ 20,000 미만인 구간인 경우 10,000)으로 표시어떤 함수(수식)을 이용해야 하는가 : GROUP BY, ORDER BY

240808_통계학 기초 4주차

통계학 기초 4주차 - 회귀(Regression) 4.1 단순선형회귀단순선형회귀 : 하나의 독립 변수(X)와 하나의 종속 변수(Y) 간의 관계를 직선으로 모델링하는 방법회귀식 :  Y = β0 + β1X, 여기서 β0는 절편, β1는 기울기(1차함수)특징독립 변수의 변화에 따라 종속 변수가 어떻게 변화하는지 설명하고 예측.데이터가 직선적 경향을 따를 때 사용한다.간단하고 해석이 용이하다.데이터가 선형적이지 않을 경우 적합하지 않다. 단순선형회귀를 사용할 때하나의 독립변수와 종족변수와의 관계를 분석 및 예측광고비(X)와 매출(Y) 간의 관계 분석.현재의 광고비를 바탕으로 예상되는 매출을 예측 가능. 4.2 다중선형회귀다중선형회귀 : 두 개 이상의 독립 변수(X1, X2, ..., Xn)와 하나의 종속 변수..

[코딩연습]프로그래머스_조건에 맞는 사용자와 총 거래금액 조회하기

문제USED_GOODS_BOARD와 USED_GOODS_USER테이블에서 완료된 중고 거래의 총 금액이 70만 원 이상인 사람의 회원 ID, 닉네임, 총 거래금액을 조회하는 SQL문을 작성하라. 결과는 총거래금액을 기준으로 오름차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : USED_GOODS_BOARD, USED_GOODS_USER어떤 컬럼을 이용할 것인가 : USER_ID, NICKNAME, PRICE어떤 조건을 지정해야 하는가 : 완료된 거래, 총 금액이 70만원 이상어떤 함수(수식)을 이용해야 하는가 : JOIN, WHERE, GROUP BY, HAVING, ORDER BY

아티클 분석 및 정리 (8) 240808

오늘 읽은 아티클은 [데이터 시각화 101: ①데이터 시각화는 왜 중요할까?]링크 : https://yozm.wishket.com/magazine/detail/1750/ 요약 : 일상 속에서 시각화된 데이터가 많다. 데이터 시각화는 많은 정보를 시각화 안에 담아 직관적으로 쉽게 이해가 가능하다.주요 포인트 : 네이버 지도나 기상청의 태풍예상 경로 지도와 같이 시각화된 데이터 자료를 흔히 볼 수 있다. 인간은 시각으로 받아들이는 정보가 많기 때문에 시각화된 자료들을 통해 많은 정보를 한 눈에 볼 수 있다. 핵심개념 : 데이터 시각화는 의사결정에 도움을 준다. 데이터 시각화는 많은 양의 데이터와 정보를 담을 수 있다. 데이터 시각화를 이해하는데 특별한 과학이나 통계 등의 교육이 필요하지 않다. 우리의 뇌는 ..

240807_통계학 기초 3주차

유의성검정 A/B 검정 : 두 그룹(A, B)과 비교하는 게 포인트A/B검정은 두 버전(A와 B) 중 어느 것이 더 효과적인지 평가하기 위해 사용되는 검정 방법.마케팅, 웹사이트 디자인 등에서 많이 사용됨.사용자들을 두 그룹으로 나누고, 각 그룹에 다른 버전을 제공한 후, 반응을 비교.일반적으로 전환율, 클릭률, 구매수, 방문 기간, 방문한 페이지 수, 특정 페이지 방문 여부, 매출 등의 지표를 비교.목적 : 두 그룹 간의 변화가 우연이 아니라 통계적으로 유의미한지를 확인. A/B 검정이 실제로 어떻게 적용되어질까?두 개를 비교하여 구매 전환율이 큰 것을 선택 : 온라인 쇼핑몰에서 두 가지 디자인(A와 B)에 대한 랜딩 페이지를 테스트하여 어떤 디자인이 더 높은 구매 전환율을 가져오는지 평가.