데이터분석 103

아티클 분석 및 정리 (10) 240816

오늘 읽은 아티클은 [데이터 시각화 101 : ③데이터 속 거짓말 발견하기]링크 : https://yozm.wishket.com/magazine/detail/1821/ 데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화yozm.wishket.com   요약 : 실생활에 쉽게 접할 수 있는 사례들을 이용하여, 데이터 시각화를 이용한 거짓말을 발견하기 주요 포인트 : 데이터 시각화로 가장 흔히 사용하는 그래프에서 왜곡이나 과장된 자료를 흔히 볼 수 있다. 핵심개념 : 막대그래프의 기준선이 '0'인지, Y축값이 나타내는 ..

[코딩연습]프로그래머스_대여 기록이 존재하는 자동차 리스트 구하기

문제CAR_RENTAL_COMPANY_CAR 테이블과 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블에서 자동차 종류가 '세단'인 자동차들 중 10월에 대여를 시작한 기록이 있는 자동차 ID 리스트를 출력하는 SQL문을 작성하라. 자동차 ID 리스트는 중복이 없어야 하며, 자동차ID를 기준으로 내림차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : CAR_RENTAL_COMPANY_CAR, CAR_RENTAL_COMPANY_RENTAL_HISTORY어떤 컬럼을 이용할 것인가 : CAR_ID, CAR_TYPE, START_DATE, 어떤 조건을 지정해야 하는가 :  자동차 종류가 '세단', 10월에 대여를 시작어떤 함수(수식)을 이용해야 하는가 : JOIN, WHERE, DIST..

아티클 분석 및 정리 (9) 240813

오늘 읽은 아티클은 [데이터 시각화 101 : ②직관적인 데이터 시각화 만들기]링크 : https://yozm.wishket.com/magazine/detail/1792/ 데이터 시각화 101: ②직관적인 데이터 시각화 만들기 | 요즘IT데이터를 시각화하여 전달하면 우리의 뇌는 빠른 속도로 많은 양의 정보를 처리할 수 있고, 데이터 테이블에 비해 트렌드나 패턴, 아웃라이어 등을 쉽게 파악할 수 있습니다. 때문에 데이터를yozm.wishket.com 요약 : 우리의 뇌가 시각 정보를 처리하는 과정을 이해하고, 직관적인 데이터 시각화를 만드는 방법에 대해 얘기한다. 주요 포인트 :콜린 웨어(Colin Ware) 박사:인간의 뇌가 시각 정보를 처리하는 과정 세 단계1단계 뚜렷한 시각 요소 파악하기 : 인간의 ..

240812_머신러닝 기초 1. 머신러닝의 기초

강의 : 머신러닝의 애하와 라이브러리 활용 기초 1. 머신러닝의 기초 머신러닝(Machine Learning, ML)은 기술 통계 등을 통하여 집계된 정보로 의사결정을 했던 과거와 달리 데이터 수집과 처리 기술의 발전으로 대용량 데이터의 패턴을 인식하고 이를 바탕으로 예측, 분류하는 방법론을 말한다. 머신러닝 관련 용어AI : 인간의 지능을 요구하는 업무를 수행하기 위한 시스템Machine Learning :  관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘Deep Learning : 인공신경망을 이용한 머신러닝Data Science : AI를 포괄하여 통계학과 컴퓨터공학을 바탕으로 발전한 융합학문Data Analysis : 데이터 집계, 통계 분석, 머신러닝을 포함한 행위 머신러닝 종류Super..

[코딩연습]프로그래머스_3월에 태어난 여성 회원 목록 출력하기

문제MEMBER_PROFILE 테이블에서 생일이 3월인 여성 회원의 ID, 이름, 성별, 생년월일을 조회하는 SQL문을 작성하라. 이때 전화번호가 NULL인 경우는 출력대상에서 제외시켜 주시고, 결과는 회원ID를 기준으로 오름차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : MEMBER_PROFILE어떤 컬럼을 이용할 것인가 : MEMBER_ID, MEMBER_NAME, GENDER, DATE_OF_BIRTH어떤 조건을 지정해야 하는가 : MONTH=3, TLNO IS NOT NULL, GENDER='W'어떤 함수(수식)을 이용해야 하는가 : WHERE, ORDER BY, DATE_FORMAT

[코딩연습]프로그래머스_가격대 별 상품 개수 구하기

문제PRODUCT 테이블에서 만원 단위의 가격대 별로 상품 개수를 출력하는 SQL문을 작성하라. 이때 컬럼명은 각각 컬럼명은 PRICE_GROUP, PRODUCT로 지정하고 가격대 정보는 각 구간의 최소금액(10,000원 이상 ~ 20,000 미만인 구간인 경우 10,000)으로 표시하라. 결과는 가격대를 기준으로 오름차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : PRODUCT어떤 컬럼을 이용할 것인가 : PRICE, PRODUCT_ID어떤 조건을 지정해야 하는가 : 최소금액(10,000원 이상 ~ 20,000 미만인 구간인 경우 10,000)으로 표시어떤 함수(수식)을 이용해야 하는가 : GROUP BY, ORDER BY

[코딩연습]프로그래머스_조건에 맞는 사용자와 총 거래금액 조회하기

문제USED_GOODS_BOARD와 USED_GOODS_USER테이블에서 완료된 중고 거래의 총 금액이 70만 원 이상인 사람의 회원 ID, 닉네임, 총 거래금액을 조회하는 SQL문을 작성하라. 결과는 총거래금액을 기준으로 오름차순 정렬하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : USED_GOODS_BOARD, USED_GOODS_USER어떤 컬럼을 이용할 것인가 : USER_ID, NICKNAME, PRICE어떤 조건을 지정해야 하는가 : 완료된 거래, 총 금액이 70만원 이상어떤 함수(수식)을 이용해야 하는가 : JOIN, WHERE, GROUP BY, HAVING, ORDER BY

[코딩연습]프로그래머스_평균 일일 대여 요금 구하기

문제CAR_RENTAL_COMPANY_CAR 테이블에서 자동차 종류가 'SUV'인 자동차들의 평균 일일 대여 요금을 출력하는 SQL문을 작성하라. 이때 평균 일일 대여 요금은 소수 첫 번째 자리에서 반올림하고, 컬럼명은 AVERAGE_FEE로 지정하라.조건어떤 테이블에서 데이터를 뽑을 것인가 : CAR_RENTAL_COMPANY_CAR어떤 컬럼을 이용할 것인가 : CAR_TYPE, DAILY_FEE어떤 조건을 지정해야 하는가 : 요금은 소수 첫 번째 자리에서 반올림어떤 함수(수식)을 이용해야 하는가 : WHERE, AVG(), ROUND()

240806_통계학 기초 2주차 데이터의 분포

강의 : 통계학 기초 2주차 데이터의 분포 모집단과 표본모집단 : 관심의 대상이 되는 전체 집단표본 : 모집단에서 추출한 일부 표본을 사용하는 이유현실적인 제약비용과 시간: 전체 모집단을 조사하는 것은 비용과 시간이 많이 들기 때문에 대부분의 경우 불가능하거나 비효율적이다. 표본 조사는 이러한 자원을 절약하면서도 유의미한 결과를 도출할 수 있는 방법이다.접근성 : 모든 데이터를 수집하는 것이 물리적으로 불가능한 경우가 많다. 예를 들어, 특정 질병에 걸린 모든 환자의 데이터를 수집하는 것은 어려울 수 있다.대표성표본의 대표성잘 설계된 표본은 모집단의 특성을 반영할 수 있습니다. 이를 통해 표본에서 얻은 결과를 모집단 전체에 일반화할 수 있습니다.무작위로 표본을 추출하면 편향을 최소화하고 모집단의 다양한 ..