통계 표본추출방법 (단순랜덤, 계통추출법, 집락추출법, 층화추출법 차이점)
통계는 사회의 여러 현상을 설명하는 숫자이다. 최근에는 데이터 처리속도와 기술의 발달로 표본이 아닌 전수조사도 가능해졌다고 하지만, 전통적인 통계는 모집단 전체를 대표하는 표본을 추출하여서 특징을 살펴 봄으로써, 모집단의 특징을 이해하는 것이라고 볼 수 있다. 즉, A회사에 근무하는 직원 50,000명을 대상으로 근무 만족도 조사를 한다고 할 때, 전체 설문조사가 어려우니 대표로 1,000명 쯤을 골라내서 설문조사를 한 뒤, 이들의 만족도가 곧 50,000명을 대표하는 것이라고 가정하는 것이다. 물론, 50,000명에 달하는 인원의 전체 조사가 가능하다면, 정확성은 좀 더 높은 수준으로 보장 받겠지만 결코 시간과 비용의 투자가 효율적이지 못할 수 있다. 무엇보다도 그렇게 하는 것이 얼마나 의미가 있냐는 ..
python - pd.concat() 데이터프레임 합치기 / table merge, stack
테이블 열이나 행의 인덱스가 같은 경우에, 여러 개의 표를 합쳐서 보고 싶은 경우가 있다. pd.concat() 기능을 활용하면 쉽게 표를 합칠 수 있다. 예제 #Pandas불러오기 import pandas as pd #데이터프레임 만들기 data1 = pd.DataFrame({'date':['2021-10-03','2021-10-04','2021-10-05'], 'category':['transportation','coffee','meal'], 'amount':['7500','5000','19000'], 'payment method':['cash','cash','card']}, ) data2 = pd.DataFrame({'date':['2021-09-04','2021-09-06','2021-09-07'..
제3회 빅데이터 분석기사 필기시험 데이터에듀로 공부한 비전공자 후기, 기출 문제복원
10/2일에 시행된 제3회 빅데이터 분석기사 필기시험을 쳤다. Long story short, 일단은 어렵게 느껴졌고 시행한지 얼마 안 된 시험이다보니 문제집이 시험 범위를 다 못 담은 느낌이었다. 시험에서 떨어질 수준으로 못 담은건 아니지만, 그래도 확실히 당황스러웠다. 모의고사보다는 훨씬 어렵게 느껴졌다. 오늘의 리뷰항목은 다음과 같이 요약해보겠다. 빅데이터 분석기사 준비하시는 분들에게는 도움이 될 수도 있겠다! 시험장, 준비물 생각나는 기출문제 내용, 교재 공부했던 방법, 기간, 자료 공유 1. 시험장 환경, 준비물 10시부터 시험이 시작됐는데, 9시 40~45분 정도부터 책상에 있는 것 다 집어넣으라고 했고, 전자기기도 전부 off하라고 한다. 의도하지 않았더라도 전자기기가 울릴 경우에는 실격처리..