통계분석 포트폴리오
-
회귀분석 사례 (3) - 코스피/코스닥 상장기업 12개년 재무분석: 1편
안녕하세요. 오늘은 유가증권 상장기업의 과거 12개년치 재무제표를 기반으로 기업의 가치를 평가한 회귀분석 사례를 소개하고자 합니다. 주제는 '기업의 보유부동산 비율이 기업의 가치에 영향을 미치는가?' 입니다. 아래에서 데이터 수집 과정과 분석에 필요한 변수(종속/독립/통제변수)에 대한 정의를 설명하고, 2편에서 회귀분석 결과를 소개드리겠습니다.1. 분석대상 정의통계 분석에 앞서, 분석할 대상(=모수)를 정의하는 일이 우선적으로 되어야 합니다. 저희가 분석하고자 하는 대상은 러프하게 '유가증권 상장기업' 입니다. 이에 과거 재무제표 데이터가 존재하는지 등을 고려하여 다음과 같이 분석대상을 구체적으로 정의하였습니다.분석 대상은 다음과 같은 4가지 조건을 갖춘 800개 기업임 ① 한국거래소 유가증권시장 상장기..
2024.09.21 21:13 -
회귀분석 사례 (2) - 공공데이터를 활용한 교육 분야 요인분석
안녕하세요. 오늘은 "공공데이터 포털"에서 데이터를 직접 찾아 분석한 회귀분석 사례를 소개하고자 합니다. 주제는 교육과 관련된 '유치원 원아수에 영향을 주는 요인은 무엇인가?' 입니다. 아래에서 분석 주제와, 분석 과정, 결과에 대해 상세히 말씀드리겠습니다.유치원 유아수에 영향을 주는 요인은 무엇인가? 교육 분야 데이터 분석 시나리오 설계안 > 어떤 데이터를전국 유치원 7,957곳에 대한 2023년 1차 공시 기준의 다음 정보를 취합하여(1) 일반현황: 설립유형(공립/사립), 설립일, 운영시간, 학급수, 유아수 등(2) 교사의 현 기관 근속연수 현황: 1년미만 교사수, 1년이상 2년미만 교사수 등(3) 수업일수 현황: 수업일수, 특수학습수업일수, 방과후과정수업일수 등(4) 급식운영 현황: 급식유아수, ..
2024.09.11 22:45 -
시각화 보고서 사례 (1) - 축구 선수 및 팀 데이터 분석
안녕하세요. 오늘은 시각화 보고서 사례를 소개하고자 합니다. 주제는 '25,000여명의 축구선수에 대한 데이터와 6,200여개 축구클럽에 대한 데이터 분석' 입니다. Word로 총 15 Page 분량의 시각화 보고서가 탄생하였습니다. 아래에서 시각화 보고서를 소개해드리겠습니다.Ⅰ. 개요본 보고서는 축구 선수와 축구 팀 데이터를 분석하여 통계치를 확인하고 그 결과를 시각화하여 데이터에 대한 분석 결과를 제공하기 위하여 작성되었다. Ⅱ. 선수 데이터1. 현황 분석선수 데이터는 24,526명의 축구 선수 정보로 구성되어 있다. 선수의 이름과 나이, 키, 국적과 같은신상 정보와 소속 클럽, 입단 날짜, 이적료와 같은 소속 정보가 존재한다. 또한 선수의 현재 시장 가치, 출장 횟수, 득점수, 최근 5경기의 패스..
2024.09.08 22:53 -
설문조사 분석 사례 (1) - 지역사회 기관 만족도 조사
안녕하세요. 오늘은 설문조사 분석 및 시각화 사례를 소개하고자 합니다. 주제는 '지역사회의 복지센터, 시설 및 의료기관 등과 같은 기관들의 만족도 조사' 입니다. 금번에는 분석 결과의 전체를 설명드리기보다, 설문조사 결과를 분석하고 시각화하는 몇 가지 Case를 선별하여 소개해드리겠습니다. 1. 하나의 질문에 대한 응답을 분석하는 Case 설문조사에서 가장 기본으로 등장하는 질의 유형입니다. 이러한 질문에는 응답 분포표와 도넛 모양의 그래프, 시사점을 한 세트로 결과물을 도출할 수 있습니다.보기전체소속기관① 정신건강복지센터② 중독관리센터③ 정신재활시설④ 정신의료기관① 협력기관 간 연락 불통3 (3.1%)3 (3.7%)0 (0.0%)0 (0.0%)0 (0.0%)② 열악한 정보공유시스템17 (17.5%)1..
2024.09.01 21:36 -
회귀분석 사례 (1) - 재무제표 기반 기업가치평가
안녕하세요. 오늘은 회귀분석 사례를 소개하고자 합니다. 주제는 '재무제표 기반의 기업가치평가' 인데요, 아래에서 분석 주제와, 분석 과정, 결과에 대해 상세히 말씀드리겠습니다. 1. 주제 소개 본 과제에서 회귀분석을 통해 예측하고 싶은 요소는 '기업가치' 입니다. 기업가치라고 하면 대단한 무엇처럼 느껴지시나요? 사실 간단하게 기업의 시가총액으로 해당 기업의 가치를 대체할 수 있습니다. 기업의 가치는 여러 가지로 측정될 수 있지만, 주식시장에서 시장 참여자들이 평가한 해당 기업의 주가, 그 주가들의 총합으로 해당 기업의 가치를 정량화하는 것이지요. 1.1. 종속변수와 설명변수 정의 이에 따라 종속변수 Y는 기업의 시가총액이 되었습니다. 설명변수는 재무제표라고 했는데요, 재무제표는 사실 너무 두리뭉실하게 기..
2024.03.31 23:04 -
상관분석이란?
상관분석(=상관관계 분석)이란, 두 변수 간의 선형적인 관계를 수치화하는 분석 기법입니다. 서로 다른 두 변수는 서로 관련이 없는 독립적인 관계일수도 있고, 어떠한 식으로든 관련이 있는 상관된 관계일수도 있죠. 이때 두 변수 간의 관계의 강도를 수치화한 것을 상관계수(Correlation Coefficient)라고 합니다. 상관계수는 -1에서 1 사이의 값을 갖습니다. -1과 1에 가까울수록 상관관계가 높다는 의미이며, 0에 가까울수록 상관관계가 낮다는 의미입니다.-1 ≤ 상관계수 < 0 : 두 변수가 음의 상관관계를 갖는다.상관계수 = 0 : 두 변수의 상관관계는 존재하지 않는다.0 < 상관계수 ≤ 1 : 두 변수가 양의 상관관계를 갖는다. 1) 두 변수가 음의 상관관계를 갖는다는 것은, 변수 A와 ..
2024.03.17 19:49 -
기초 통계란?
통계학에서 기초 통계란, 변수의 최소값/최대값/평균 등을 산출하는 것으로 데이터의 특성을 요약하고 설명하기 위한 통계적인 지표를 의미합니다. 본격적인 분석 전에 데이터의 현황을 파악하는 목적으로 수행하죠. 변수(=항목)의 형태에 따라서 산출하는 기초 통계량은 달라집니다. 연속형 변수: 최소값, 최대값, 평균, 중앙값, 최빈값, 분산, 표준편차, 범위, 사분위수 등 범주형 변수: 빈도수, 백분율, 상대 빈도 등 하나의 연속형 변수에 대한 기초 통계량을 그림으로 나타내면 다음과 같은 상자그림을 그릴 수 있습니다. 최소값과 최대값을 상자그림의 위아래 선으로 표시하고, 25%에 해당하는 Q1(1분위수)와 75%에 해당하는 Q3(3분위수)를 상자로 표시합니다. 그리고 50%에 해당하는 Q2(중위수)를 상자 안의 ..
2024.03.17 18:40 -
회귀분석 사례 (3) - 코스피/코스닥 상장기업 12개년 재무분석: 2편
안녕하세요. 앞선 1편에 이어 2편으로 돌아온 유가증권 상장기업의 과거 12개년치 재무제표를 기반으로 기업의 가치를 평가한 회귀분석 사례입니다. 주제는 '기업의 보유부동산 비율이 기업의 가치에 영향을 미치는가?' 였습니다. 1편에서 데이터 수집 과정과 분석에 필요한 변수(종속/독립/통제변수)에 대한 정의에 대해 말씀드렸고, 2편에서는 회귀분석 결과에 대해 소개드리겠습니다.5. 기술통계량회귀분석에 앞서, 생성한 데이터셋이 NULL값은 없는지, MIN-MAX 값은 어떻게 분포되어있는지 등을 확인하기 위하여 기초통계분석을 수행합니다. 종속/설명/통제변수로 사용된 13개 변수에 대한 기초통계량은 다음과 같습니다.변수N최소값최대값평균표준편차MB비율96000.0200.9990.4430.202보유부동산비율96000...
2024.09.22 23:38