Loading...

경영빅데이터센터 하계방학 세미나를 확인하기 위해서는 아래 링크를 통해 접속해주시기 바랍니다!

바로가기

Previous seminar

# 데이터분석을 위한 수리통계학 (담당: 이한솔)

일정 내용
1주차 (1/23) 오리엔테이션, 확률 이론과 확률 변수
2주차 (1/30) 평균과 분산
3주차(2/6) 이산확률분포
4주차(2/13) 연속확률분포
5주차(2/20) 표본 분포와 특수 분포(T분포, F분포)
6주차(2/27) 회귀분석
7주차 인공신경망, 로지스틱회귀분석

# MS엑셀 기초와 응용 (담당: 이한솔)

일정 내용
1주차(1/9 목) 오리엔테이션 : 엑셀 기본, 논리식, 조건부서식
2주차(1/16 목) 집계함수와 응용
3주차(1/23 목) 텍스트함수와 응용
4주차(1/30 목) 참조함수와 응용
5주차 (2/6 목) 업무자동화 기법
6주차 (2/13 목) 피벗테이블, 차트

# 파이썬 머신러닝과 대용량 데이터 분석, AWS (담당: 신민철)

일정 내용
1주차
(1/7, 1/11)
(화) Course Introduction
(토) Machine Learning Process Review – 데이터 입력부터 Cross Validation 까지
2주차
(1/14, 1/18)
(화) Unsupervised Machine Learning Model (1)
(토) Unsupervised Machine Learning Model (2)
3주차
(1/21, 1/25)
(화) Supervised Machine Learning Model (1)
(토) Supervised Machine Learning Model (2)
4주차
(1/28, 2/1)
(화) Scikit-Learn(SKLearn) Interfaces (1) – fit/transform/fit_transform
(토) Scikit-Learn(SKLearn) Interfaces (2) – Class Inheritance
5주차
(2/4, 2/8)
(화) Scikit-Learn(SKLearn) Interfaces (3) – Pipeline
(토) Source Code Review
6주차
(2/11, 2/15)
(화) 대용량 데이터 처리의 개요 (1) – 대용량 자료의 종류, 자료의 보관, 핸들링
(토) 대용량 처리를 위한 클라우드 설정 – AWS or GCP or MS Azure
7주차
(2/18, 2/22)
(화) 대용량 데이터 처리 (1) – PySpark in Cloud Platform
(토) 대용량 데이터 처리 (2) – PySpark in Cloud Platform

# 파이썬 업무자동화 (담당: 김성근)

일정 내용
1주차 파이썬 기초(1) : 파이썬 설치 및 파이썬의 자료형
2주차 파이썬 기초(2) : 흐름제어(IF, For, While), 함수만들기
3주차 파이썬 기초(3) : 엑셀파일 다루기(Pandas)
4주차 파이썬 활용 : 대량의 개별메일 보내기 / 대량의 파일 합치기
5주차 파이썬 매크로(1) : 윈도우에서 키보드, 마우스 제어하기
6주차 파이썬 매크로(2) : 윈도우에서 화면분석하여 제어하기
7주차 파이썬 매크로(3) : 나만의 매크로 만들기(각자 발표 + Q&A)
  • Session #1

일정 내용
1주차
(7/9, 7/11)
오리엔테이션
확률 및 확률 변수와 분포 기초 개념
2주차
(7/16, 7/18)
확률분포와 확률분포함수 I – 이산
확률분포와 확률분포함수 II – 연속
3주차
(7/23, 7/25)
특수한 확률 분포 – chi-square
특수한 확률 분포 – t-dist, F-dist
4주차
(7/30, 8/1)
추정 이론 – I (OLS Estimation – Unbiasedness)
추정 이론 – II (OLS Estimation – Efficiency)
5주차
(8/6, 8/8)
추정 이론 – III (OLS Estimation – MLE)
회귀 분석 I – Correlation
6주차
(8/13)
회귀 분석 II – Estimation, Analysis of Variance
  • Session #2

일정 내용
1주차
(7/9, 7/11)
오리엔테이션, 개발환경세팅
Numpy, Pandas를 활용한 데이터 구조 이해 및 데이터 핸들링
2주차
(7/16, 7/18)
Model Selection, Preprocessing (데이터 전처리) using Scikit-Learn[실습] Scikit-Learn을 활용한 타이타닉 생존자 예측
3주차
(7/23, 7/25)
Evaluation(평가)[실습] 피마 인디언 당뇨병 예측
4주차
(7/30, 8/1)
Classification(분류) – Ensemble, Random Forest, GBM, XGBoost, LightGBM[실습] 고객 만족 예측, 신용카드 사기 검출
5주차
(8/6, 8/8)
Basic Regression(회귀) – Gradient Descent, Multiple/Logistic/Linear, Over/Under fitting[실습] 자전거 수요 예측, 주택 가격 예측
6주차
(8/13)
Dimension Reduction(차원 축소) – PCA, LDA, SVD, NMF
  • Session #1

주차 내용
1주차 Deep Learning이란 무엇인가?
2주차 신경망의 수학적 구성 요소(1)
3주차 신경망의 수학적 구성 요소(2)
Keras 설치하고 사용해보기, 신경망의 구조
4주차 머신러닝의 기본 요소
기초적인 Deep Neural Network 만들어보기
5주차 컴퓨터 비전을 위한 딥 러닝 – Keras CNN
6주차 텍스트와 시퀀스를 위한 딥 러닝 – Keras RNN
7주차 Layer Tunning하기 – 텐서보드, 콜백, 함수형 API를 이용한 고급 Keras 구현
  • Session #2

주차 내용
1주차(01/08, 01/10) 데이터 분석의 파이프라인, Feature Engineering의 중요성
분석에 필요한 toolset review – pandas, numpy, scipy, matplotlib, seaborn
python feature들의 리뷰 – class, function, lambda, generator, decorator
2주차(01/15, 01/17) Data Loading(데이터의 유형, File 혹은 Database에서 데이터 불러오기)
Data Manipulation(1) – Series, DataFrame
3주차(01/22, 01/24) Data Manipulation(2) – Groupby, aggregate를 활용한 EDA
Data Manipulation(3) – Filter, Missing Values
Data Visualization
4주차(01/29, 01/31) Feature Engineering(1) – Fancy Tricks with Simple Numbers(숫자 데이터 처리하기)
Feature Engineering(2) – Text Data: Flattening, Filtering, and Chunking(문자 데이터 처리하기)
Bag of Words to TF-IDF
5주차(02/12, 02/14) Feature Engineering(3) – Categorical Variables
Feature Engineering(4) – Dimensionality Reduction: PCA
6주차(02/19, 02/21) Feature Engineering(5) – Nonlinear Featurization
Automating Featurizer