- 강좌명: 데이터과학 입문
- 데이터과학 연계전공 전공 선택
- 강의자명: 가천대학교 산업경영공학과 최성철 교수 ([email protected], Director of TEAMLAB)
- Email: [email protected]
- 강의자료 통합 - link
- 본 과정은 머신러닝에 대한 기초개념과 주요 알고리즘들에 대해 이해하고 구현하는 것을 목적으로 함
- 본 과정을 통해 수강자는 데이터 과학에서 사용되는 다양한 용어에 대한 기본적인 이해를 할 수 있음
- 본 과정의 기본적인 구성은 알고리즘에 대한 설명,
Numpy를 사용한 구현
,Scikit-Learn을 사용한 패키지 활용
으로 이루어 져 있음 - 수강자는 머신러닝에서 주로 사용되는 알고리즘을 구현하기 위해 고등학교 수준의 통계학과 선형대수학의 이해가 필요함
- 수강자는 본 과정을 통해 Numpy, Pandas, Matplotlib, Scikit-Learn 등 데이터 분석을 위한 기본적인 파이썬 패키지를 이해하게됨
- Course Overview = 강의영상
- Machine learning overview - 강의영상, 강의자료
- An understanding of the data keywords - 강의영상, 강의자료
- How to learn machine learning - 강의영상, 강의자료
- Types of machine learning - 강의영상, 강의자료
- Data era: In a perspective of business - 강의영상, 강의자료
- Environment setup
- Python ecosystem for machine learning - 강의영상, 강의자료
- How to use Jupyter Notebook - 강의영상, 강의자료
- 참고자료
- 가상환경과 Package 활용하기 - 강의영상, 강의자료
- Chapter Intro - 강의영상, 강의자료모음, 코드
- The concepts of a feature - 강의영상, 강의자료
- Data types - 강의영상, 강의자료
- Loading data with pandas - 강의영상, 강의자료
- Representing a model with numpy - 강의영상, 강의자료
- 주차강의자료, 강의코드
- Map & Reduce - 강의영상, 강의자료
- Asterisk - 강의영상, 강의자료
- Lab: Simple Linear algebra concepts- 강의영상, 강의자료
- Lab: Simple Linear algebra codes - 강의영상, 강의자료
- Assignment: Linear algebra with pythonic code - 숙제설명, 숙제파일, 강의영상
- Chapter Intro - 강의영상, 강의자료, 강의코드, 코드다운로드
- Numpy overview - 강의영상
- ndarray - 강의영상
- Handling shape - 강의영상
- Indexing & Slicing - 강의영상
- Creation functions - 강의영상
- Opertaion functions - 강의영상
- Array operations - 강의영상
- Comparisons - 강의영상
- Boolean & fancy Index - 강의영상
- Numpy data i/o - 강의영상
- Chapter Intro - 강의영상, 강의자료, 강의코드, 코드다운로드
- Pandas overview - 강의영상
- Series - 강의영상
- DataFrame - 강의영상
- Selection & Drop - 강의영상
- Dataframe operations - 강의영상
- lambda, map apply - 강의영상
- Pandas builit-in functions - 강의영상
- Lab Assignment: Build a matrix - PDF, 강의자료
- Chapter Intro - 강의자료, 강의코드, 코드다운로드
- Groupby I - 강의영상
- Groupby II - 강의영상
- Casestudy - 강의영상
- Pivot table & Crosstab - 강의영상
- Merge & Concat - 강의영상
- Database connection & Persistance - 강의영상
- Chapter overview - 강의자료, 강의코드, 코드다운로드
- Matplotlib overview - 강의영상, 강의자료
- Basic functions & operations - 강의영상
- Graph - 강의영상
- Matplotlib with pandas - 강의영상
- Data Cleaning Problem Overview - 강의영상, 강의자료
- Missing Values - 강의영상
- Categorical Data Handling - 강의영상
- Feature Scaling - 강의영상
- Casestudy - KagglepProblems - 강의영상, 강의자료
- Chapter overview - 강의자료, 강의코드, 코드다운로드
- Linear regression overview - 강의영상
- Cost functions - 강의영상
- Normal equation - 강의영상
- Lab Assignment: Normal equation - PDF, 강의자료
- Gradient descent approach - 강의영상
- Linear regression wtih gradient descent - 강의영상
- Linear regression implementation wtih Numpy - [강의영상]https://vimeo.com/254408998/2913ccc5f3
- Multivariate linear regression models - 강의영상
- Performance measure for a regression model - 강의영상
- Linear regression implementation wtih scikit-learn - 강의영상
- Lab Assignment: Gradient descent - PDF, 강의자료
- Chapter overview - 강의자료, 강의코드, 코드다운로드
- Stochastic gradient descent - 강의영상
- SGD implementation issues - 강의영상
- Overfitting and regularization overview - 강의영상
- Regularization - L1, L2 - 강의영상
- sklearn Linear Model family - 강의영상
- Polynomial regression - 강의영상
- Sampling method - 강의영상
- Kaggle project : Bike demand - 강의영상
- Chapter overview - 강의영상, 강의자료, 강의코드
- Logistic regression overview - 강의영상
- Sigmoid function - 강의영상
- Cost function - 강의영상
- Logistic regression implementation with numpy - 강의영상
- Maximum Likelyhood Estimation - 강의영상
- Logistic regression with scikit-learn - 강의영상
- Confusion matrix - 강의영상
- Performance metrics for classification - 강의영상
- ROC curve & AUC - 강의영상
- Chapter overview - 강의자료, 강의코드
- Multiclass Classification overview - 강의영상
- Softmax function #1 - 강의영상
- Softmax function #2 - 강의영상
- Softmax regression with numpy - 강의영상
- Performance metrics for classification - 강의영상
- Multiclass classification with scikit-learn - 강의영상
- Chapter overview - 강의영상, 강의자료, 강의코드
- Probability overview - 강의영상
- Bayes' theorem - 강의영상
- Single variable bayes classifier - 강의영상
- Navie bayesian Classifier - 강의영상
- NB Classifier Implementation - 강의영상
- Multinomial Naive Bayes - 강의영상
- Gaussian Naive Bayes - 강의영상
- NB classifier with sklearn - 강의영상
- 20news group classifaication - 강의영상#1, #2
- Text hadnling Lab: News categorization -
강의영상#1,#2, 강의자료
- Chapter overview - 강의영상, 강의자료, 강의코드
- Decision tree overview - 강의영상
- The concept of entropy - 강의영상
- The algorithme of growing decision tree - 강의영상
- ID3 & Information gain - 강의영상
- CART & Gini Index - 강의영상
- Tree pruning - 강의영상
- Decision Tree with sklearn - 강의영상
- Handling a continuous attribute - 강의영상
- Decision Tree for Regression - 강의영상
- Chapter intro - 강의영상, 강의자료, 강의코드
- Ensemble model overview - 강의영상
- Voting classifier - 강의영상
- Bagging - 강의영상
- Random Forest - 강의영상
- AdaBoost - 강의영상
- Gradient boosting - 강의영상#1, 영상#2
- XGBoost & LightGBM - 강의영상
- Installation guide on Windows - 강의영상, 강의자료
- Stacking - 강의영상
- Overview - 강의영상, 강의자료, 강의코드
- Feature Engineering #1: Generation - 강의영상
- Feature Engineering #2: Statics - 강의영상
- Feature Engineering #3: Model based - 강의영상
- Feature Engineering #4: Iterative - 강의영상
- Imbalanced dataset #1 - 강의영상
- Imbalanced dataset #2 - 강의영상
- Hyperparmeter searching with Distributed Machines - 강의영상
- AutoML - 강의영상
- Machine Learning (Couera) by Andrew Ng
- 모두를 위한 딥러닝 by Sung Kim
- C++로 배우는 딥러닝 by Sung Kim
- Machine Learning From Scratch[https://github.com/eriklindernoren/ML-From-Scratch]
- Reading materials
- 밑바닥부터 시작하는 데이터 과학(조엘 그루스, 2016)
- 파이썬 머신러닝(세바스티안 라슈카, 2016)
- Hands-On Machine Learning with Scikit-Learn and TensorFlow(Aurélien Géron, 2017, PDF)
- Data Mining: Concepts and Techniques(Jiawei Han, Micheline Kamber and Jian Pei , 2011, PDF)
- Supplementary textbooks
- 파이썬 라이브러리를 활용한 데이터 분석(웨스 맥키니, 2013)
- 머신러닝 인 액션(피터 해링턴, 2013)
- 데이터 과학 입문(레이철 슈트 | 캐시 오닐, 2014)
- 머신러닝 인 파이썬(마이클 보울즈, 2015)
- 머신러닝 이론 입문(나카이 에츠지, 2016)
- 입문 수준의 통계학
- 세상에서 가장 쉬운 통계학(고지마 히로유키, 2009)
- 세상에서 가장 쉬운 베이즈통계학입문(고지마 히로유키, 2017)
- 확률과통계(한양대학교 이상화 교수, 2014)
- Reading Materials: Data Science from Scratch - Ch.5, Ch.6, Ch.7
- 고교 이과 수준의 선형대수학 (Matrix와 Vector의 기본개념은 Review 필요)
- Essence of linear algebra(3Blue1Brown, 2017)
- Linear Algebra(Khan Academy)
- 선형대수학(한양대 이상화 교수, 2013) - Advance Course
- Reading Materials - Data Science from Scratch - Ch.4
- 고교 이과 수준의 미적분학 (개념에 대한 이해 필요)
- Essence of calculus(3Blue1Brown, 2017)
- 파이썬 기초
- 데이터 과학을 위한 파이썬 입문 (TEAMLAB, 2017)
- Git
- Pro Git (스캇 샤콘 | 벤 스트라웁, 2016)
- Git & Github (TEAMLAB, 2016)
- Git 강의 (생활코딩, 2014)
머신러닝, 머신러닝 강좌, 머신러닝 입문, Machine Leaning 입문, Machione Learning 강좌, 머신러닝 강의, 머신러닝 MOOC, Linear Regression, 선형회귀, 앙상블, 딥러닝, 뉴럴넷, 파이썬, python, 파이썬 입문, 파이썬 강좌, Python 입문, 파이썬 강좌, 파이썬 강의, Python 강의, Python MOOC, 데이터마이닝, Data mining, 가천대 최성철, 최성철 교수, 프로그래밍 입문, 프로그래밍 강좌, 코딩, 코딩 입문, 데이터 과학, 데이터 사이언스, Data science