Fast campus School

데이터 엔지니어링 Extension SCHOOL

Linux와 Hadoop부터 Spark까지 심도있게 학습하고
데이터 플로우의 처음부터 끝까지 직접 핸들링하는 데이터 엔지니어로 성장하세요!

  • Placeholder

    실무 핵심 역량만 담은
    정확한 커리큘럼

  • Placeholder

    프로젝트로 완성하는
    실습형 강의

  • Placeholder

    Spark 기초부터 심화까지
    Spark의 A to Z

  • Placeholder

    현업 전문가가 가르치는
    Up-to-date 기술

선착순으로 조기마감될 수 있으니
고민 전에 먼저 상담부터 받아보세요!

문의 박지은 매니저 02-518-6529

데이터 엔지니어가 되기 위한
가장 정확한 로드맵을 제시합니다.


    Extension SCHOOL

    패스트캠퍼스 Extension SCHOOL은 새로운 분야를 체계적이고 심도있게 배워 자신의 커리어 영역을 개발하고 확장하기 원하는 분들을 위해 태어났습니다. 빠르게 변화하는 디지털 시대에 맞춰 대학원에 준하는 여러 디지털 영역의 실질적인 직무 역량을 배양할 수 있도록 기초부터 심화까지 레벨별로 구성된 정교한 커리큘럼과 로드맵을 제시합니다.


  • 단계별로 차근차근

    차근차근 진학하는 단계별 구성을 통해 해당 분야의 기초 지식부터 심화 이론, 최신 기술과 트렌드까지 커리어 확장을 위한 전반적인 지식을 학습합니다.


  • 회사 다니면서

    익스텐션 스쿨은 평일 저녁과 주말에 진행하는 과정으로 일을 하면서도 장기적으로 다음 커리어에 대한 준비를 해나가실 수 있습니다.


  • Hard Training System

    출결, 과제, Test, 프로젝트를 디테일하게 평가하여 일정 점수 미만 시 다음 학기 수강이 불가하도록 관리하여 레벨별 수업 수준을 엄격하게 유지합니다.

Why 데이터 엔지니어링


  • 모든 산업에서
    데이터 전문가를 찾지만
    빅데이터 엔지니어 전문 인력은 너무나 부족해
    기업이 서로 모셔가고 있는 실정입니다.

  • - Hadoop, Hive, Spark 등을 통한 large-scale data processing 경험
    - AWS 클라우드 인프라 활용능력
    - sql, nosql 오픈소스 사용
    - 리눅스 환경에서의 개발 경험
    - Java, Python, Scala 언어 중 최소 1개 활용능력
    - 머신러닝 기법에 대한 이해와 적용

  • 채용공고에서 확인할 수 있는 기업들이 데이터 엔지니어에게 요구하는 공통 역량은 꽤나 명확한데
    현직자의 스킬업을 위한 단기과정 혹은 불필요한 내용까지 흐름없이 몰아넣은 얕고 넓은 강의만 있을 뿐,

    데이터의 생성, 저장, 추출 및 가공이라는 일련의 흐름을 이해하고 구조화하는 것은 물론
    Hadoop 설치부터 클러스터 구성, 에코시스템 설계, Spark를 이용한 전처리와 분석을 직접 경험해보는
    '데이터 엔지니어링의 핵심'을 가르치는 명확한 기본 교육 과정은 지금까지 없었기 때문입니다.

  • 데이터 엔지니어링 Extension SCHOOL은

    ✔ 데이터 엔지니어링을 위해 꼭 선행되어야 할 데이터베이스 기반 지식은 물론
    ✔ Hadoop 프레임워크와 함께 최근 각광받고 있는 Spark를 매우 심도있게 다루는 국내 유일 과정입니다.

  • Placeholder

    Spark는 최근에 나왔고 많은 인기를 얻고 있는 프레임워크답게 사용법이 보다 쉽고 간단합니다. 그러면서도 강력한 기능을 가지고 있다는 점이 매력적이죠. 또한 SQL, Streaming, Machine Learning 등으로 손쉽게 확장이 가능하기 때문에 데이터 분석을 처음 접하는 엔지니어 입장에서는 정말 좋은 프레임워크입니다. 데이터 엔지니어링 익스텐션 스쿨은 Spark 프레임워크를 업무에 바로 사용할 수 있게 만들어주는 이론 교육 및 실습 과제들로 구성되어 있습니다.
    인터뷰 자세히보기 >>

  • Placeholder

    데이터 엔지니어에 대해 정확히 파악하고 필요한 교육을 제공하는 기관이 미미합니다. 국비지원과정의 경우 데이터 엔지니어링을 위한 핵심적인 스킬보다는 프로그래밍 언어 자체, 웹 개발 또는 데이터 엔지니어링의 핵심에서는 벗어난 내용을 다뤄 시간만 길어지고, 중요한 부분에 대해서는 깊이있게 다루지 못하고 있습니다. 데이터 엔지니어링 익스텐션 스쿨은 국내 다양한 기업에서 활발한 활동 중인 데이터 엔지니어분들을 만나뵙고 많은 대화를 통해 꼭 필요한 과정만을 담아 현재 커리큘럼을 구성하였습니다.
    인터뷰 자세히보기 >>

  • Placeholder

    본 과정을 원활하게 수강하시기 위해서는 아래 조건 중 최소 2가지를 충족하셔야 합니다.

    - 객체 지향 언어가 어떤 것인지 설명할 수 있다.
    - Java 또는 Python으로 자유롭게 객체를 생성하고, 함수를 짜고, 클래스를 구현할 수 있다.
    - 절차 지향 코드를 객체 지향 코드로 자유롭게 구현하고 효율화할 수 있다.
    - 객체 지향 언어를 이용해 알고리즘 기초 수준의 문제는 섭렵했다.

이런 분에게 추천합니다.

  • 데이터를 처리하는 모든 과정을 이해하여 본격 데이터 분야로 옮겨가고자 하는
    백엔드 개발자/서버 개발자

    현재 데이터에 관련된 업무를 직접하고 있진 않지만 평소에 데이터를 처리하는 과정에 관심을 두고 있는 분, 급하게 데이터 관련 일을 담당하게 되어 주먹구구식으로 일하면서 데이터 플로우에 대한 깊이 있는 이해가 간절했던 분, 현재 나의 프로그래밍 역량을 기반으로 빅데이터 파이프라인을 구축/구현하기 위한 역량을 쌓아 데이터 엔지니어로 직무 전환을 원하는 '개발자'에게 추천합니다.

  • 핫하다는 머신러닝 딥러닝 공부해봤지만 분석 그 전에,
    데이터 생성부터 시작하여 데이터의 모든 처리과정을 차근차근 알고 싶은 분

    분석 업무를 담당하고 있거나 데이터 관련 직무에 대한 관심으로 머신러닝 딥러닝을 공부하고 분석 프로젝트도 해보았지만 지금 내 손에 떨어진 이 데이터가 어떻게 처리되고 어떻게 분류된 데이터인지에 대한 의구심이 남는 분, 데이터 플로우, 인프라 구축에 대한 이해가 필요한 분에게 추천합니다.

  • 카카오, 네이버, 쿠팡, 티켓몬스터와 같은
    데이터의 흐름이 굵직한 기업의 데이터 전문가로 취업하고 싶은 대학생/취준생

    컴퓨터공학, 산업공학을 전공하고 개발을 공부했으니 당연하게 개발자의 길로 나가야한다고 생각하고 계시나요? 많은 회사들이 데이터 처리의 중요성을 인식하고 프로그래머를 찾듯 데이터 엔지니어를 상시 채용하고 있습니다. 데이터 관련 직무가 뜨고 있다고는 하는데 어떤 것부터 어떻게 공부해야 할 지 모르겠는 분에게 추천합니다.

강의 특징

  • 현업 최고 데이터 전문가가
    직접 강의합니다.

    데이터를 다루는 현업자들은 많지만 '빅데이터'라고 부를만한 대용량 데이터를 실제 현업에서 매일 만나고 그 프로세스를 리드하는 전문가는 쉽게 만나기 어렵습니다.
    본 과정은 20M 다운로드를 이끈 글로벌 커플앱서비스 Between의 데이터팀 리드를 맡고 계신 김상우 강사님은 물론 Java부터 Hadoop, 머신러닝까지 전부 다루는 풀스텍 개발자 박성백 강사님, 국내 최고의 Scala 전문가인 김흥진 강사님을 모시고, 강사님이 직접 피드백하는 실습 중심으로 구성된 과정입니다.

  • 로드맵을 제시하는
    체계적인 과정입니다.

    빅데이터의 인기에 힘입어 우후죽순 생기고 있는 국비지원과정이나 대학, 대학원의 강의들은 교육과정과 관련실습이 체계적으로 관리되지 않고 일방적으로 지식을 전달하기만 하는 경우가 많습니다.
    데이터 엔지니어링 익스텐션 스쿨에서는 데이터의 생성, 저장, 추출 및 가공이라는 데이터 플로우를 직접 핸들링할 수 있는 모든 핵심 역량을 핵심별로 학습할 수 있도록 정교하게 짜여진 교육과정을 수강생들에게 제공합니다.

  • 기초부터 심화까지
    꼭 필요한 것만 가르칩니다.

    데이터 엔지니어링 전체 프로세스를 이해하기 위해 필수적으로 알아야 할 Linux와 Infra를 먼저 학습하고 Hadoop과 SQL, NoSQL 관련 컴포넌트까지 다룹니다. 그리고 최근 가장 떠오르는 프레임워크인 Spark를 기초부터 심화까지 깊이있게 학습합니다. 모든 수업은 이론 학습 후 바로 진행되는 실습을 통해 완전한 내 기술로 만들 수 있습니다.
    국내 다양한 기업에서 활발한 활동 중인 데이터 엔지니어분들과의 인터뷰를 통해 꼭 필요하고 중요한 내용들만을 커리큘럼에 담았습니다.

코스매니저가 직접
궁금증을 해결해드립니다.

  • 한마디로 `데이터의 흐름을 관장하는 사람`이라고 표현할 수 있을 것 같습니다. 데이터가 넘쳐나는 시대에 다양한 데이터 소스로부터 의미있는 데이터를 추출, 변환하고 적재하는 시스템을 설계하고 구현하여 운영하는 사람이 바로 데이터 엔지니어입니다. 최근에는 이렇게 데이터 플로우를 핸들링하는 것에 더해 분석까지도 할 수 있는 데이터 엔지니어를 원하고 있습니다.

  • 현 시장에서 원하는 데이터 엔지니어는 대체로 Java 또는 Python을 능숙하게 다루는 것을 기본으로 RDBMS와 NoSQL, Hadoop 및 Spark를 이해하고 이를 실제 다뤄본 경험을 가지고 있는 사람입니다. 데이터 엔지니어링 익스텐션 스쿨에서는 이 모든 핵심적인 역량들을 체계적인 로드로 학습하며 수료 후, 데이터의 플로우를 관장하는 데이터 엔지니어로 한 발 내딛을 수 있습니다.

  • 빅데이터 분산 처리 시스템인 Hadoop과 Spark를 잘 다루는 것도 물론 중요하지만, 이들은 결국 Linux와 infra를 기반으로 그 위에서 움직이는 것이기에 데이터 엔지니어링의 프로세스를 이해하기 위해서는 Linux, Infra에 대한 기반 지식이 필수적입니다. 기초를 튼튼히 해야 그 위에 얹을 지식들도 단단하게 세워질 수 있습니다.

  • 기본적으로 Java, Python 또는 C, C++등의 프로그래밍 언어 하나에 능숙하신 분이면 본 과정을 원활하게 수강하실 수 있습니다. 다만 현업에서 빅데이터 플랫폼을 다룰 때나 성능 개선을 위해 Hadoop과 Spark의 기반 언어인 Java를 이용하기 때문에 가급적이면 Java의 학습이 선행된 분에게 더 적합한 과정일 수 있습니다. 그 일환으로 수강신청 후 부여될 사전과제는 Java에 대한 기반 지식을 쌓는 것이며, 미션을 통과하시면 본 과정을 수강하실 수 있습니다.

  • 데이터 엔지니어는 데이터의 흐름을 이해하고 처리하는 사람입니다. 그렇기에 데이터 엔지니어링 작업을 거친 후, 깔끔하게 다듬어진 데이터들을 분석할 수 있는 능력까지 있다면 금상첨화겠지요! 따라서 본 과정은 현 시장에서 핫한 키워드로 떠오른 머신러닝에 대한 학습도 함께하여 분석력까지 더한 데이터 엔지니어로 성장할 수 있도록 커리큘럼이 구성되어있습니다. 데이터 엔지니어링 익스텐션 스쿨을 통해 경쟁력 있는 데이터 엔지니어로 거듭나세요.

커리큘럼

  • 1학기
    학습목표
    데이터 엔지니어 기반 지식 함양을 위한 Linux, Infra(Network, DB), SQL & NoSQL 부터 데이터 아키텍처 구현을 위한 Hadoop과 각종 컴포넌트를 학습하고 실습해봅니다.
    Intro
    데이터 엔지니어링이란?
    - 빅데이터 개념 및 발전 추세
    - 빅데이터 처리 기술의 종류와 특징
    - 빅데이터 프로세스 : 데이터 수집, 저장, 분석, 응용
    Linux & Infra (1)
    : Network
    - 리눅스의 기본 개념과 설치
    - 리눅스 관리자의 역할 및 사용자 관리
    - 웹 서버 설치와 운영
    - 데이터베이스 서버 설치와 운영
    - 실무형 환경 구성 실습
    - 네트워크 구성 이해 및 환경 구성 실습
    GIT - 버전 관리 개념 이해
    - Git 기초 개념 이해 및 설치
    - Git 저장소 만들기
    - 분산 환경에서의 Git, Git 명령
    - github.com 활용
    Infra (2)
    : Database & SQL
    - 데이터베이스 개념 및 종류별 특징 이해
    - 데이터베이스 설치 및 설정과 모델링
    - SQL 핵심 이해 및 DDL, DCL, DML 실습
    - SQL 고급 기법
    NoSQL MongoDB
    - 몽고디비 핵심 개념 및 설치
    - 스키마 설계 원리
    - document 생성, 갱신, 삭제, 쿼리

    Redis
    - 레디스 이해 및 설치
    - 레디스 데이터 타입
    - 레디스 운영과 관리

    Cassandra
    - 카산드라 이해 및 설치
    - 카산드라 데이터 모델
    - 카산드라 아키텍처
    Hadoop_Cluster
    /HDFS
    /MapReduce
    - 하둡 클러스터 환경 구성 이해
    - 하둡 클러스터 환경 실습
    - NameNode 관리와 DataNode 구성
    - 아파치 하둡과 하둡 에코 시스템 이해
    - 하둡 분산 파일 시스템 이해
    - 하둡 설치
    - 맵리듀스 프로그래밍 이해
    - 하둡 개발 환경 구성
    Hive - 하이브 개요
    - 하이브 환경 설정
    - 하이브의 데이터 타입 이해
    - 하이브 데이터 선택과 범위
    - HiveQL 다루기
    Cloud - AWS - Intro & EC2
    - S3, RDS + NoSQL
    - ELB & EMR
    Mid-Project
  • 2학기
    학습목표
    최근 높은 효율성으로 각광받고 있는 프레임워크 Spark를 업무에 바로 사용할 수 있도록 심화레벨까지 실습을 통해 학습하며 전처리와 분석을 직접 경험합니다. 이에 더해 Machine Learning(with Python & PySpark)과 Deep Learning을 이해하고 적용해보는 과정까지 거친 후, 지금까지 학습한 모든 내용을 활용하여 Project 실습을 진행합니다.
    Scala - Introduction
    - Expressions
    - Types
    - Values
    - Objects
    - Classes
    - Traits
    - Combining Computations
    - Collection Library
    -Type Classes
    Spark & Zeppelin - Spark이 탄생하기까지의 빅데이터 히스토리
    - Spark이 탄생하기까지의 히스토리
    - 하둡 및 빅데이터 생태계
    - Apache Spark 개요
    - Spark Demo
    - Spark core concept
    -(실습) Spark 핵심 개념
    - Zeppelin 소개
    - (실습) Zeppelin 활용
    Spark_plus Spark SQL
    - Spark SQL 개요
    - Dataframe API
    - (실습) Spark SQL을 이용한 데이터 분석

    Spark Streaming
    - Spark Streaming 이론
    - (실습) 트위터 실시간 분석

    Spark Cluster
    - 실습환경 준비 (AWS)
    - (실습) Spark 클러스터 구축
    - Spark Master, Slave Script
    - Spark Cluster UI
    - AWS Script
    Visualization - 여러가지 시각화 방법
    - BI Tool (Dashboard)
    - D3
    - Python, R
    Machine Learning

    with
    Python & PySpark
    - Pyspark 소개 및 실습
    - Pandas Basics
    - Numpy Arrays

    - ML Intro
    - Demo with Spark MLLib
    - Supervised & Unsupervised Learning
    - Linear Regression
    - Multi Var Linear Regression
    - Logistic Regression
    - Regularization
    - Neural Network
    - Decision Tree

    - (실습) 타이타닉 생존자 예측 실습
    - Spark MLlib의 Random Forest 모델 활용
    Deep Learning - Deep Neural Network 개요
    - Use case
    - Back Propagation
    - RNN, CNN, Advanced Topics

    - 프로젝트 실습(1)
    - 프로젝트 실습(2)
    *상세 실습 내용은 추후 업데이트 예정
    Final-Project

현업 실무자가 말하는
데이터 엔지니어링 Extension SCHOOL


  • 데이터 분석에 앞선 일련의 과정을
    절반으로 줄여주는 강의네요.

    이** /
    데이터 마이닝 개발자, 데이터 솔루션 개발 관련 기업

    현실에서는 데이터를 다루는데 있어서 가장 중요한 것이 알고리즘이 아니더군요. 수 기가부터 테라 단위의 데이터를 적절히 정제해 얼마나 깨끗한 데이터를 만들까. 어떤 데이터가 필요할까 등 데이터 수집부터 관리까지에 80% 이상의 시간을 할애합니다.이 과정은 이 80%의 시간을 40%로 줄여줄 수 있을 만큼 파워풀한 툴과 데이터 분야의 트렌드를 잘 담아내고 있네요.


  • 기업에서 먼저 찾는
    데이터 엔지니어로 성장할 수 있는 과정이네요.

    이**/
    데이터 분석가, 여행 관련 플랫폼 서비스 스타트업/데이터 사이언스 스쿨 수료

    현업에서 데이터 분석도 중요하지만, 작은 규모의 회사에서는 분석가가 엔지니어링 및 기타 데이터 관련 제반 업무를 진행하기도 합니다. Spark 뿐만 아니라 데이터 엔지니어링에서 널리 쓰이는 것들을 집중적으로 배울 수 있어서 현업에서 먼저 찾는 데이터 엔지니어로 성장할 수 있을 것 같습니다.


  • 진짜 데이터 엔지니어가
    되고싶은 사람에게 추천합니다.

    강** /
    백엔드 개발자, O2O 서비스 스타트업 /데이터 사이언스 스쿨 수료생

    대부분의 강의들은 데이터의 '분석'부분만을 중시하고 '데이터를 어떤 방법으로 이렇게 쌓아놓게 되었는지'에 대해서는 다루지 않았습니다. 단순히 데이터 엔지니어링 도구를 배우는 강의를 넘어서 여러 종류의 데이터를 필요한 상황에 따라서 알맞게 구축하고 팀원 모두가 쉽게 활용할 수 있는 데이터 환경을 만드는 진짜 데이터 엔지니어가 되고 싶다면 본 강의를 기대해도 좋을 것 같습니다.


  • 머신러닝까지 다루는
    커리큘럼이 좋네요.

    박** /
    챗봇 개발, 인공지능 관련 서비스 스타트업 /컴퓨터공학 석사 졸

    데이터 엔지니어링 뿐만 아니라 머신러닝까지 학습하는 커리큘럼이 인상적입니다. 다양한 스택의 기술과 함께 머신러닝까지 한 자리에서 배울 수 있다는 점이 매력적이네요. 특히, 자연어 처리 부분은 많은 사람들이 상당히 관심있어하는 분야이기에 이 과정에서 화룡정점이 될 것으로 보이네요.

강사 소개

  • 현업에서 직접 빅데이터를 다루는
    최고 전문가가 강의합니다.

  • 2000만 다운로드를 기록한 커플앱서비스 비트윈에서 데이터팀 리드를 맡고있는 김상우 강사님이 올해 dublin에서 진행되는 SPARK SUMMIT EUROPE 2017에서 POWERING A STARTUP WITH APACHE SPARK 세션을 담당합니다.
  • Placeholder 김상우 강사님 세션 소개 자세히보기 ▷
  • Placeholder Spark 파트

    김상우 / 비트윈(VCNC)


    커플앱서비스 '비트윈'을 만드는 VCNC에서 제품 개발과 데이터 분석을 해오고 있으며 수많은 비트윈 사용자들에게 그리고 더 나아가 사회에 도움이 되는 일을 하기 위해 계속해서 고민하고 있습니다. 대용량 데이터 분석과 머신러닝 분야에 관심이 많으며 한국 스파크 사용자 모임 운영진으로, 또 Apache Zeppelin 프로젝트의 Committer 겸 PMC로도 활동하고 있습니다.

  • Placeholder Linux ~ AWS 파트

    박성백


    풀스택 개발자 및 강사로 처음에는 자바 개발 및 강의로 시작했지만 그 영역을 넓혀서 다양한 프로그래밍 언어들과 빅데이터 하둡 에코 시스템, 스파크 그리고, 머신 러닝 까지 다루는 개발 언어 욕심이 많은 개발자이자 강사입니다.

  • Placeholder Scala

    김흥진 (성큼이)


    Scala의 간결하고 일관성있는 문법과 타입 안정성에 매료되어 2013년부터 본격적으로 Scala를 익히기 시작해 국내 대표 Scala 사용자 커뮤니티인 라스칼라 코딩단에서 2014년 초부터 계속 스터디를 운영하고 있습니다. 그루터, 엔쵸비, 우아한형제들, 툭탁, 아이로보 등의 스타트업들을 거쳐, 현재는 AllStock Exchange라는 곳에서 블록체인 기술을 기반으로 미술품, 부동산 등을 증권화해 안전하고 투명하게 거래하는 서비스를 개발중입니다.

학기별 구성

  • 학기 1학기 2학기
    기간 10주 과정
    2018.01.09 (화) ~ 2018.03.24 (토)
    *설연휴 휴강
    13주 과정
    2018.04.24 (화) ~ 07.28 (토)
    일정 매주 화요일 오후 7:30 ~ 10:30
    매주 토요일 오후 1 or 2 ~ 6시
    등록금 210만 원 270만 원
    총 480만 원
    비고 - 2학기 수강을 위해서는 1학기를 수강하셔야 합니다.
    - 전체 학기 등록 수강생을 우선 선발합니다.