ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 빅데이터교육을 학원에서 받는다면 중요한 점은?
    카테고리 없음 2016. 6. 9. 11:06

     

    요즘에 빅데이터를 배울려고 빅데이터교육을 많이 문의를 주시고 있습니다.

    그리고 왜 빅데이터를 배울려고 하냐고 물어보면 대부분이 제대로 답변을 못하시더군요.

    이것은 빅데이터라는 것이 하나의 전체적인 분야만 나오지 그 안에 세부적인 것까지는 알아보지를

    않고 문의를 주고 있다는 것입니다.

     

    빅데이터는 이제 하나의 분야로 나누어질 정도로 이제 광범위하게 나오고 있습니다.

    현재는 빅데이터분석이랑 빅데이터개발쪽으로 양분이 되어가고 있고 여기에 데이터과학자라든지

    새로운 직업들도 등장하고 있습니다.

     

    그렇기때문에 빅데이터학원에서 교육을 받는다고 한다면 중요한 점이 무엇이 있는지를 한번

    정리하도록 하겠습니다.

     

     

    우리가 흔히 생각하면 빅데이터만 배우면 취업이 가능하다고 생각할 수 있습니다.

    하지만 예전과는 다르게 이제 개발과 분석으로 양분화가 진행이 되어서 이제 어느 한쪽으로

    확실하게 배우시는 것이 중요하십니다.

     

    빅데이터를 배우시는 목적이 중요한 이유는 빅데이터를 활용하려는 목적이 무엇이냐에

    따라 다르다는 것입니다.

    현재 빅데이터는 크게 개발과 분석으로 나누어진 이유는 제가 정리한 이유를 보시면

     

    - 개발 : 빅데이터를 활용해서 새로운 시스템을 개발

    - 분석 : 빅데이터를 분석해서 고객이 필요로 하는 요구사항을 반영해서 서비스를 제공

     

    개발쪽으로 대표적인 예로 든다면 '페이스북의 당신이 알 수도 있는 사람', 그리고 한때 논란거리가

    되기도 했었던 '아마존 추천 상품'도 바로 여기에 해당이 되고 각종 네트워크 모니터링 시스템이나

    아니면 금융업계에서 사용이 되고 있는 리스크 모델링도 여기에 포함이 되고 있습니다.

     

    분석으로는 서울시에서 운영하고 있는 심야버스가 대표적인데 심야버스의 노선을 결정할때에

    빅데이터를 분석해서 시민이 원하는 노선을 결정할때에 사용이 되었습니다.

    그리고 미국에서는 각종 심리, 성향분석에 많이 사용이 되고 있는데 그중의 하나가 미대선후보를

    확인할때에 많이 사용이 되었습니다.

     

    이런 경향이 있기때문에 빅데이터를 배우는 목적이 무엇이냐가 얼마나 중요한지를 알 수 있습니다.

    개발과 분석쪽에서 배워야 되는 내용이 조금씩 차이가 있습니다.

     

     

    빅데이터를 어떻게 활용을 하느냐에 따라 다르다고 볼 수 있습니다.

    기업에서도 개발이냐 아니면 분석이냐에 따라 활용이 되는 기술적인 요소가 전부 다릅니다.

    대체적으로 개발에서는 하둡이 많이 사용이 되고 분석에서는 R툴이 많이 사용이 되고 있습니다.

     

    R툴은 통계학분야에서 가장 널리 사용이 되고 있습니다.

    R툴이 많이 사용되는 이유에는 눈에 보기좋게 만들어놓는 일종의 그래픽적인 요소가 첨부가 들어가

    있는 통계 및 그래프 프로그래밍언어입니다.

     

    그리고 R툴이 많이 사용이 되는 결정적인 이유에는 오픈소스 언어로 수많은 통계 관련 패키지가

    개발이 되어있어서 이 패키지를 설치하면 무수한 기능 확장이 가능하고 또한 통계전문 언어중에서

    가장 메이저하기때문에 내가 사용하고 싶은 모든 통계기법이 있을 가능성도 있습니다.

     

    하둡은 대량의 자료를 처리할 수 있도록 분산처리시스템을 제공을 하고 있습니다.

    그리고 맵리듀스는 효율적인 데이터 처리를 위해 여러 대의 컴퓨터를 활용하는

    분산 데이터 처리 기술입니다.


    맵리듀스는 이름에서 짐작할 수 있듯이 맵(Map)과 리듀스(Reduce)의 두 과정으로 구성되어 있습니다.

    먼저 맵 단계에서는 대규모 데이터를 여러 대의 컴퓨터에 분산해
    병렬적으로 처리해 새로운 데이터(중간 결과)를 만들어냅니다. 리듀스 단계에서는 이렇게

    생성된 중간 결과물을 결합해 최종적으로 원하는 결과를 생산합니다. 리듀스 과정 역시
    여러 대의 컴퓨터를 동시에 활용하는 분산처리 방식을 적용합니다

     

    그래서 빅데이터 개발에서 단시간안에 처리를 해야 되는 기업에서는 하둡이 많이 사용이 되고

    정책반영등과 같은 분석쪽에서는 r툴이 많이 사용이 되고 있습니다.

     

     

    그렇기때문에 중요한 것은 이제 앞으로 빅데이터를 배울 때에 개발인지 아니면 분석인지를

    결정을 하시는 것이 좋으시고 단순히 시스템을 다루어보는 것이 목적일지라도 무엇을

    사용이 되는지를 먼저 알아보셔야 합니다.

     

    그런 이유로 인해서 빅데이터교육은 해당 학원등에 문의해보셔서 맞는 과정인지를

    먼저 파악하시는 것이 중요합니다.

    그렇기때문에 빅데이터교육에 대해서 더 궁금하신 점이 있다면 밑에 있는 바로가기를

    클릭해주세요.

     

    빅데이터교육 과정 바로가기

     

    댓글

Designed by Tistory.